Голова ШІ-підрозділу Google DeepMind Деміс Гассабіс на конференції для розробників Google I/O розповів про ранню версію того, що в компанії називають універсальним ШІ-помічником. Це – система під кодовою назвою Project Astra, яка являє собою мультимодальний ШІ-помічник, який може «бачити» навколишній простір, розпізнавати обʼєкти і допомагати з різними завданнями, пише The Verge.
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
Ключові факти
- Project Astra набагато ближчий за попередні аналогічні продукти до того, як має працювати справжній ШІ-помічник у режимі реального часу, розповів Гассабіс.
- Він пояснив, що алгоритм побудований на базі великої мовної моделі Gemini 1.5 Pro, наразі найпотужнішої нейромережі Google. Однак для підвищення якості роботи ШІ-помічника Google довелося провести оптимізацію, щоб підвищити швидкість обробки запитів і знизити час затримки під час формування відповідей.
- За словами Гассабіса, останні шість місяців розробники працювали саме над тим, щоб прискорити роботу алгоритму, зокрема за рахунок оптимізації всієї повʼязаної з ним інфраструктури.
- В компанії очікують, що в майбутньому Project Astra зʼявиться не тільки в смартфонах, а й у смарт-окулярах, оснащених камерою. Терміни запуску ШІ-помічника в маси в Google не називають.
- Google опублікувала відео, в якому демонструються деякі можливості ранньої версії Project Astra.
Контекст
Після успіху OpenAI наприкінці 2022 року з діалоговим чат-ботом ChatGPT, Google прагне показати, що вона також є передовою силою в галузі технологій генеративного штучного інтелекту, які можуть створювати новий текст, зображення чи навіть відео на основі підказок користувача. Все більше компаній експериментують із цією технологією, яку можна використовувати для автоматизації таких завдань, як кодування, узагальнення звітів або створення маркетингових кампаній.
У грудні Google випустила свою модель штучного інтелекту Gemini у трьох версіях, що дозволяє налаштовувати її під поставлене завдання та запускати на будь-яких пристроях – від мобільних пристроїв до великомасштабних центрів обробки даних.
Gemini – це відповідь Google компаніям Microsoft Corp. та OpenAI, які, на думку деяких експертів, швидше скористалися перевагами нинішнього буму штучного інтелекту, зокрема серед хмарних клієнтів та розробників. Тепер Google прагне заманити цих користувачів у свою екосистему за допомогою більш потужних інструментів.
На початку травня Google зробив доступними ключові функції Gemini для більшої кількості мов і країн. Завдяки оновленню можна буде використовувати можливості Gemini на мобільних пристроях для написання текстів, планування, навчання.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.