Американська OpenAI на два дні випередила китайського конкурента Baidu у ШІ-перегонах. Google з відповіддю не забарився. Що може і вміє GPT-4
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
«Вона може скласти адвокатський іспит та отримати п’ять балів у декількох випускних шкільних іспитах», – написав 14 березня у Twitter СЕО компанії OpenAI Сем Альтман. Всі ці компліменти адресовані новому дітищу його компанії – мовній моделі GPT-4. Чутки про її реліз ширилися вже понад тиждень, і очікувалося, що четверте покоління нейромережі презентують 16 березня.
Проте OpenAI розкрила карти на два дні раніше і випередила китайського інтернет-гіганта Baidu, що ось-ось має повноцінно включитися у світові ШІ-перегони. «Вона креативніша за попередні моделі, вона значно менше глючить і менш упереджена», – розхвалює GPT-4 Альтман. Чим вона особлива, окрім гіпотетичних академічних успіхів?
Очікування та реальність GPT-4
Нова модель вдесятеро більша за свою попередницю GPT-3. Четверта версія має 10 трлн параметрів, що дозволяє вирішувати значно складніші завдання. Приклад із презентації – завантажити увесь податковий кодекс США та розрахувати податки для американської сімейної пари.
Друга й більш очікувана фішка – мультимодальність. Ще до релізу зарубіжні оглядачі припускали, що новинка зможе працювати з відео, аудіо та візуальними відповідями. Ці очікування виправдалися не до кінця.
Модель GPT-3.5, на якій побудований знаменитий ChatGPT, сприймає лише текст. У GPT-4 можна завантажити зображення, проте відповідь поки що буде все одно текстова. Президент й кофаундер OpenAI Грег Брокман під час онлайн-презентації намалював на папері схему простого веб-сайту, сфотографував малюнок і відправив завдання ШІ. Алгоритм у відповідь згенерував HTML-код для цього сайту.
GPT-4 може одночасно працювати кількома мовами. Промпт – завдання для алгоритму – можна завантажити англійською, а відповіді отримати українською, іспанською чи іншою мовами.
Протестувати новинку можуть користувачі платної версії ChatGPT Plus, що коштує $20 на місяць, та пошукового бота Bing Chat від головного інвестора OpenAI Microsoft. Нову модель слід очікувати у продуктах інших партнерів розробника – на платформі обробки електронних платежів Stripe та мовному сервісі Duolingo.
Найближчим часом OpenAI обіцяє відкрити API GPT-4 для розробників і планує монетизувати цю опцію. Попередні розцінки – $0,03 за 1000 токенів, або ж близько 750 слів запиту і $0,06 за аналогічний обсяг відповіді від моделі.
Чим відповідають інші учасники ШІ-перегонів
Суперництво бігтеху й ніші штучного інтелекту й генеративних мовних моделей нагадує кращі роки технологічного протистояння Apple та Samsung. Тільки учасників значно більше. На один день із презентацією OpenAI був намічений вихід чат-бота Ernie Bot. Цього конкурента ChatGPT створила компанія-власниця найбільшого китайського пошуковика Baidu. Бот має стати частиною пошукової системи, а згодом буде доступним користувачам.
Над китайською відповіддю ChatGPT у цілодобовому режимі працювали сотні людей, писав WSJ. Baidu заявила, що вже має підписані бізнес-контракти на використання Ernie Bot із понад 400 компаній. Але станом на початок березня деякі розробники продукту й оглядачі WSJ сумнівалися, що він повністю готовий до релізу.
Втім на початку лютого Google теж презентувала власний ШІ Bard на основі моделі LaMDA у не надто досконалому вигляді. І схоже, що пошуковий гігант усіма силами намагається надолужити розрив у започаткованих дітищем Альтмана ШІ-перегонах.
Майже одночасно із GPT-4 Google оголосив, що включить ШІ-інструменти до своїх традиційних продуктів – Gmail, Google Docs, хмарного сервісу Cloud. Паралельно компанія запустила ще два інструменти для розробників PaLM API та MakerSuite. Перший дозволяє експериментувати із генеративними моделями від компанії, другий – створювати програми на базі штучного інтелекту.
На участь у перегонах претендує і Марк Цукерберг із презентованою наприкінці лютого мовною моделлю LLaMA від Meta. Офіційно вона призначена для дослідників штучного інтелекту. Однак паралельно материнська компанія Facebook тестує генеративні текстові моделі для месенджерів WhatsApp і Messenger.
Яким буде наступний хід OpenAI? «Ми самі продовжуємо експериментувати з програмами, залучаємо до цього партнерів і все ще не завершили цей експеримент», – сказав Брокман під час презентації GPT-4.
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.