Американська OpenAI на два дні випередила китайського конкурента Baidu у ШІ-перегонах. Google з відповіддю не забарився. Що може і вміє GPT-4
Forbes Ukraine випустив новий номер журналу. Придбати його з безкоштовною доставкою можна за цим посиланням. У журналі: перший список найкращих роботодавців для ветеранів, список перспективних молодих українців «30 до 30», 40 компаній, які вийшли на іноземні ринки під час війни, історії Марії Берлінської, Всеволода Кожемяки та загалом майже два десятки текстів.
«Вона може скласти адвокатський іспит та отримати п’ять балів у декількох випускних шкільних іспитах», – написав 14 березня у Twitter СЕО компанії OpenAI Сем Альтман. Всі ці компліменти адресовані новому дітищу його компанії – мовній моделі GPT-4. Чутки про її реліз ширилися вже понад тиждень, і очікувалося, що четверте покоління нейромережі презентують 16 березня.
Проте OpenAI розкрила карти на два дні раніше і випередила китайського інтернет-гіганта Baidu, що ось-ось має повноцінно включитися у світові ШІ-перегони. «Вона креативніша за попередні моделі, вона значно менше глючить і менш упереджена», – розхвалює GPT-4 Альтман. Чим вона особлива, окрім гіпотетичних академічних успіхів?
Очікування та реальність GPT-4
Нова модель вдесятеро більша за свою попередницю GPT-3. Четверта версія має 10 трлн параметрів, що дозволяє вирішувати значно складніші завдання. Приклад із презентації – завантажити увесь податковий кодекс США та розрахувати податки для американської сімейної пари.
Друга й більш очікувана фішка – мультимодальність. Ще до релізу зарубіжні оглядачі припускали, що новинка зможе працювати з відео, аудіо та візуальними відповідями. Ці очікування виправдалися не до кінця.
Модель GPT-3.5, на якій побудований знаменитий ChatGPT, сприймає лише текст. У GPT-4 можна завантажити зображення, проте відповідь поки що буде все одно текстова. Президент й кофаундер OpenAI Грег Брокман під час онлайн-презентації намалював на папері схему простого веб-сайту, сфотографував малюнок і відправив завдання ШІ. Алгоритм у відповідь згенерував HTML-код для цього сайту.
GPT-4 може одночасно працювати кількома мовами. Промпт – завдання для алгоритму – можна завантажити англійською, а відповіді отримати українською, іспанською чи іншою мовами.
Протестувати новинку можуть користувачі платної версії ChatGPT Plus, що коштує $20 на місяць, та пошукового бота Bing Chat від головного інвестора OpenAI Microsoft. Нову модель слід очікувати у продуктах інших партнерів розробника – на платформі обробки електронних платежів Stripe та мовному сервісі Duolingo.
Найближчим часом OpenAI обіцяє відкрити API GPT-4 для розробників і планує монетизувати цю опцію. Попередні розцінки – $0,03 за 1000 токенів, або ж близько 750 слів запиту і $0,06 за аналогічний обсяг відповіді від моделі.
Презентація GPT-4
Чим відповідають інші учасники ШІ-перегонів
Суперництво бігтеху й ніші штучного інтелекту й генеративних мовних моделей нагадує кращі роки технологічного протистояння Apple та Samsung. Тільки учасників значно більше. На один день із презентацією OpenAI був намічений вихід чат-бота Ernie Bot. Цього конкурента ChatGPT створила компанія-власниця найбільшого китайського пошуковика Baidu. Бот має стати частиною пошукової системи, а згодом буде доступним користувачам.
Над китайською відповіддю ChatGPT у цілодобовому режимі працювали сотні людей, писав WSJ. Baidu заявила, що вже має підписані бізнес-контракти на використання Ernie Bot із понад 400 компаній. Але станом на початок березня деякі розробники продукту й оглядачі WSJ сумнівалися, що він повністю готовий до релізу.
Втім на початку лютого Google теж презентувала власний ШІ Bard на основі моделі LaMDA у не надто досконалому вигляді. І схоже, що пошуковий гігант усіма силами намагається надолужити розрив у започаткованих дітищем Альтмана ШІ-перегонах.
Майже одночасно із GPT-4 Google оголосив, що включить ШІ-інструменти до своїх традиційних продуктів – Gmail, Google Docs, хмарного сервісу Cloud. Паралельно компанія запустила ще два інструменти для розробників PaLM API та MakerSuite. Перший дозволяє експериментувати із генеративними моделями від компанії, другий – створювати програми на базі штучного інтелекту.
На участь у перегонах претендує і Марк Цукерберг із презентованою наприкінці лютого мовною моделлю LLaMA від Meta. Офіційно вона призначена для дослідників штучного інтелекту. Однак паралельно материнська компанія Facebook тестує генеративні текстові моделі для месенджерів WhatsApp і Messenger.
Яким буде наступний хід OpenAI? «Ми самі продовжуємо експериментувати з програмами, залучаємо до цього партнерів і все ще не завершили цей експеримент», – сказав Брокман під час презентації GPT-4.


26 вересня на Форумі «Енергія бізнесу» Forbes збирає регуляторів і лідерів бізнесу. Мета заходу — обговорити проблеми і знайти рішення, які дозволять зробити українську енергетику дешевою, рясною та стійкою. Встигніть купити квиток!
Ви знайшли помилку чи неточність?
Залиште відгук для редакції. Ми врахуємо ваші зауваження якнайшвидше.