Категорія: Інновації
Дата: 17 липня 2023 19:15

Google проти OpenAI. Що вміють чат-боти Bard та Claude 2 порівняно із ChatGPT, який втрачає користувачів та швидкість.Тест-драйв Forbes

Анастасія Несенюк

Forbes

5 хв читання

Shutterstock/Колаж Олександра Карасьова

ChatGPT започаткував хвилю ШІ-хайпу, та недовго був наодинці. Лише у липні в Україні й усій Європі став доступний поспіхом запущений Bard, у США та Британії – чат-бот Claude 2. На що вони здатні?

У середині липня 2023-го чат-бот зі штучним інтелектом Bard від техногіганта Google нарешті «заговорив» українською – сервіс відкрився для Європи. На кілька днів раніше свого «вбивцю ChatGPT» – сервіс Claude 2 – виставив на широкий загал американський єдиноріг Anthropic.

Офіційно України у списку Anthropic немає – тестування відрите для США та Великої Британії. Проте репортерці Forbes без проблем вдалося зареєструвати обліковий запис та попрацювати із Claude 2 із Києва через VPN.

Популярне

Категорія: Гроші
Дата: 27 жовтня

100 днів уряду Свириденко. Forbes Ukraine зібрав 13 складних запитань від бізнесу для прем’єр-міністерки. Що вона на них відповіла

Звідки взялися Bard та Claude 2 і до чого тут Google

Bard – спроба наздогнати OpenAI, що коштувала материнській компанії Google Alphabet $100 млрд капіталізації. Саме стільки компанія втратила через невдалу презентацію експериментальної моделі у лютому 2023-го.

Допрацьовану версію Bard відкрили для ранніх користувачів уже навесні – спочатку у США та Великій Британії, у травні – ще у 180 країнах за винятком Європи. Через тяганину навколо GDPR та конфіденційності європейцям сервіс відкрився лише в липні.

Слід Google є й у Claude 2, який створили колишні співробітники OpenAI Даріо та Даніелла Амодей. Наприкінці 2022-го компанія інвестувала в Anthropic близько $300 млн в обмін на 10% акцій, свідчить звіт Financial Times. Загалом заснований у 2021-му ШІ-стартап зібрав $1,5 млрд інвестицій, за даними Crunchbace. В останньому раунді інвестицій Anthropic оцінили у $4,1 млрд.

Таймінг можна вважати ідеальним – середина літа для першопрохідця ChatGPT та його материнської компанії OpenAI видалася нелегкою. Відвідуваність сервісу впала вперше із тріумфального запуску – трафік у червні знизився на 9,7%, свідчать дані Similarweb. Активність у США просіла ще більше – на 10,3%.

Одне з пояснень – літні канікули, цитує інженера та дослідника штучного інтелекту в Google Франсуа Шолле видання Fortune. Американські школярі використають ChatGPT для виконання домашніх завдань, а на відпочинку надають перевагу Minecraft чи іншим розвагам.

Водночас користувачі у Twitter та на тематичних форумах почали масово жалітися, що ChatGPT став «тупішим» та «ледачішим». Найчастіші скарги – відповіді генеруються довше, а їхня якість помітно гірша, ніж кілька місяців тому. Офіційних пояснень «лінощів» немає. Проте вони можуть бути наслідками перебудови всередині системи, пише Business Insider із посиланням на співрозмовників у індустрії.

Що можуть найближчі конкуренти ChatGPT? Forbes обрав кілька завдань, які українські підприємці найчастіше делегують мовним моделям, і порівняв результати.

Спойлер: із точністю фактів у всіх трьох чат-ботів досі є серйозні негаразди.

Машинний переклад – у списку завдань, які генеративний ШІ виконує на рівні, подекуди навіть краще за відомі сервіси онлайн-перекладу. Для тесту ChatGPT, Bard та Claude 2 отримали кілька речень з новини CNBC про запуск ШІ-стартапу xAI від мільярдера Ілона Маска та завдання перекласти його з англійської на українську.

Точність перекладу доволі висока. Однак Claude 2 зробив текст більш літературним, конкуренти ж видали машинні варіанти.

Бонус від Bard – на додачу до перекладу бот без додаткових промптів додав стислий переказ тексту. Мінус – фактологічні помилки. Bard написав, що xAI «працювала над проєктами, включаючи AlphaCode від DeepMind і чат-боти GPT-3.5 і GPT-4 від OpenAI». Проте в реальності у цих компаніях працювали окремі члени команди xAI – Ігор Бабушкін, Кайл Косич, Крістіан Сегеді й Цзихан Дай – перш ніж приєднатися до Маска.

Пояснити складне поняття простими словами – у топі промптів для генеративного ШІ. На прохання розтлумачити, що таке стейкінг, ChatGPT видав найкоротшу та найменш структуровану відповідь. Пояснення від Claude 2 та Bard повніші, проте чат-бот від Google відповів із граматичними помилками, не відмінюючи саме слово «стейкінг».

Підбивати підсумки робочих дзвінків і брейнштормів – найменш улюблене завдання команди Let`s Enhance, розповідала Forbes співзасновниця стартапу Софія Швець. Тому його вона делегує ШІ – транскрипцію розмов робить асистент Otter.ai, резюме – ChatGPT.

Bard, Claude 2 та ChatGPT отримали англомовний текст більш як на 1500 слів про оновлення Windows 1. Завдання – вибрати з нього головне й перекласти українською. Якість відповідей приблизно на одному рівні, обсяги – різні. Bard обмежився чотирма пунктами, Claude 2 видав удвічі більше тез. Відповідь бота від OpenAI – найрозлогіша, до кількох тез ШІ додав пояснення.

Найточніше із завданням проаналізувати фінансову звітність Microsoft за 2022 рік за посиланням впорався Claude 2. Бот від Anthropic видав коротку відповідь із цифрами, не фантазуючи про причини фінрезультатів. ChatGPT відмовився брати дані для аналізу на сайті Microsoft, написавши натомість розлогу інструкцію, як обробити їх самостійно. Bard відповів із помилками, вказавши, що у 2022-му Microsoft отримала $168 млрд доходу. Проте це виторг попереднього року.

«Bard краще відповідає на фактичні запитання, тоді як ChatGPT краще генерує творчий контент, такий як вірші, код, сценарії, музичні твори, електронні листи, листи тощо», – каже сам Bard на запит про те, чим від відрізняється від першого конкурента. Проте і до творчого контенту, і до фактажу чимало запитань.

На промпт «написати вірша про відомих українських підприємців» усі боти видали неримовані тексти. Claude 2 згадав Ігоря Коломойського, Ріната Ахметова та Віктора Пінчука, Bard обійшовся без імен. ChatGPT склав «вірш» про засновників Rozetka, Grammarly та GitLab, проте повністю вигадав їхні імена.

У всі три сервіси вшиті базові етичні блоки. Моделі відмовляються відповідати на запитання на кшталт «Як зробити вибухівку?», «Як скоїти суїцид?» чи «Де безкоштовно подивитися кіно?». ChatGPT на останній запит видав список легальних стримінгів.

Дипломатично-розмиті відповіді ШІ дає й на провокативні запитання про те, чий Крим або Північний Кіпр.

Матеріали по темі