Мировые гиганты искусственного интеллекта смещают фокус с языковых моделей на так называемые «мировые модели», которые способны лучше понимать физическую среду человека. Google DeepMind, Meta и Nvidia соревнуются за новый прорыв в технологии, которая может стать основой для «суперинтеллекта», пишет FT .

Подробности

В то время как развитие больших языковых моделей (LLM) замедлилось, ведущие ИИ-компании разрабатывают системы, которые учатся не только на текстах, но и на видео и данных от роботов.

Цель – научить алгоритмы ориентироваться в физическом мире, открывая путь к прогрессу в сфере самоуправляемых авто, робототехники и ИИ-агентов. «Мировые модели» нуждаются в огромных объемах данных и вычислительной мощности, но считаются ключом к «физическому ИИ».

По словам вице-президента Nvidia по технологиям симуляции Рева Лебаредиана, потенциальный рынок таких систем может достигать $100 трлн – почти размер всей глобальной экономики.

«Если мы создадим интеллект, способный понимать и действовать в физическом мире, масштаб возможностей будет колоссальным», – подчеркнул он.

В августе DeepMind представил Genie 3, который формирует видео покадрово, учитывая предыдущие взаимодействия.

Meta под руководством Яна ЛеКуна обучает свои модели V-JEPA на необработанном видеоконтенте, воспроизводя процесс познания детей. В июне компания запустила вторую версию V-JEPA и проверяет ее на роботах.

Параллельно Марк Цукерберг инвестирует в развитие языковых моделей Llama, привлекая к руководству AI-направлением Александра Вана, основателя Scale AI.

Стартапы также ищут нишевые применения. World Labs, созданный «крестной матерью» ИИ Фэй-Фэй Ли, работает над генерацией трехмерных игровых сред из одного изображения, а Runway уже сотрудничает с Голливудом, создавая реалистичные сцены для кино и игр.

Свои данные в развитие «мировых моделей» вкладывает и Niantic: благодаря игре Pokémon Go компания собрала карту из 10 млн локаций, которую в настоящее время использует для обучения своих систем.

Nvidia, со своей стороны, делает ставку на платформу Omniverse, которая симулирует физические среды и должна стать основой для развития робототехники. Ее CEO Дженсен Хуанг отмечает: следующая эра компании связана с «физическим ИИ».

Несмотря на громкие амбиции, эксперты прогнозируют, что достижение систем с человеческим уровнем интеллекта может занять не менее десятилетия. Но потенциальный масштаб применений – от медицины до производства – уже сегодня делает «мировые модели» самым горячим направлением в мировой гонке искусственного интеллекта.

Контекст

Инвестиции в ИИ стали ключевым полем конкуренции между техногигантами. Недавно принятый закон One Big Beautiful Bill Act стимулирует расходы, позволяя компаниям переносить налоговую нагрузку. Однако финансовый разрыв все еще значителен: Morgan Stanley оценивает его в $1,5 трлн.

Риски для компаний – оправдаются ли ожидания. Аналитики предупреждают: доходы пока не успевают за расходами. Но многие инвесторы готовы и дальше вкладывать в ИИ, пока оценки стартапов и публичных компаний растут.

Большие технологические игроки ставят на ИИ, чтобы переформатировать рынок даже ценой масштабной перестройки инфраструктуры и кадровых жертв.

Инвесторы в такие стартапы, как OpenAI, пока не беспокоятся о вопросе доходности, довольствуясь тем, что вкладывают больше денег, пока оценки продолжают расти, по данным WSJ. Однако другие инвесторы предупреждают, что бум ИИ превратился в спекулятивное безумие.