OpenAI побеждает Grok в шахматах. Дистанционный матч Маска и Альтмана.

Финал выставочного турнира по искусству интеллекта (AI Chess Exhibition Tournament) завершился вчера, в четверг, 7 августа 2025 года. Этот турнир по искусству интеллекта (AI Chess Exhibition Tournament), организованный Google DeepMind, открывает новую платформу для бенчмаркинга Kaggle Game Arena, где лучшие модели искусственного интеллекта уровня LLM будут соревноваться в различных играх, чтобы оценить их стратегические и сложные способности к рассуждению, разработанные на сегодняшний день. Игры, по сути, являются важными бенчмарками для оценки моделей, и на сегодняшний день лишь немногие движки, такие как Stockfish, или модели, такие как AlphaZero, способны работать даже на очень высоком уровне. Кейт Ольшевска и Мег Рисдал, менеджеры по продуктам Google и Kaggle соответственно, пишут об этом в статье, опубликованной в блоге Google: «Игры подают чёткий и недвусмысленный сигнал об успехе. Их чёткая структура и измеримые результаты делают их идеальным испытательным полигоном для оценки моделей и агентов. Они заставляют модели демонстрировать множество навыков, включая стратегическое мышление, долгосрочное планирование и динамическую адаптацию к действиям разумного противника, что служит надёжным индикатором их общего интеллекта в решении задач. Ценность игр как бенчмарков дополнительно повышается их масштабируемостью (сложность возрастает с ростом интеллекта противника) и возможностью анализировать и визуализировать ход рассуждений модели, позволяя заглянуть в процесс её стратегического мышления».

В отборочном этапе также участвовали модели Deepseek, Google, Anthropic и Moonshot AI, но в финальном поединке ИИ Сэма Альтмана победил Grok 4 Илона Маска со счётом 4:0. В полуфинале Grok победил Gemini 2.5 Pro от Google в тай-брейке, а o3 победил более шустрый o4-mini со счётом 4:0.

Очевидно, что помимо простого измерения возможностей двух моделей, для Сэма Альтмана и Илона Маска задача приобрела более личный смысл: десять лет назад они оба основали OpenAI, прежде чем Маск решил пойти по независимому пути, создав конкурирующую компанию xAI и начав судебные разбирательства, чтобы не допустить преобразования OpenAI в коммерческую организацию, что противоречит тому, что было установлено на этапе основания.

Тем не менее, это состязание между искусственными интеллектами знаменует собой скорее символическую, чем техническую веху. Ни одна из участвующих моделей не была предназначена для выполнения этих задач; фактически, они предназначены для письма, создания изображений, программирования и ответа даже на сложные вопросы, но они не справляются с ситуациями, требующими строгой логики. Однако это ограничение показывает, что искусственный интеллект, каким бы развитым он ни был, ещё не достиг уровня интеллекта, который мы считаем истинно человеческим. Таким образом, шахматная игра, с её сложностью, представляет собой испытание, которое демонстрирует амбиции разработчиков этих моделей, а не фактическое превосходство машин.

ilsole24ore

OpenAI побеждает Grok в шахматах. Дистанционный матч Маска и Альтмана.

Похожие новости

Крайне редкое событие, наблюдаемое в ЦЕРНе, вероятность 1 к 100 миллионам.

Пик падающих звезд приходится на период с 12 по 13 августа.

Хлеб, приготовленный на закваске, имеет молекулярную подпись

Мы и ИИ-опекун

Не только Маск и Starlink. Польские спутники меняют правила игры на передовой и в бизнесе.