Изкуственият интелект на Алтман победи този на Мъск на шах
Турнирът се проведе на платформата Kaggle, собственост на Google, която позволява на специалистите по данни да оценяват своите модели чрез състезания
&format=webp)
OpenAI на Сам Алтман победи Grok на Илон Мъск на финала за най-добър шахматист с изкуствен интелект.
Исторически погледнато, технологичните компании често използват шаха, за да оценят напредъка и способностите си, като съвременните шахматни машини са практически непобедими дори срещу най-добрите човешки играчи.
Но това състезание не включваше компютри, а модели с изкуствен интелект за ежедневна употреба, съобщава BBC.
Моделът o3 на OpenAI победи Grok 4 на xAI във финала, което подхрани ожесточената конкуренция между двете компании.
Мъск и Сам Алтман, едни от най-влиятелните лидери в Силициевата долина твърдят, че най-новите им модели са най-умните в света.
Моделът Gemini на Google зае трето място в турнира, след като победи друг модел на OpenAI.
Но макар и талантливи в много ежедневни задачи, моделите все още се усъвършенстват в шаха – Grok допусна редица грешки по време на финалните си партии, включително многократна загуба на царицата.
„До полуфиналите изглеждаше, че нищо не може да спре Grok 4 по пътя към победата“, коментира Педро Пината в репортажа си за Chess.com. „Въпреки няколко момента на слабост, AI на X изглеждаше като най-силният шахматист. Но илюзията беше разбита в последния ден.“
Според експерта, „неумелата“ игра на Grok е позволила на o3 да постигне поредица от „убедителни победи“.
„Grok допусна толкова много грешки в тези партии за сметка на OpenAI“, коментира шахматният гросмайстор Хикару Накамура по време на прякото предаване на финала в четвъртък.
This is a side effect btw. @xAI spent almost no effort on chess. https://t.co/p18DFFn35A
— Elon Musk (@elonmusk) August 5, 2025
По-рано Илон Мъск написа в X, че успехът на xAI в турнира е бил „страничен ефект“ и „не е положил почти никакви усилия в шаха“.
Турнирът по шах с изкуствен интелект се проведе на платформата Kaggle, собственост на Google, която позволява на специалистите по данни да оценяват своите системи чрез състезания.
Осем големи езикови модела от Anthropic, Google, OpenAI, xAI, както и китайските DeepSeek и Moonshot AI, се състезаваха по време на тридневния турнир на Kaggle.
Разработчиците на изкуствен интелект използват тестове, известни като бенчмаркове, за да проверят уменията на своите модели в области като разсъждение или кодиране.
Като сложни стратегически игри, базирани на правила, шахматът често се използва за оценка на способността на даден модел да се научи най-добре да постига определен резултат – в този случай да изпревари опонентите си, за да спечели.
AlphaGo, компютърна програма, разработена от лабораторията за изкуствен интелект DeepMind на Google, за да играе китайската стратегическа игра Го за двама, постигна поредица от победи срещу човешки шампиони в края на 2010-те години.
Южнокорейският майстор по Го Ли Се-дол се оттегли след няколко поражения от AlphaGo през 2019 г., допълва BBC.
Победата на Deep Blue на шах беше считана за знаков момент, който демонстрираше способността на компютрите да се мерят с определени човешки умения.