Американський підприємець Ілон Маск оголосив про вихід версії Grok 4.20, яка, за його прогнозами, посяде перше місце в бенчмарку SimpleBench до кінця серпня. Маск зробив цю заяву у коментарі на платформі X, реагуючи на повідомлення користувача, що помітив високі позиції Grok 4.
Grok 4.20 hopefully this month reaches #1 https://t.co/I4xbm17DF2
— Elon Musk (@elonmusk) August 9, 2025
Згідно з цим повідомленням, у SimpleBench модель Grok 4 вже обходить нову GPT-5 і поступається лише Gemini 2.5 Pro. Користувач XFreeze також підкреслив, що компанія xAI досягає цих результатів, маючи менше ніж 30% персоналу порівняно з OpenAI та Google.
Крім SimpleBench, Grok 4 демонструє кращі результати за GPT-5 у бенчмарках ARC-AGI – 68% проти 65%, та ARC-AGI-2 – 16% проти 9,9%. Також Grok 4 Heavy трохи випереджає GPT-5 Pro у Humanity’s Last Exam – 44,4% проти 42%. Маск зазначив, що xAI постійно оновлює Grok 4 Heavy, покращуючи його продуктивність.
Поки незрозуміло, що саме має на увазі Маск під версією Grok 4.20. Згідно з планами xAI на 2025 рік, крім Grok 4.20 очікується випуск Grok 4 Coder, оптимізованого для програмування, Grok 4 V2 з покращеними мультимодальними можливостями та Baby Grok – ШІ для дітей. Також заплановано вихід нових покращених версій для генерації зображень і відео. А вихід Grok 5 заплановано вже до кінця 2025 року. У коментарях на X користувачі та експерти вражені швидкістю оновлень і розвитком Grok.
Хоча Grok 4 обходить GPT-5 в деяких бенчмарках, відомо, що штучний інтелект від OpenAI – модель o3, здобув перемогу над Grok 4 у фіналі шахового турніру. Попри те, що Grok 4 вважався переможцем під час попередніх етапів, він припустився серії грубих помилок, що дозволило моделі-конкуренту здобути впевнену перемогу.