xAI випустила Grok 4.1 – нова модель стала найкращою за оцінками LMArena та покращила емоційний інтелект – новини технологій
Оновлення демонструє покращення в емоційному інтелекті та творчості.
Минулого тижня компанія OpenAI представила ChatGPT-5.1, який став розумнішим, швидшим і природнішим у спілкуванні. Тепер конкурентна компанія Ілона Маска xAI випускає свого нового гравця Grok 4.1. xAI заявляє, що оновлення робить взаємодію зі штучним інтелектом більш природною та практичною.
Grok 4.1, за даними розробників, краще розпізнає наміри співрозмовника й демонструє посилену здатність до творчої та емоційної взаємодії. У xAI пояснюють, що для цього використали масштабну інфраструктуру навчання з підкріпленням, яка вже застосовувалася в Grok 4. Розробники “оптимізували стиль, особистість, користь і узгодженість моделі”.
Окремо зазначається, що компанія створила нові методи використання передових моделей, що імітують мислення агентів, як своєрідних оцінювачів. Це дозволяє Grok 4.1 самостійно та у великих масштабах аналізувати та вдосконалювати власні відповіді.
У бенчмарку Creative Writing v3, за словами розробників, модель також показала високі результати. Версія Thinking отримала Elo 1721, а базова – 1708, поступившись лише ранній версії Polaris Alpha. xAI підкреслює, що обидві конфігурації продемонстрували стабільну якість письма та здатність адаптувати стиль до контексту.
Приклад взаємодії з Grok 4.1.xAI
Окрему увагу команда приділила зменшенню галюцинацій у відповідях на інформаційні запити. У компанії стверджують, що посттренінгова фаза з акцентом на перевірці фактів дозволила знизити частоту помилок на запитаннях із вибірки реального виробничого трафіку.
За словами xAI, Grok 4.1 вже повністю доступний користувачам на grok.com, у X та в мобільних застосунках. Модель розгортається автоматично, а також може бути вручну вибрана у списку доступних версій.
Раніше Grok показав найгірші результати серед 22 протестованих моделей штучного інтелекту щодо реагування на запити користувачів із суїцидальними думками. За результатами дослідження Rosebud, Grok мав критичні збої у 60% випадків, часто відповідаючи зневажливо, надаючи небезпечні інструкції або не розпізнаючи кризовий стан.