Український ШІ з розумінням мови та культури – дата виходу і що відомо про LLM
Навесні українці зможуть протестувати національний штучний інтелект (ілюстративне фото: Freepik)
Україна робить один із наймасштабніших кроків на шляху до лідерства в розвитку ШІ – запуск власної великої мовної моделі (LLM), навченої на унікальних українських даних. Місія країни – увійти в топ-3 світу з розвитку ШІ.
Хто стоїть за створенням українського ШІ
Технічним партнером проєкту став “Київстар”. Компанія фінансує розробку моделі, після чого вона буде передана державі.
Український LLM навчатиметься на основі сімейства моделей Gemma від Google – стратегічного партнера проєкту. Ці технології адаптовані під українську мову і національний контекст.
Якість роботи моделі перевірять незалежні експерти з різних галузей, оцінюючи:
- технічну якість
- етичність і безпеку для користувачів
- знання української мови
- розуміння національного контексту.
На якій стадії перебуває проєкт зараз
Наразі триває збір даних для навчання моделі. Для високої точності інформації з відкритих джерел недостатньо, тому розробники працюють з державними органами, медіа, університетами та іншими інститутами – це терабайти унікальних українських даних.
Паралельно створюється юридичний фреймворк, який дасть змогу відповідально працювати з наданими даними.
Експертна група вже розробляє бенчмарки – тести для оцінювання якості LLM, що допоможуть покращувати її ефективність та безпеку.
Поточний етап розробки національного ШІ (фото: facebook.com/mykhailofedorov)
Коли український ШІ стане доступний користувачам
У січні 2026 року вже буде:
- створено першу базу текстів для тренування LLM
- запуск поліпшеного токенізатора, який прискорює обробку тексту
- розробка власних бенчмарків для оцінювання якості моделі.
- Навесні 2026 року стартує бета-тестування національної LLM.
Крім того, назву моделі оберуть самі українці: голосування розпочнеться в січні через платформу “Дія”.