Genie 3 від Google створює ігрові світи в реальному часі
Genie 3 створює інтерактивні 3D-світи з пам’яттю і погодою (скріншот: Google DeepMind)
Підрозділ Google DeepMind анонсував просунуту версію своєї ШІ-моделі Genie 3, здатної генерувати тривимірні віртуальні світи в реальному часі. У таких світах можуть вільно переміщатися як користувачі, так і ШІ-агенти.
Що таке “світові моделі”?
Це особливий тип ШІ, який створює симульовані простори – для навчання, розваг або тренувань інших ШІ, наприклад, роботів. Раніше такі віртуальні світи розроблялися вручну з використанням 3D-графіки, але тепер усе генерується нейромережею за простим текстовим описом.
У чому відмінність Genie 3 від попередньої версії?
Попередня версія Genie 2 могла підтримувати інтерактивність лише протягом 10-20 секунд. У новій моделі цей показник збільшився до кількох хвилин.
Навіть більше, у Genie 3 з’явилася візуальна пам’ять на рівні однієї хвилини. Це означає, що якщо користувач відвернеться від об’єкта, а потім повернеться до нього, – написи, кольори або предмети залишаться на тих самих місцях. Роздільна здатність згенерованого світу – 720p за частоти 24 кадри на секунду.
Інтерактивність на новому рівні
Genie 3 також підтримує так звані “програмовані події”. Користувач може змінювати параметри світу в реальному часі – наприклад, викликати дощ, додати персонажів або змінити атмосферу, використовуючи текстові підказки (промпти).
Контекст
Google активно розвиває напрямок генеративних світів. У грудні компанія показала Genie 2, яка вміла створювати ігрові сцени на основі одного зображення. Команду, що працює над цим проектом, очолює колишній співрозробник Sora – інструменту для генерації відео від OpenAI.