Генерація та редагування відео за допомогою штучного інтелекту - Google представила Gemini Omni - новини технологій

Нова модель здатна генерувати та редагувати контент на основі тексту, зображень, аудіо й відео.

Компанія Google представила нову мультимодальну модель штучного інтелекту Gemini Omni, яка може створювати відео з будь-якої комбінації вхідних даних. Першою моделлю в цій новій лінійці стала Gemini Omni Flash, яку вже почали інтегрувати в застосунок Gemini, сервіс Google Flow та YouTube Shorts.

Як зазначили в Google, Gemini Omni здатна “створювати що завгодно з будь-чого”, адже поєднує можливості міркування ШІ Gemini з умінням генерувати та редагувати контент на основі тексту, зображень, аудіо й відео. У компанії підкреслили, що модель може змінювати окремі об’єкти, середовище, стиль або рух, не втрачаючи контексту початкового відео.

Gemini Omni також отримала вдосконалене розуміння фізичних процесів. У компанії повідомили, що система краще справляється з моделюванням гравітації, кінетичної енергії та гідродинаміки, що дозволяє створювати більш реалістичні сцени.

Окремо Google акцентує увагу на здатності Omni поєднувати творчість зі знаннями Gemini в галузі науки, історії та культури. Модель може генерувати складні пояснювальні відео, зокрема наукові візуалізації або освітні ролики, на основі коротких текстових запитів.

Система підтримує комбінування різних типів контенту в одному проєкті. Користувачі можуть завантажувати зображення, відео, текстові описи або аудіофайли, а Omni створюватиме єдиний відеокліп із синхронізованими ефектами та стилістикою.

У Google також представили функцію Avatars, яка дозволяє створювати цифрового аватара з власним голосом та зовнішністю. Компанія зазначає, що наразі продовжує тестування функцій зміни голосу та мови для безпечного використання технології.

Всі відео, створені за допомогою Gemini Omni, автоматично отримуватимуть цифровий водяний знак SynthID. У Google повідомили, що контент можна буде перевірити через Gemini, Chrome та пошук Google.

Gemini Omni Flash вже почали розгортати для передплатників Google AI Plus, Pro та Ultra по всьому світу. Також модель стане доступною безкоштовно в YouTube Shorts і застосунку YouTube Create. У найближчі тижні Google планує відкрити доступ до Omni через API для розробників і корпоративних клієнтів.

Водночас Google представила масштабне оновлення Пошуку (Search) з новими функціями штучного інтелекту та агентними можливостями. Відтепер режим AI Mode працюватиме на основі моделі Gemini 3.5 Flash, яка стане моделлю за замовчуванням для користувачів у всьому світі.

Компанія Google анонсувала нову технологію Gemini Omni, що дозволяє генерувати та редагувати відео за допомогою штучного інтелекту.

Схожі публікації

Google трансформує Gemini в агент штучного інтелекту, який працює у фоновому режимі та інтегрується з Gmail, Docs і Calendar.

Новий штучний інтелект для пошуку на YouTube – все, що варто знати про Ask YouTube.

Sl8 від Cassator Corp – функції та можливості криптоплатформи.