Google вывела на рынок первую модель линейки Omni под названием Gemini Omni Flash. Ключевая особенность новинки — возможность редактировать готовые видеоролики по текстовым запросам прямо в интерфейсе чата, а не только создавать контент с нуля. Презентацию провёл Демис Хассабис, руководитель Google DeepMind.

Доступность

Модель уже доступна для использования:

Подписчикам тарифов Google AI Plus, Pro и Ultra — через приложение Gemini и платформу Flow для работы с видео;
Пользователям YouTube Shorts и YouTube Create — бесплатно, в течение ближайшей недели по всему миру.

В чём прорыв?

Если прошлогодняя Veo специализировалась на генерации видео «из текста», то Omni работает с любым типом входных данных: текстом, изображениями, аудио или уже готовым роликом. Пользователь может точечно менять отдельные элементы: заменять персонажей, объекты или развивать сюжетную линию.

Редактирование происходит итеративно: каждая новая команда учитывает предыдущие правки, сохраняя консистентность персонажей и контекста сцены. Особое внимание разработчики уделили физической достоверности — модель точнее воспроизводит гравитацию, поведение жидкостей и кинетические взаимодействия. На презентации это продемонстрировали на примере образовательного ролика о сворачивании белка, выполненного в стилистике пластилиновой анимации.

Безопасность и контроль

Чтобы минимизировать риски злоупотреблений, каждое сгенерированное видео автоматически помечается цифровым водяным знаком SynthID. Проверить происхождение контента можно через:

приложение Gemini;
веб-версию Gemini в браузере Chrome;
поиск Google.

Пользователи могут интегрировать в ролики собственные аватары — как внешность, так и голос. Однако функция изменения чужой речи и внешности на старте намеренно отключена: компания отложила её внедрение до разработки надёжных механизмов защиты. Без таких ограничений технология могла бы стать инструментом массового создания дипфейков.

Что дальше?

Omni Flash — лишь первая ступень в развитии семейства. Google уже анонсировала более мощную версию Omni Pro (детали будут раскрыты позже) и заявила о планах расширить функционал: в будущем модель сможет генерировать не только видео, но и статичные изображения, а также аудиоконтент в рамках единого рабочего процесса.

Новинка знаменует переход от простой генерации контента к интеллектуальному видеоредактированию — и, возможно, задаст новый стандарт для креативных инструментов на базе ИИ.

Больше интересных новостей смотрите в нашем федеральном тг-канале и МАХ, там новости выходят намного раньше других соцсетей, а ещё есть много уникального контента.