Google вывела на рынок первую модель линейки Omni под названием Gemini Omni Flash. Ключевая особенность новинки — возможность редактировать готовые видеоролики по текстовым запросам прямо в интерфейсе чата, а не только создавать контент с нуля. Презентацию провёл Демис Хассабис, руководитель Google DeepMind.
Доступность
Модель уже доступна для использования:
- Подписчикам тарифов Google AI Plus, Pro и Ultra — через приложение Gemini и платформу Flow для работы с видео;
- Пользователям YouTube Shorts и YouTube Create — бесплатно, в течение ближайшей недели по всему миру.
В чём прорыв?
Если прошлогодняя Veo специализировалась на генерации видео «из текста», то Omni работает с любым типом входных данных: текстом, изображениями, аудио или уже готовым роликом. Пользователь может точечно менять отдельные элементы: заменять персонажей, объекты или развивать сюжетную линию.
Редактирование происходит итеративно: каждая новая команда учитывает предыдущие правки, сохраняя консистентность персонажей и контекста сцены. Особое внимание разработчики уделили физической достоверности — модель точнее воспроизводит гравитацию, поведение жидкостей и кинетические взаимодействия. На презентации это продемонстрировали на примере образовательного ролика о сворачивании белка, выполненного в стилистике пластилиновой анимации.
Безопасность и контроль
Чтобы минимизировать риски злоупотреблений, каждое сгенерированное видео автоматически помечается цифровым водяным знаком SynthID. Проверить происхождение контента можно через:
- приложение Gemini;
- веб-версию Gemini в браузере Chrome;
- поиск Google.
Пользователи могут интегрировать в ролики собственные аватары — как внешность, так и голос. Однако функция изменения чужой речи и внешности на старте намеренно отключена: компания отложила её внедрение до разработки надёжных механизмов защиты. Без таких ограничений технология могла бы стать инструментом массового создания дипфейков.
Что дальше?
Omni Flash — лишь первая ступень в развитии семейства. Google уже анонсировала более мощную версию Omni Pro (детали будут раскрыты позже) и заявила о планах расширить функционал: в будущем модель сможет генерировать не только видео, но и статичные изображения, а также аудиоконтент в рамках единого рабочего процесса.
Новинка знаменует переход от простой генерации контента к интеллектуальному видеоредактированию — и, возможно, задаст новый стандарт для креативных инструментов на базе ИИ.
Больше интересных новостей смотрите в нашем федеральном тг-канале и МАХ, там новости выходят намного раньше других соцсетей, а ещё есть много уникального контента.
Больше интересных новостей смотрите в нашем федеральном тг-канале и МАХ, там новости выходят намного раньше других соцсетей, а ещё есть много уникального контента.