> 21 May 2026 · 8 мин

Gemini Omni Flash — модель, которая месяц пряталась в UI Gemini, на I/O заменила Veo и сжигает Pro-квоту за 4 ролика

ai gemini google multimodal models video-generation google-io-2026 veo

19 мая на Google I/O Демис Хассабис вышел на сцену и объявил, что Veo в Gemini-приложении больше не существует. На его место встал Gemini Omni Flash, новая видео-модель, которую за месяц до релиза успели слить из самого приложения. Сначала появилась кнопка "Powered by Omni" рядом с внутренним кодовым именем Veo 3.1 ("Toucan"). Чуть позже из мобилки достали полную карточку модели с тагом "remix, edit directly in chat". К дню I/O скрывать уже было нечего.

TL;DR: Gemini Omni Flash — это omni-модель Google: на вход берёт текст, картинки, аудио и видео, на выход выдаёт 10-секундные ролики. Главная фишка: multi-turn редактура через чат. SynthID-водяной знак стоит по дефолту, отключить нельзя. API нет, а двух роликов хватает, чтобы выжрать 86% дневной квоты на Google AI Pro.

Что вообще такое "omni-модель"

До Omni у Google было две отдельных модели для медиа: Veo для видео и Nano Banana для картинок. Каждая со своим API, своим интерфейсом, своими ограничениями. Если ты хотел сделать ролик из реф-фото в нужном стиле, ты собирал пайплайн вручную. Сгенерил картинку в Nano Banana, скормил её в Veo, потом отдельно сделал аудио. Три инструмента, три счёта, три модели поведения.

Omni убирает посредников. Одна модель принимает на вход:

Текст — обычный промпт
Изображения — до 5 штук как референс
Видео — существующий клип для правки или продолжения
Аудио — звуковой референс

И выдаёт видео с нативным звуком. По заявлению Google, картинки и отдельный аудио-выход появятся позже, пока только видео. Это не "Veo с новой обёрткой": у модели другой ID (_omni, не _veo), другая постановка задачи (редактирование, а не генерация с нуля), и в API Veo 3.1 продолжает жить параллельно. Omni забрал себе всё, что было в Gemini-приложении, но из Vertex AI его пока не видно.

Никол Брихтова из Google DeepMind на I/O назвала это "больше, чем апдейт Veo": рассуждательный движок Gemini сшили с генеративной медиа-частью в одну систему. Звучит как маркетинг, но на демках действительно видно разницу. Модель понимает контекст промпта, держит логику сцены через несколько правок и не теряет персонажа между турами.

Multi-turn редактура — то, ради чего это всё затевалось

Главная фишка Omni не в качестве самого ролика (на демках Veo 3.1 выглядит сопоставимо). Главное, что ты больше не пишешь один большой промпт и не молишься. Ты разговариваешь с моделью турами.

Боевой пример из доков Google Flow для рекламного шота с продуктом.

Тур 1. Загружаешь два изображения: product.png (металлическая бутылка) и forest.jpg (туманный лес).

Generate a 10-second cinematic product showcase. Place the metallic
water bottle from the product shot onto a mossy rock inside the misty
forest. Set the lighting to early morning golden hour.

Omni кладёт бутылку на камень, рассчитывает физику теней под утренний свет.

Тур 2. Тебе не нравится ракурс. Ты не пишешь промпт заново, а просто говоришь:

Slowly pan the camera from a low angle upward.

Тур 3. Допиливаешь физику среды:

Make it start raining heavily. Ensure raindrops splash realistically
off the top of the bottle and water ripples form on the ground.

И это всё работает в рамках одной сцены. Бутылка, камень, освещение остаются те же, меняется только то, что ты попросил поменять. Для рекламного флоу или продакшена коротких роликов это категорически другой воркфлоу, чем у Veo 3.1, где каждый запрос это отдельная генерация с нуля.

Gemini Omni demo

Как достучаться (и почему API пока нет)

Доступ к Omni Flash раздаётся по подписке. Без подписки ты модель даже не увидишь.

Google AI Plus, $7.99/мес. Базовый лимит, доступ есть, но квота быстро кончается
Google AI Pro, $19.99/мес. В 4 раза выше лимиты, plus-доступ к Pro-моделям
Google AI Ultra, $99.99/мес. В 5 раз выше лимиты сверх Pro

Где можно потыкать прямо сейчас:

Gemini-приложение для Plus/Pro/Ultra подписчиков, доступно во всех языках и регионах, где работает Gemini
Google Flow — полноценный flow для съёмки коротких фильмов, с пакетной генерацией и Flow Music
YouTube Shorts и YouTube Create бесплатно, без подписки, раскатывают с недели I/O

API Google обещает "через несколько недель". На момент 21 мая 2026 ни в Vertex AI, ни в Gemini API карточки модели нет. Если тебе нужна программируемая видео-генерация в продакшене сегодня, это всё ещё Veo 3.1.

Подводные камни

1. Квота кончается за 4 ролика

Это самая громкая жалоба с Reddit. Юзер на Pro-плане ($19.99/мес) сгенерил 4 ролика и хит лимита, на 5 часов потерял доступ не только к Omni, но и к Gemini 3 Flash и 3.1 Pro. В лике 11 мая видели счётчик использования: 2 видео = 86% дневной квоты Pro. Если ты делаешь видео в продакшен-темпе, Plus-подписка за $7.99 кончится за минуту, Pro за две.

Это deployment cap, а не лимит модели. Никол Брихтова прямо сказала: 10-секундное ограничение и квоты держат искусственно, пока компьют не дотянется. Но "пока" может тянуться месяцами.

2. API нет, и неизвестно когда будет

"Coming in weeks" — это формулировка из релиз-нот Google. Не "next week", не дата. Если у тебя продакшен и нужна автоматизация, Omni сегодня бесполезен. Vertex AI его не видит, Gemini API не видит, модельного ID для прод-вызова не существует. Веб-фронты Atlas Cloud, WaveSpeed и прочие провайдеры ждут, как и все, и пишут это прямо в свои гайды.

3. Pro-версия объявлена без даты

Google формально показала на I/O, что готовится Omni Pro. Дата релиза: "когда увидим step change над Flash". Это публичный способ сказать "не скоро". До тех пор Flash остаётся единственным публичным Omni, а 10 секунд это потолок.

4. Текст в кадре ломается

PixVerse прогнала Omni Flash через тест-сет с экранными надписями: модель путает слова, повторяет фрагменты, искажает шрифт. Если у тебя соц-видос с лейблами интерфейса, цифрами или брендовым копирайтом, придётся делать несколько правок и руками отбирать кадры. Это не "Sora 2 уровня по тексту", это ближе к ранним Veo.

5. SynthID нельзя выключить

Каждый ролик через Omni Flash получает невидимый водяной знак SynthID на уровне пикселей. Он переживает сжатие, ресайз, конвертацию формата. По умолчанию включён, отключить нельзя. Для продакшена контента, который ты потом будешь выдавать как "снято камерой", это блокер. Google публично заявила, что Gemini сама проверяет SynthID при загрузке файла. Документально подтвердить AI-происхождение твоего ролика теперь умеет всё, что подключено к Gemini API.

6. Avatar и video-to-video режут по странам

В FAQ Google прямо написано: "Certain features like avatars and editing video to video AI may be restricted in your country." Какие именно страны, компания не уточняет. Из России и СНГ Gemini-приложение и так не работает по платной подписке, так что для большинства русскоязычных читателей вопрос академический. Но если ты тестишь через VPN из Европы, готовься, что часть функций может молча отсутствовать.

Альтернативы

Veo 3.1 — родной Google, остался в API, выдаёт 8-секундные ролики, нативный 24fps, broadcast-качество. Если тебе нужна программируемая генерация сегодня, это единственный Google-вариант. Минус: нет multi-turn редактуры, и ролики дороже ($0.40 за секунду стандарта).
Seedance 2.0 от ByteDance — 15 секунд, реф-система с @-упоминаниями (до 9 картинок + 3 видео + 3 аудио + текст), есть аудио-вход. Самая гибкая модель в категории, но без рассуждательного слоя Gemini, для физически достоверных сцен слабее.
Kling 3.0 от Kuaishou — 10 секунд, $0.07/сек, отличное качество движения, упор на азиатскую аудиторию. Цена в разы ниже, но и контроль слабее.
Sora 2 мёртв с 26 апреля 2026. OpenAI закрыла продукт, в сравнениях её больше брать незачем.

Вердикт

Если у тебя Google AI Pro или Ultra и ты делаешь короткие ролики итеративно, заходи и пробуй прямо сейчас. Multi-turn редактура реально меняет воркфлоу: ты не молишься на один промпт, а правишь как с живым монтажёром. Это первая публичная omni-модель, у которой это получается.

Если у тебя продакшен и нужна автоматизация, забудь до выхода API. Veo 3.1 всё ещё единственный программируемый Google-вариант.

Если ты копишь подписку под видео-продакшен, подожди Omni Pro. Flash за 10 секунд это демо-формат, а не продакшен-инструмент.

Как попробовать

Подпиши Google AI Plus ($7.99) или Pro ($19.99) на one.google.com/ai
Открой Gemini-приложение, перейди в вкладку видео. Omni Flash должен появиться вместо Veo
Загрузи 1-5 референсных фото и напиши промпт. Начни с простого: "10-second cinematic clip of [scene] in [style]"
Сделай второй тур: "change the background to X" или "make the lighting warmer". Оцени, держит ли модель сцену
Если хочешь полный voiceflow-режим с пакетной генерацией, иди в Google Flow

API-роадмап и обновления Google публикует в блоге для разработчиков. Там же выйдет анонс, когда Omni залетит в Vertex AI.