diffnotes.tech — тех-блог о программировании, AI и DevOps
Gemini Omni Flash — модель, которая месяц пряталась в UI Gemini, на I/O заменила Veo и сжигает Pro-квоту за 4 ролика
Google запустил Gemini Omni Flash на I/O 19 мая. Модель заменила Veo в Gemini-приложении, добавила multi-turn редактуру через чат и зашила несъёмный SynthID. API пока нет, и двух роликов хватает, чтобы выжрать 86% дневной Pro-квоты.
Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash
Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.
Через 30 минут Google показывает Gemini 4 на I/O 2026 — почему этот keynote бьёт не по Anthropic, а по твоему API-бюджету
Google I/O 2026 начинается через 30 минут. Все ждут Gemini 4, но реальная история не про SWE-bench. Когда модель уйдёт в default на 2 миллиарда пользователей AI Overviews при цене в 5× меньше Claude Mythos — это финансовая бомба, а не модельная.
Google слил три модели за 4 дня до I/O — Spark Agent с твоими паролями, Omni вместо Veo, Gemini 3.5 не дотянет до Mythos
До Google I/O 2026 двое суток. За 4 дня в код Gemini утекли видеомодель Omni, всегда-онлайн агент Spark, который сохраняет логины и пароли, и флагман Gemini 3.5 Pro под кодовым именем Cappuccino. Инсайдер Alex Heath из Sources говорит: до Anthropic Mythos флагман не дотянет.
Gemma 4 — Apache 2.0, function calling из коробки и 89% AIME. Google выложил open-weight модель, которая делает cloud API необязательным
Google DeepMind выпустил Gemma 4 — четыре open-weight модели от 2B до 31B под Apache 2.0 с native function calling и мультимодальностью. Flagship 31B занял #3 на Arena AI, обходит Qwen 3.5 по математике и кодингу, а E2B работает на телефоне.
Flash-Lite Browser — Google сделала псевдо-браузер, где веб-страницы генерируются моделью в реальном времени
Google показала Flash-Lite Browser — демо в AI Studio, где Gemini 3.1 Flash-Lite генерирует веб-страницы на лету. Вводишь промпт, кликаешь по ссылкам на несуществующие страницы — и модель собирает их за секунды. 360 токенов/с, но output подорожал в 4 раза, а 2.5 Flash-Lite удаляют 31 марта.
Gemini 3.1 Flash-Lite — $0.25 за миллион токенов, качество взрослого Flash и 363 токена в секунду
Google выпустила Gemini 3.1 Flash-Lite — самую быструю и дешёвую модель серии Gemini 3. $0.25 за миллион входных токенов, 363 tok/s, quality на уровне 2.5 Flash, thinking levels и мультимодальность. Разбираем, кому стоит мигрировать.
Nano Banana 2 — Google выкатил генератор картинок, который делает 4K за 5 секунд и стоит вдвое дешевле Pro
Google запустил Nano Banana 2 (Gemini 3.1 Flash Image) — генерация 4K-картинок за 4-6 секунд, удержание 5 персонажей, текст прямо на изображении, и всё это вдвое дешевле Pro-модели. Разбираем API, подводные камни и сравниваем с Midjourney и Flux.
Платишь $250 в месяц — а тебя банят без предупреждения. Google и Anthropic объявили войну сторонним AI-клиентам
Массовая бан-волна: Google банит подписчиков AI Ultra ($250/мес) за использование OpenClaw — без предупреждений, без возврата денег, без апелляции. Anthropic сделал то же самое в январе. Что произошло и как защитить свой аккаунт.
$ cat /dev/blog/updates
> Свежие заметки о программировании,
> DevOps и AI — прямо в мессенджер