# ai
Искусственный интеллект в разработке — новости моделей, сравнения, инструменты и практики использования AI для написания кода и автоматизации.
Gemini Omni Flash — модель, которая месяц пряталась в UI Gemini, на I/O заменила Veo и сжигает Pro-квоту за 4 ролика
Google запустил Gemini Omni Flash на I/O 19 мая. Модель заменила Veo в Gemini-приложении, добавила multi-turn редактуру через чат и зашила несъёмный SynthID. API пока нет, и двух роликов хватает, чтобы выжрать 86% дневной Pro-квоты.
Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash
Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.
Addy Osmani запустил agent-skills — 23 production-grade SKILL.md, которые делают то, что твои собственные скиллы делать стесняются
Addy Osmani, автор Learning JavaScript Design Patterns, выложил на GitHub agent-skills — 23 production-grade SKILL.md для Claude Code, Cursor и Gemini CLI. 43.5K звёзд за 5 дней. Anti-rationalization таблицы, verification gates, 7 слэш-команд. Разбираемся, что внутри и как поставить за 2 минуты.
Через 30 минут Google показывает Gemini 4 на I/O 2026 — почему этот keynote бьёт не по Anthropic, а по твоему API-бюджету
Google I/O 2026 начинается через 30 минут. Все ждут Gemini 4, но реальная история не про SWE-bench. Когда модель уйдёт в default на 2 миллиарда пользователей AI Overviews при цене в 5× меньше Claude Mythos — это финансовая бомба, а не модельная.
Google слил три модели за 4 дня до I/O — Spark Agent с твоими паролями, Omni вместо Veo, Gemini 3.5 не дотянет до Mythos
До Google I/O 2026 двое суток. За 4 дня в код Gemini утекли видеомодель Omni, всегда-онлайн агент Spark, который сохраняет логины и пароли, и флагман Gemini 3.5 Pro под кодовым именем Cappuccino. Инсайдер Alex Heath из Sources говорит: до Anthropic Mythos флагман не дотянет.
Claude Mythos — модель Anthropic, которую решили не выпускать. 93.9% SWE-bench и побег из sandbox по email
Anthropic закрыла Claude Mythos в коалицию AWS, Apple, Google, Microsoft и JPMorganChase. 93.9% на SWE-bench, тысячи zero-day в каждой ОС и реальный sandbox escape. Что внутри секретной модели Anthropic и почему её не выпустят в публичный API.
MiniCPM-V 4.6 — мультимодальная модель на 1.3B, которая видит видео на айфоне без интернета и весит 1.6 ГБ
OpenBMB из Tsinghua тихо выложили MiniCPM-V 4.6 — мультимодальную модель на 1.3B под Apache 2.0. 1.6 ГБ через Ollama, работает на iPhone, Android и HarmonyOS без интернета. 38% на MMMU-Pro — рекорд для open-weight моделей до 2B параметров.
SubQ — 4 человека из Майами, $29M и заявка на смерть квадратичного attention
Subquadratic из Майами 5 мая выпустила SubQ — первую полностью sub-quadratic LLM с 12M токенов контекста, заявленной 52× скоростью FlashAttention и стоимостью <5% от Opus. Разбираем SSA-архитектуру, бенчмарки, подводные камни и можно ли это запускать в проде.
OpenAI вкатил GPT-5 в голос — три Realtime-модели одним релизом, и Translate за 3 цента в минуту
7 мая OpenAI без шумной презентации выкатил в Realtime API сразу три модели: GPT-Realtime-2 с GPT-5-уровнем reasoning, GPT-Realtime-Translate за $0.034/мин и стримящий GPT-Realtime-Whisper за $0.017/мин. Разбираем что это значит для voice-агентов, синхронного перевода и почему кэш ввода за $0.40 переворачивает экономику длинных сессий.
GPT-5.5 Instant — OpenAI тихо подменил мозг ChatGPT для сотен миллионов и пустил его в твой Gmail
OpenAI вчера тихо заменил default-модель ChatGPT на GPT-5.5 Instant. По внутренним бенчмаркам -52.5% галлюцинаций в медицине, праве и финансах, доступ к Gmail для персонализации и API-алиас chat-latest. Разбираем грабли: внутренние бенчмарки без сравнений, регрессии Instant и retire 5.3 через три месяца.