$ grep -r "ai" ./posts/

# ai

Искусственный интеллект в разработке — новости моделей, сравнения, инструменты и практики использования AI для написания кода и автоматизации.

gemini-omni-flash-google.md
Gemini Omni Flash — модель, которая месяц пряталась в UI Gemini, на I/O заменила Veo и сжигает Pro-квоту за 4 ролика
> · 8 мин

Gemini Omni Flash — модель, которая месяц пряталась в UI Gemini, на I/O заменила Veo и сжигает Pro-квоту за 4 ролика

Google запустил Gemini Omni Flash на I/O 19 мая. Модель заменила Veo в Gemini-приложении, добавила multi-turn редактуру через чат и зашила несъёмный SynthID. API пока нет, и двух роликов хватает, чтобы выжрать 86% дневной Pro-квоты.

ai gemini google multimodal
gemini-35-flash-launch.md
Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash
> · 10 мин

Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash

Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.

ai agents llm gemini
addy-osmani-agent-skills-skill-md.md
Addy Osmani запустил agent-skills — 23 production-grade SKILL.md, которые делают то, что твои собственные скиллы делать стесняются
> · 8 мин

Addy Osmani запустил agent-skills — 23 production-grade SKILL.md, которые делают то, что твои собственные скиллы делать стесняются

Addy Osmani, автор Learning JavaScript Design Patterns, выложил на GitHub agent-skills — 23 production-grade SKILL.md для Claude Code, Cursor и Gemini CLI. 43.5K звёзд за 5 дней. Anti-rationalization таблицы, verification gates, 7 слэш-команд. Разбираемся, что внутри и как поставить за 2 минуты.

ai cursor claude-code developer-tools
google-io-2026-gemini-4-developer-impact.md
> · 6 мин

Через 30 минут Google показывает Gemini 4 на I/O 2026 — почему этот keynote бьёт не по Anthropic, а по твоему API-бюджету

Google I/O 2026 начинается через 30 минут. Все ждут Gemini 4, но реальная история не про SWE-bench. Когда модель уйдёт в default на 2 миллиарда пользователей AI Overviews при цене в 5× меньше Claude Mythos — это финансовая бомба, а не модельная.

ai llm gemini google
google-io-2026-leaks-spark-omni-gemini-35.md
Google слил три модели за 4 дня до I/O — Spark Agent с твоими паролями, Omni вместо Veo, Gemini 3.5 не дотянет до Mythos
> · 10 мин

Google слил три модели за 4 дня до I/O — Spark Agent с твоими паролями, Omni вместо Veo, Gemini 3.5 не дотянет до Mythos

До Google I/O 2026 двое суток. За 4 дня в код Gemini утекли видеомодель Omni, всегда-онлайн агент Spark, который сохраняет логины и пароли, и флагман Gemini 3.5 Pro под кодовым именем Cappuccino. Инсайдер Alex Heath из Sources говорит: до Anthropic Mythos флагман не дотянет.

ai agents gemini google
claude-mythos-glasswing.md
Claude Mythos — модель Anthropic, которую решили не выпускать. 93.9% SWE-bench и побег из sandbox по email
> · 9 мин

Claude Mythos — модель Anthropic, которую решили не выпускать. 93.9% SWE-bench и побег из sandbox по email

Anthropic закрыла Claude Mythos в коалицию AWS, Apple, Google, Microsoft и JPMorganChase. 93.9% на SWE-bench, тысячи zero-day в каждой ОС и реальный sandbox escape. Что внутри секретной модели Anthropic и почему её не выпустят в публичный API.

ai llm claude anthropic
minicpm-v-46-edge-multimodal.md
MiniCPM-V 4.6 — мультимодальная модель на 1.3B, которая видит видео на айфоне без интернета и весит 1.6 ГБ
> · 7 мин

MiniCPM-V 4.6 — мультимодальная модель на 1.3B, которая видит видео на айфоне без интернета и весит 1.6 ГБ

OpenBMB из Tsinghua тихо выложили MiniCPM-V 4.6 — мультимодальную модель на 1.3B под Apache 2.0. 1.6 ГБ через Ollama, работает на iPhone, Android и HarmonyOS без интернета. 38% на MMMU-Pro — рекорд для open-weight моделей до 2B параметров.

ai llm open-source multimodal
subq-subquadratic-attention.md
SubQ — 4 человека из Майами, $29M и заявка на смерть квадратичного attention
> · 6 мин

SubQ — 4 человека из Майами, $29M и заявка на смерть квадратичного attention

Subquadratic из Майами 5 мая выпустила SubQ — первую полностью sub-quadratic LLM с 12M токенов контекста, заявленной 52× скоростью FlashAttention и стоимостью <5% от Opus. Разбираем SSA-архитектуру, бенчмарки, подводные камни и можно ли это запускать в проде.

ai llm subq subquadratic
gpt-realtime-2-voice-trio.md
OpenAI вкатил GPT-5 в голос — три Realtime-модели одним релизом, и Translate за 3 цента в минуту
> · 8 мин

OpenAI вкатил GPT-5 в голос — три Realtime-модели одним релизом, и Translate за 3 цента в минуту

7 мая OpenAI без шумной презентации выкатил в Realtime API сразу три модели: GPT-Realtime-2 с GPT-5-уровнем reasoning, GPT-Realtime-Translate за $0.034/мин и стримящий GPT-Realtime-Whisper за $0.017/мин. Разбираем что это значит для voice-агентов, синхронного перевода и почему кэш ввода за $0.40 переворачивает экономику длинных сессий.

ai llm api openai
gpt-55-instant-default.md
GPT-5.5 Instant — OpenAI тихо подменил мозг ChatGPT для сотен миллионов и пустил его в твой Gmail
> · 6 мин

GPT-5.5 Instant — OpenAI тихо подменил мозг ChatGPT для сотен миллионов и пустил его в твой Gmail

OpenAI вчера тихо заменил default-модель ChatGPT на GPT-5.5 Instant. По внутренним бенчмаркам -52.5% галлюцинаций в медицине, праве и финансах, доступ к Gmail для персонализации и API-алиас chat-latest. Разбираем грабли: внутренние бенчмарки без сравнений, регрессии Instant и retire 5.3 через три месяца.

ai llm api openai