$ grep -r "api" ./posts/

# api

API и интеграции — работа с AI API, аутентификация, лимиты, оптимизация запросов и лучшие практики.

google-io-2026-gemini-4-developer-impact.md
> · 6 мин

Через 30 минут Google показывает Gemini 4 на I/O 2026 — почему этот keynote бьёт не по Anthropic, а по твоему API-бюджету

Google I/O 2026 начинается через 30 минут. Все ждут Gemini 4, но реальная история не про SWE-bench. Когда модель уйдёт в default на 2 миллиарда пользователей AI Overviews при цене в 5× меньше Claude Mythos — это финансовая бомба, а не модельная.

ai llm gemini google
gpt-realtime-2-voice-trio.md
OpenAI вкатил GPT-5 в голос — три Realtime-модели одним релизом, и Translate за 3 цента в минуту
> · 8 мин

OpenAI вкатил GPT-5 в голос — три Realtime-модели одним релизом, и Translate за 3 цента в минуту

7 мая OpenAI без шумной презентации выкатил в Realtime API сразу три модели: GPT-Realtime-2 с GPT-5-уровнем reasoning, GPT-Realtime-Translate за $0.034/мин и стримящий GPT-Realtime-Whisper за $0.017/мин. Разбираем что это значит для voice-агентов, синхронного перевода и почему кэш ввода за $0.40 переворачивает экономику длинных сессий.

ai llm api openai
gpt-55-instant-default.md
GPT-5.5 Instant — OpenAI тихо подменил мозг ChatGPT для сотен миллионов и пустил его в твой Gmail
> · 6 мин

GPT-5.5 Instant — OpenAI тихо подменил мозг ChatGPT для сотен миллионов и пустил его в твой Gmail

OpenAI вчера тихо заменил default-модель ChatGPT на GPT-5.5 Instant. По внутренним бенчмаркам -52.5% галлюцинаций в медицине, праве и финансах, доступ к Gmail для персонализации и API-алиас chat-latest. Разбираем грабли: внутренние бенчмарки без сравнений, регрессии Instant и retire 5.3 через три месяца.

ai llm api openai
claude-opus-4-7-release.md
Claude Opus 4.7 — 1:1 пиксельные координаты, task budgets и тихо убитые thinking budgets
> · 9 мин

Claude Opus 4.7 — 1:1 пиксельные координаты, task budgets и тихо убитые thinking budgets

Anthropic выкатил Opus 4.7: SWE-bench Pro 64.3%, visual acuity скакнул с 54.5% до 98.5%, картинки до 3.75 Мп с 1:1 координатами, новый xhigh effort, task budgets в бете. И пачка breaking changes, которые сломают ваш продакшен, если не прочитать migration guide.

agents llm claude anthropic
claude-managed-agents.md
Claude Managed Agents — $0.08 в час за инфраструктуру, которую вы строили бы три месяца
> · 8 мин

Claude Managed Agents — $0.08 в час за инфраструктуру, которую вы строили бы три месяца

Anthropic запустила Managed Agents — облачную инфраструктуру для продакшен-агентов с sandbox, Vaults, MCP и трейсингом. Разбираем архитектуру brain/hands, цены и альтернативы.

ai agents claude anthropic
gpt-54-mini-nano-release.md
GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое
> · 7 мин

GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое

OpenAI выпустила GPT-5.4 mini и nano — маленькие модели, которые на бенчмарках догоняют флагман. Mini набирает 54.4% на SWE-Bench Pro, nano стоит $0.20 за миллион токенов. Но цены выросли в 3-4 раза по сравнению с предшественниками.

ai llm coding api
gemini-31-flash-lite.md
Gemini 3.1 Flash-Lite — $0.25 за миллион токенов, качество взрослого Flash и 363 токена в секунду
> · 7 мин

Gemini 3.1 Flash-Lite — $0.25 за миллион токенов, качество взрослого Flash и 363 токена в секунду

Google выпустила Gemini 3.1 Flash-Lite — самую быструю и дешёвую модель серии Gemini 3. $0.25 за миллион входных токенов, 363 tok/s, quality на уровне 2.5 Flash, thinking levels и мультимодальность. Разбираем, кому стоит мигрировать.

ai llm gemini google
nano-banana-2-image-generation.md
Nano Banana 2 — Google выкатил генератор картинок, который делает 4K за 5 секунд и стоит вдвое дешевле Pro
> · 9 мин

Nano Banana 2 — Google выкатил генератор картинок, который делает 4K за 5 секунд и стоит вдвое дешевле Pro

Google запустил Nano Banana 2 (Gemini 3.1 Flash Image) — генерация 4K-картинок за 4-6 секунд, удержание 5 персонажей, текст прямо на изображении, и всё это вдвое дешевле Pro-модели. Разбираем API, подводные камни и сравниваем с Midjourney и Flux.

ai gemini google api
openai-websocket-responses-api.md
OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%
> · 5 мин

OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%

OpenAI добавил WebSocket mode в Responses API — постоянное соединение, инкрементальные запросы и до 40% ускорения для агентских цепочек с десятками tool-вызовов.

agents llm api openai
claude-sonnet-46.md
Claude Sonnet 4.6 — мозги Opus за пятую часть цены
> · 6 мин

Claude Sonnet 4.6 — мозги Opus за пятую часть цены

Anthropic выпустили Sonnet 4.6: 79.6% SWE-bench, Adaptive Thinking, 1M контекст, computer use 72.5% — и всё это за $3/$15 на миллион токенов. Разбираем, зачем платить за Opus.

ai agents llm coding