> · 8 мин

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

Вчера, 30 апреля, OpenRouter добавил в каталог ещё одного анонимного гостя. Имя: Owl Alpha. Создатель не указан. Контекст: 1 048 756 токенов (округлим до 1M). Цена: ноль за вход, ноль за выход. Заточена под агентные задачи, заявлена совместимость с Claude Code и OpenClaw.

TL;DR: Owl Alpha стала четвёртой stealth-моделью на OpenRouter за два месяца. 1M контекст, бесплатно, заточена под tool use и длинные цепочки рассуждений. Прошлые анонимы оказались GPT-4.1 и GLM-5. Один даже Xiaomi MiMo для разнообразия. Логирование промптов включено, в продакшен такое тащить не стоит. Зато для прототипа на 1M контексте это золото.

Что в спеке

С страницы openrouter.ai/openrouter/owl-alpha:

  • Контекст: 1 048 756 токенов
  • Максимальный output: 262 144 токена за один ответ. Это много: обычно у моделей этот лимит 32K-64K, а у Owl 262K
  • Цена: $0/M входных, $0/M выходных
  • Входы: только текст. Картинки и аудио не поддерживаются
  • Tool use: есть, нативный
  • Reasoning mode: не отдельная опция. Скорее всего, обычный direct-режим
  • Логирование: да, провайдер логирует промпты и ответы для дообучения

За первые двое суток модель уже обработала 4.48 миллиарда токенов. Её активно используют, и явно не один-два разработчика на любительских проектах.

Stealth-модели на OpenRouter превратились в отдельный жанр

OpenRouter регулярно публикует анонимные модели от партнёрских лабораторий. Не маркетинг, а способ собрать честные отзывы без эффекта бренда. Хронология за последний год:

Quasar Alpha появилась в апреле 2025. Через несколько недель раскрылась как GPT-4.1 от OpenAI.

Sonoma Sky/Dusk Alpha запустились в сентябре 2025. 2M контекст, бесплатно. Связь с конкретной лабораторией так и не подтвердилась.

Horizon Alpha в июле 2025. Alex из OpenRouter подтвердил в Discord, что это early checkpoint семейства GPT-5.

Polaris Alpha в ноябре 2025. 256K контекст, агентные задачи. Личность скрыта до сих пор.

Pony Alpha в феврале 2026. Через пять дней Zhipu AI подтвердил, что это часть GLM-5.

Pareto Code Router в феврале 2026. Reasoning-модель для кодинга, всё ещё в стелсе.

Hunter Alpha появилась 11 марта 2026. 18 марта Xiaomi через свою AI-команду MiMo раскрыла, что это early build of MiMo-V2-Pro, триллионная модель. Перед раскрытием комьюнити сходило с ума: одни ставили на DeepSeek V4, другие на BAAI. В тестах Reuters модель сама о себе говорила: "Я китайская модель, обученная преимущественно на китайском". Не помогло. Никто не угадал Xiaomi.

Healer Alpha в марте 2026. Тоже Xiaomi MiMo, омни-модальный вариант.

Elephant Alpha в середине апреля 2026. 100B параметров, 256K контекст. Личность пока скрыта.

Owl Alpha 28-30 апреля 2026. Та самая. Контекст в 4 раза больше, чем у Elephant. Личность снова загадка.

Закономерность простая: от появления stealth-модели до раскрытия проходит 5-15 дней. К середине мая мы, скорее всего, узнаем, что такое Owl на самом деле.

Кто стоит за Owl

Чистых доказательств нет. Есть зацепки.

За OpenAI: OpenRouter с ними уже работал (Quasar превратился в GPT-4.1, Horizon оказался GPT-5). Формулировка "designed for agentic workloads" совпадает с маркетингом GPT-5.5 от 23 апреля. Модель явно тестируется на больших объёмах. 4.48B токенов за двое суток требуют серьёзной инфраструктуры. И главное: GPT-5.5 запустился неделю назад, OpenAI логично выкатить рядом мини-вариант или агентную модификацию.

За китайскую лабу: прецедент Hunter и Pony показывает, что Xiaomi и Zhipu активно используют OpenRouter как тестовую площадку. Zhipu готовит GLM-5.5, Xiaomi планирует MiMo-V3. Бесплатность плюс 1M контекст. Это стиль китайского pricing wars (DeepSeek V4 кодит за $3.48 за миллион, и это уже публичная цена).

За Anthropic: маловероятно. Anthropic исторически не пользовалась stealth-релизами, у них свой rollout через Claude.com и API. Хотя упоминание "Claude Code, OpenClaw compatible" подозрительное.

За Google: возможно, но Google обычно тестирует через AI Studio и собственные каналы.

Лично я ставлю на OpenAI или Alibaba. Логика такая: 1M контекст плюс focus на agentic workloads. И 4.48B токенов трафика за двое суток. Это либо OpenAI, либо кто-то с крупным data center. Ставлю $20 на Alibaba (Qwen3.6-Plus, ещё не выпущенный).

Как попробовать прямо сейчас

Минимальный пример на curl:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openrouter/owl-alpha",
    "messages": [
      {"role": "user", "content": "Напиши Python-функцию, которая разбирает CSV из URL и кэширует результат на диск"}
    ]
  }'

Через OpenAI SDK на Python:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-..."
)

response = client.chat.completions.create(
    model="openrouter/owl-alpha",
    messages=[{"role": "user", "content": "Implement quicksort in Rust"}],
)
print(response.choices[0].message.content)

Если хочется проверить в Claude Code, подмени base URL и модель через переменные окружения:

export ANTHROPIC_BASE_URL="https://openrouter.ai/api"
export ANTHROPIC_API_KEY="sk-or-v1-..."
export ANTHROPIC_DEFAULT_OPUS_MODEL="openrouter/owl-alpha"

claude

Только учти: Claude Code общается через Anthropic Messages API, OpenRouter транслирует в OpenAI-совместимый формат. Tool use работает не идеально через эту прокладку, особенно с нестандартными моделями. Лучше тестируй через прямой OpenAI SDK или claude-code-router от musistudio.

Подводные камни

Логирование промптов и ответов. Прямо на странице модели написано: "Prompts and completions may be logged by the provider and used to improve the model". Любой ваш код, который вы скармливаете Owl, может оказаться в обучающей выборке какой-то лабы. Для open-source проектов нормально. Для коммерческих кодовых баз нет.

Нет model card. Никаких бенчмарков, никаких safety evals, никаких сведений о тренировочных данных. Если упадёт на простой задаче, понять причину невозможно. Если выдаст галлюцинацию или хейт-спич, тоже непонятно, чья это вина.

Лимиты бесплатного тира OpenRouter. Для free-моделей действуют дневные лимиты: 50 запросов в день для аккаунтов с балансом ниже $10, до 1000 для тех, кто пополнил счёт. Документация эти лимиты не привязывает к stealth-моделям конкретно, но опыт с Hunter Alpha показал, что в пиковые дни upstream-провайдер просто отбрасывает запросы.

Нет SLA и обязательств. Stealth-модель может исчезнуть в любой момент. Когда Hunter Alpha вышла из тени, её просто переименовали в xiaomi/mimo-v2-pro. Если вы интегрировали openrouter/owl-alpha в продакшен, ждите сюрприза.

1M контекст не равно 1M внимания. Исследование Chroma про context rot показало: качество ответов LLM начинает деградировать уже после 30-50% заполнения контекста. Если модель утверждает 1M, реальное полезное окно 200-400K. Не строй архитектуру под полный миллион, пока не прогнал тесты на длинных документах.

Tool use заявлен, но не оттестирован публично. "Native tool use" — пока что маркетинг. Будет ли Owl Alpha вызывать функции с правильным JSON-форматом, попадёт ли в схему, не запутается ли в цепочке из 15 вызовов? Узнаем через неделю по постам на Reddit.

Альтернативы

Elephant Alpha. Соседний stealth от OpenRouter, появился в середине апреля. 100B параметров, 256K контекст. Тоже бесплатно. Меньше окно, зато статистика накопилась, и риск ниже.

Qwen3.6-Plus от Alibaba. Публичная open-source модель, доступна на OpenRouter с лимитами. 200K контекст, MIT-лицензия, никакого логирования промптов. Слабее на long-context, но прозрачнее.

Gemma 4 от Google. Open-weights под Apache 2.0, можно запускать локально. Меньше параметров и контекст, зато ваши данные никуда не уйдут.

Claude Haiku 4.5 от Anthropic. Официальная, платная (~$1 за миллион входных), 200K контекст, гарантированный uptime. Если нужен production, бери её, а Owl используй только для прототипа.

Вердикт

Если хочешь бесплатно потестить агентную модель с миллионом токенов контекста, заходи прямо сейчас. К пятнице-субботе Owl, скорее всего, выйдет из стелса и либо станет платной, либо просто исчезнет. Окно для бесплатных тестов закрывается.

В продакшен не тащи. Логирование промптов и отсутствие model card делают такое решение рискованным. Прототип на Owl, продакшен на Claude Haiku или GPT-5.4 mini.

Если просто следишь за индустрией, добавь openrouter/owl-alpha в свой тестовый набор и прогони на нём свои любимые prompts. Через неделю сравни с тем, что объявит выпустившая её лаба. Это самый надёжный способ понять, кто реально кодит модели, а кто пыжится с маркетинговым материалом.

Как попробовать за 5 минут

  1. Зарегистрируйся на openrouter.ai/keys и создай API-ключ.
  2. Установи openai SDK: pip install openai или npm install openai.
  3. Запусти один из примеров кода выше с model: "openrouter/owl-alpha".
  4. Прогони на нём 3-5 типичных задач из своего рабочего пайплайна. Реальный код, реальный RAG. Особенно tool use.
  5. Сравни результат с Claude Opus 4.7 или GPT-5.5. Если Owl не отстаёт, модель готова к ставке на её родителей.

Анонс от OpenRouter появился вчера в твиттере OpenRouter. Дискорд для обсуждения: discord.gg/fVyRaUDgxW.

$ ls ./related/

Похожие статьи

oh-my-codex-codex-teams.md
Oh My codeX — параллельные агенты для Codex CLI, tmux worktrees и HUD, который показывает, что делает каждый бот
> · 8 мин

Oh My codeX — параллельные агенты для Codex CLI, tmux worktrees и HUD, который показывает, что делает каждый бот

OMX — это oh-my-zsh для OpenAI Codex CLI. За 2 минуты npm-установки получаешь 33 агента, 36 скиллов, команды, которые гоняют по три Codex-сессии в параллельных git worktrees, и HUD, который показывает, чем они заняты прямо сейчас.

ai agents codex open-source
gpt-55-spud-codex-leak.md
Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»
> · 7 мин

Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»

22 апреля в Codex у Pro-юзеров внезапно появился пикер с gpt-5.5, oai-2.1, arcanine и glacier-alpha. Через сутки OpenAI выкатила GPT-5.5 официально. Simon Willison параллельно собрал инструмент, который крадёт авторизацию Codex CLI и стучится в API, которого пока нет. Разбираем, что утекло, что умеет Spud, и почему API «задерживается ради безопасности».

llm openai codex ai-agents
openrouter-stealth-models-guide.md
Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас
> · 8 мин

Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас

Hunter Alpha оказался Xiaomi MiMo-V2-Pro, Healer Alpha до сих пор анонимный, Elephant Alpha появился 13 апреля. Все три frontier-модели бесплатные на OpenRouter. Как подключить через OpenAI SDK за 2 минуты, где каждая сливает, и почему логи промптов это не мелочь.

ai tips openrouter stealth-models
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe