Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал
Вчера, 30 апреля, OpenRouter добавил в каталог ещё одного анонимного гостя. Имя: Owl Alpha. Создатель не указан. Контекст: 1 048 756 токенов (округлим до 1M). Цена: ноль за вход, ноль за выход. Заточена под агентные задачи, заявлена совместимость с Claude Code и OpenClaw.
TL;DR: Owl Alpha стала четвёртой stealth-моделью на OpenRouter за два месяца. 1M контекст, бесплатно, заточена под tool use и длинные цепочки рассуждений. Прошлые анонимы оказались GPT-4.1 и GLM-5. Один даже Xiaomi MiMo для разнообразия. Логирование промптов включено, в продакшен такое тащить не стоит. Зато для прототипа на 1M контексте это золото.
Что в спеке
С страницы openrouter.ai/openrouter/owl-alpha:
- Контекст: 1 048 756 токенов
- Максимальный output: 262 144 токена за один ответ. Это много: обычно у моделей этот лимит 32K-64K, а у Owl 262K
- Цена: $0/M входных, $0/M выходных
- Входы: только текст. Картинки и аудио не поддерживаются
- Tool use: есть, нативный
- Reasoning mode: не отдельная опция. Скорее всего, обычный direct-режим
- Логирование: да, провайдер логирует промпты и ответы для дообучения
За первые двое суток модель уже обработала 4.48 миллиарда токенов. Её активно используют, и явно не один-два разработчика на любительских проектах.
Stealth-модели на OpenRouter превратились в отдельный жанр
OpenRouter регулярно публикует анонимные модели от партнёрских лабораторий. Не маркетинг, а способ собрать честные отзывы без эффекта бренда. Хронология за последний год:
Quasar Alpha появилась в апреле 2025. Через несколько недель раскрылась как GPT-4.1 от OpenAI.
Sonoma Sky/Dusk Alpha запустились в сентябре 2025. 2M контекст, бесплатно. Связь с конкретной лабораторией так и не подтвердилась.
Horizon Alpha в июле 2025. Alex из OpenRouter подтвердил в Discord, что это early checkpoint семейства GPT-5.
Polaris Alpha в ноябре 2025. 256K контекст, агентные задачи. Личность скрыта до сих пор.
Pony Alpha в феврале 2026. Через пять дней Zhipu AI подтвердил, что это часть GLM-5.
Pareto Code Router в феврале 2026. Reasoning-модель для кодинга, всё ещё в стелсе.
Hunter Alpha появилась 11 марта 2026. 18 марта Xiaomi через свою AI-команду MiMo раскрыла, что это early build of MiMo-V2-Pro, триллионная модель. Перед раскрытием комьюнити сходило с ума: одни ставили на DeepSeek V4, другие на BAAI. В тестах Reuters модель сама о себе говорила: "Я китайская модель, обученная преимущественно на китайском". Не помогло. Никто не угадал Xiaomi.
Healer Alpha в марте 2026. Тоже Xiaomi MiMo, омни-модальный вариант.
Elephant Alpha в середине апреля 2026. 100B параметров, 256K контекст. Личность пока скрыта.
Owl Alpha 28-30 апреля 2026. Та самая. Контекст в 4 раза больше, чем у Elephant. Личность снова загадка.
Закономерность простая: от появления stealth-модели до раскрытия проходит 5-15 дней. К середине мая мы, скорее всего, узнаем, что такое Owl на самом деле.
Кто стоит за Owl
Чистых доказательств нет. Есть зацепки.
За OpenAI: OpenRouter с ними уже работал (Quasar превратился в GPT-4.1, Horizon оказался GPT-5). Формулировка "designed for agentic workloads" совпадает с маркетингом GPT-5.5 от 23 апреля. Модель явно тестируется на больших объёмах. 4.48B токенов за двое суток требуют серьёзной инфраструктуры. И главное: GPT-5.5 запустился неделю назад, OpenAI логично выкатить рядом мини-вариант или агентную модификацию.
За китайскую лабу: прецедент Hunter и Pony показывает, что Xiaomi и Zhipu активно используют OpenRouter как тестовую площадку. Zhipu готовит GLM-5.5, Xiaomi планирует MiMo-V3. Бесплатность плюс 1M контекст. Это стиль китайского pricing wars (DeepSeek V4 кодит за $3.48 за миллион, и это уже публичная цена).
За Anthropic: маловероятно. Anthropic исторически не пользовалась stealth-релизами, у них свой rollout через Claude.com и API. Хотя упоминание "Claude Code, OpenClaw compatible" подозрительное.
За Google: возможно, но Google обычно тестирует через AI Studio и собственные каналы.
Лично я ставлю на OpenAI или Alibaba. Логика такая: 1M контекст плюс focus на agentic workloads. И 4.48B токенов трафика за двое суток. Это либо OpenAI, либо кто-то с крупным data center. Ставлю $20 на Alibaba (Qwen3.6-Plus, ещё не выпущенный).
Как попробовать прямо сейчас
Минимальный пример на curl:
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "openrouter/owl-alpha",
"messages": [
{"role": "user", "content": "Напиши Python-функцию, которая разбирает CSV из URL и кэширует результат на диск"}
]
}'
Через OpenAI SDK на Python:
from openai import OpenAI client = OpenAI( base_url="https://openrouter.ai/api/v1", api_key="sk-or-v1-..." ) response = client.chat.completions.create( model="openrouter/owl-alpha", messages=[{"role": "user", "content": "Implement quicksort in Rust"}], ) print(response.choices[0].message.content)
Если хочется проверить в Claude Code, подмени base URL и модель через переменные окружения:
export ANTHROPIC_BASE_URL="https://openrouter.ai/api" export ANTHROPIC_API_KEY="sk-or-v1-..." export ANTHROPIC_DEFAULT_OPUS_MODEL="openrouter/owl-alpha" claude
Только учти: Claude Code общается через Anthropic Messages API, OpenRouter транслирует в OpenAI-совместимый формат. Tool use работает не идеально через эту прокладку, особенно с нестандартными моделями. Лучше тестируй через прямой OpenAI SDK или claude-code-router от musistudio.
Подводные камни
Логирование промптов и ответов. Прямо на странице модели написано: "Prompts and completions may be logged by the provider and used to improve the model". Любой ваш код, который вы скармливаете Owl, может оказаться в обучающей выборке какой-то лабы. Для open-source проектов нормально. Для коммерческих кодовых баз нет.
Нет model card. Никаких бенчмарков, никаких safety evals, никаких сведений о тренировочных данных. Если упадёт на простой задаче, понять причину невозможно. Если выдаст галлюцинацию или хейт-спич, тоже непонятно, чья это вина.
Лимиты бесплатного тира OpenRouter. Для free-моделей действуют дневные лимиты: 50 запросов в день для аккаунтов с балансом ниже $10, до 1000 для тех, кто пополнил счёт. Документация эти лимиты не привязывает к stealth-моделям конкретно, но опыт с Hunter Alpha показал, что в пиковые дни upstream-провайдер просто отбрасывает запросы.
Нет SLA и обязательств. Stealth-модель может исчезнуть в любой момент. Когда Hunter Alpha вышла из тени, её просто переименовали в xiaomi/mimo-v2-pro. Если вы интегрировали openrouter/owl-alpha в продакшен, ждите сюрприза.
1M контекст не равно 1M внимания. Исследование Chroma про context rot показало: качество ответов LLM начинает деградировать уже после 30-50% заполнения контекста. Если модель утверждает 1M, реальное полезное окно 200-400K. Не строй архитектуру под полный миллион, пока не прогнал тесты на длинных документах.
Tool use заявлен, но не оттестирован публично. "Native tool use" — пока что маркетинг. Будет ли Owl Alpha вызывать функции с правильным JSON-форматом, попадёт ли в схему, не запутается ли в цепочке из 15 вызовов? Узнаем через неделю по постам на Reddit.
Альтернативы
Elephant Alpha. Соседний stealth от OpenRouter, появился в середине апреля. 100B параметров, 256K контекст. Тоже бесплатно. Меньше окно, зато статистика накопилась, и риск ниже.
Qwen3.6-Plus от Alibaba. Публичная open-source модель, доступна на OpenRouter с лимитами. 200K контекст, MIT-лицензия, никакого логирования промптов. Слабее на long-context, но прозрачнее.
Gemma 4 от Google. Open-weights под Apache 2.0, можно запускать локально. Меньше параметров и контекст, зато ваши данные никуда не уйдут.
Claude Haiku 4.5 от Anthropic. Официальная, платная (~$1 за миллион входных), 200K контекст, гарантированный uptime. Если нужен production, бери её, а Owl используй только для прототипа.
Вердикт
Если хочешь бесплатно потестить агентную модель с миллионом токенов контекста, заходи прямо сейчас. К пятнице-субботе Owl, скорее всего, выйдет из стелса и либо станет платной, либо просто исчезнет. Окно для бесплатных тестов закрывается.
В продакшен не тащи. Логирование промптов и отсутствие model card делают такое решение рискованным. Прототип на Owl, продакшен на Claude Haiku или GPT-5.4 mini.
Если просто следишь за индустрией, добавь openrouter/owl-alpha в свой тестовый набор и прогони на нём свои любимые prompts. Через неделю сравни с тем, что объявит выпустившая её лаба. Это самый надёжный способ понять, кто реально кодит модели, а кто пыжится с маркетинговым материалом.
Как попробовать за 5 минут
- Зарегистрируйся на openrouter.ai/keys и создай API-ключ.
- Установи openai SDK:
pip install openaiилиnpm install openai. - Запусти один из примеров кода выше с
model: "openrouter/owl-alpha". - Прогони на нём 3-5 типичных задач из своего рабочего пайплайна. Реальный код, реальный RAG. Особенно tool use.
- Сравни результат с Claude Opus 4.7 или GPT-5.5. Если Owl не отстаёт, модель готова к ставке на её родителей.
Анонс от OpenRouter появился вчера в твиттере OpenRouter. Дискорд для обсуждения: discord.gg/fVyRaUDgxW.