> diffnotes · 01 May 2026 · обновлено 15 Jul 2026 · 8 мин

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

ai agents llm openrouter stealth-models owl-alpha

// TL;DR

Owl Alpha — четвёртая за два месяца stealth-модель на OpenRouter (добавлена 30 апреля): 1 млн токенов контекста, output до 262K, нативный tool use и нулевая цена. Создатель не раскрыт; прошлые анонимы площадки оказывались GPT-4.1, GLM-5 и Xiaomi MiMo, раскрытие обычно занимает 5–15 дней. За двое суток модель обработала 4,48 млрд токенов. Провайдер логирует промпты и ответы, поэтому для продакшена и чувствительного кода она не подходит — только для бесплатных прототипов.

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

Вчера, 30 апреля, OpenRouter добавил в каталог ещё одного анонимного гостя. Имя: Owl Alpha. Создатель не указан. Контекст: 1 048 756 токенов (округлим до 1M). Цена: ноль за вход, ноль за выход. Заточена под агентные задачи, заявлена совместимость с Claude Code и OpenClaw.

TL;DR: Owl Alpha стала четвёртой stealth-моделью на OpenRouter за два месяца. 1M контекст, бесплатно, заточена под tool use и длинные цепочки рассуждений. Прошлые анонимы оказались GPT-4.1 и GLM-5. Один даже Xiaomi MiMo для разнообразия. Логирование промптов включено, в продакшен такое тащить не стоит. Зато для прототипа на 1M контексте это золото.

Что в спеке

С страницы openrouter.ai/openrouter/owl-alpha:

Контекст: 1 048 756 токенов
Максимальный output: 262 144 токена за один ответ. Это много: обычно у моделей этот лимит 32K-64K, а у Owl 262K
Цена: $0/M входных, $0/M выходных
Входы: только текст. Картинки и аудио не поддерживаются
Tool use: есть, нативный
Reasoning mode: не отдельная опция. Скорее всего, обычный direct-режим
Логирование: да, провайдер логирует промпты и ответы для дообучения

За первые двое суток модель уже обработала 4.48 миллиарда токенов. Её активно используют, и явно не один-два разработчика на любительских проектах.

Stealth-модели на OpenRouter превратились в отдельный жанр

OpenRouter регулярно публикует анонимные модели от партнёрских лабораторий. Не маркетинг, а способ собрать честные отзывы без эффекта бренда. Хронология за последний год:

Quasar Alpha появилась в апреле 2025. Через несколько недель раскрылась как GPT-4.1 от OpenAI.

Sonoma Sky/Dusk Alpha запустились в сентябре 2025. 2M контекст, бесплатно. Связь с конкретной лабораторией так и не подтвердилась.

Horizon Alpha в июле 2025. Alex из OpenRouter подтвердил в Discord, что это early checkpoint семейства GPT-5.

Polaris Alpha в ноябре 2025. 256K контекст, агентные задачи. Личность скрыта до сих пор.

Pony Alpha в феврале 2026. Через пять дней Zhipu AI подтвердил, что это часть GLM-5.

Pareto Code Router в феврале 2026. Reasoning-модель для кодинга, всё ещё в стелсе.

Hunter Alpha появилась 11 марта 2026. 18 марта Xiaomi через свою AI-команду MiMo раскрыла, что это early build of MiMo-V2-Pro, триллионная модель. Перед раскрытием комьюнити сходило с ума: одни ставили на DeepSeek V4, другие на BAAI. В тестах Reuters модель сама о себе говорила: "Я китайская модель, обученная преимущественно на китайском". Не помогло. Никто не угадал Xiaomi.

Healer Alpha в марте 2026. Тоже Xiaomi MiMo, омни-модальный вариант.

Elephant Alpha в середине апреля 2026. 100B параметров, 256K контекст. Личность пока скрыта.

Owl Alpha 28-30 апреля 2026. Та самая. Контекст в 4 раза больше, чем у Elephant. Личность снова загадка.

Закономерность простая: от появления stealth-модели до раскрытия проходит 5-15 дней. К середине мая мы, скорее всего, узнаем, что такое Owl на самом деле.

Кто стоит за Owl

Чистых доказательств нет. Есть зацепки.

За OpenAI: OpenRouter с ними уже работал (Quasar превратился в GPT-4.1, Horizon оказался GPT-5). Формулировка "designed for agentic workloads" совпадает с маркетингом GPT-5.5 от 23 апреля. Модель явно тестируется на больших объёмах. 4.48B токенов за двое суток требуют серьёзной инфраструктуры. И главное: GPT-5.5 запустился неделю назад, OpenAI логично выкатить рядом мини-вариант или агентную модификацию.

За китайскую лабу: прецедент Hunter и Pony показывает, что Xiaomi и Zhipu активно используют OpenRouter как тестовую площадку. Zhipu готовит GLM-5.5, Xiaomi планирует MiMo-V3. Бесплатность плюс 1M контекст. Это стиль китайского pricing wars (DeepSeek V4 кодит за $3.48 за миллион, и это уже публичная цена).

За Anthropic: маловероятно. Anthropic исторически не пользовалась stealth-релизами, у них свой rollout через Claude.com и API. Хотя упоминание "Claude Code, OpenClaw compatible" подозрительное.

За Google: возможно, но Google обычно тестирует через AI Studio и собственные каналы.

Лично я ставлю на OpenAI или Alibaba. Логика такая: 1M контекст плюс focus на agentic workloads. И 4.48B токенов трафика за двое суток. Это либо OpenAI, либо кто-то с крупным data center. Ставлю $20 на Alibaba (Qwen3.6-Plus, ещё не выпущенный).

Как попробовать прямо сейчас

Минимальный пример на curl:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openrouter/owl-alpha",
    "messages": [
      {"role": "user", "content": "Напиши Python-функцию, которая разбирает CSV из URL и кэширует результат на диск"}
    ]
  }'

Через OpenAI SDK на Python:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-..."
)

response = client.chat.completions.create(
    model="openrouter/owl-alpha",
    messages=[{"role": "user", "content": "Implement quicksort in Rust"}],
)
print(response.choices[0].message.content)

Если хочется проверить в Claude Code, подмени base URL и модель через переменные окружения:

export ANTHROPIC_BASE_URL="https://openrouter.ai/api"
export ANTHROPIC_API_KEY="sk-or-v1-..."
export ANTHROPIC_DEFAULT_OPUS_MODEL="openrouter/owl-alpha"

claude

Только учти: Claude Code общается через Anthropic Messages API, OpenRouter транслирует в OpenAI-совместимый формат. Tool use работает не идеально через эту прокладку, особенно с нестандартными моделями. Лучше тестируй через прямой OpenAI SDK или claude-code-router от musistudio.

Подводные камни

Логирование промптов и ответов. Прямо на странице модели написано: "Prompts and completions may be logged by the provider and used to improve the model". Любой ваш код, который вы скармливаете Owl, может оказаться в обучающей выборке какой-то лабы. Для open-source проектов нормально. Для коммерческих кодовых баз нет.

Нет model card. Никаких бенчмарков, никаких safety evals, никаких сведений о тренировочных данных. Если упадёт на простой задаче, понять причину невозможно. Если выдаст галлюцинацию или хейт-спич, тоже непонятно, чья это вина.

Лимиты бесплатного тира OpenRouter. Для free-моделей действуют дневные лимиты: 50 запросов в день для аккаунтов с балансом ниже $10, до 1000 для тех, кто пополнил счёт. Документация эти лимиты не привязывает к stealth-моделям конкретно, но опыт с Hunter Alpha показал, что в пиковые дни upstream-провайдер просто отбрасывает запросы.

Нет SLA и обязательств. Stealth-модель может исчезнуть в любой момент. Когда Hunter Alpha вышла из тени, её просто переименовали в xiaomi/mimo-v2-pro. Если вы интегрировали openrouter/owl-alpha в продакшен, ждите сюрприза.

1M контекст не равно 1M внимания. Исследование Chroma про context rot показало: качество ответов LLM начинает деградировать уже после 30-50% заполнения контекста. Если модель утверждает 1M, реальное полезное окно 200-400K. Не строй архитектуру под полный миллион, пока не прогнал тесты на длинных документах.

Tool use заявлен, но не оттестирован публично. "Native tool use" — пока что маркетинг. Будет ли Owl Alpha вызывать функции с правильным JSON-форматом, попадёт ли в схему, не запутается ли в цепочке из 15 вызовов? Узнаем через неделю по постам на Reddit.

Альтернативы

Elephant Alpha. Соседний stealth от OpenRouter, появился в середине апреля. 100B параметров, 256K контекст. Тоже бесплатно. Меньше окно, зато статистика накопилась, и риск ниже.

Qwen3.6-Plus от Alibaba. Публичная open-source модель, доступна на OpenRouter с лимитами. 200K контекст, MIT-лицензия, никакого логирования промптов. Слабее на long-context, но прозрачнее.

Gemma 4 от Google. Open-weights под Apache 2.0, можно запускать локально. Меньше параметров и контекст, зато ваши данные никуда не уйдут.

Claude Haiku 4.5 от Anthropic. Официальная, платная (~$1 за миллион входных), 200K контекст, гарантированный uptime. Если нужен production, бери её, а Owl используй только для прототипа.

Вердикт

Если хочешь бесплатно потестить агентную модель с миллионом токенов контекста, заходи прямо сейчас. К пятнице-субботе Owl, скорее всего, выйдет из стелса и либо станет платной, либо просто исчезнет. Окно для бесплатных тестов закрывается.

В продакшен не тащи. Логирование промптов и отсутствие model card делают такое решение рискованным. Прототип на Owl, продакшен на Claude Haiku или GPT-5.4 mini.

Если просто следишь за индустрией, добавь openrouter/owl-alpha в свой тестовый набор и прогони на нём свои любимые prompts. Через неделю сравни с тем, что объявит выпустившая её лаба. Это самый надёжный способ понять, кто реально кодит модели, а кто пыжится с маркетинговым материалом.

Как попробовать за 5 минут

Зарегистрируйся на openrouter.ai/keys и создай API-ключ.
Установи openai SDK: pip install openai или npm install openai.
Запусти один из примеров кода выше с model: "openrouter/owl-alpha".
Прогони на нём 3-5 типичных задач из своего рабочего пайплайна. Реальный код, реальный RAG. Особенно tool use.
Сравни результат с Claude Opus 4.7 или GPT-5.5. Если Owl не отстаёт, модель готова к ставке на её родителей.

Анонс от OpenRouter появился вчера в твиттере OpenRouter. Дискорд для обсуждения: discord.gg/fVyRaUDgxW.