> · 8 мин

Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас

Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас

Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас

11 марта 2026 на OpenRouter появились две модели без имени провайдера: Hunter Alpha и Healer Alpha. Оба стелса: триллион параметров у одного, omni-modal у второго. За ноль долларов. К 18 марта Xiaomi признал, что Hunter Alpha это их MiMo-V2-Pro. 13 апреля подъехал третий: Elephant Alpha от «известной open-модельной лаборатории», 100B параметров, 250 токенов в секунду.

Что это, как подключить и на что наступаешь по дороге.

TL;DR: 3 бесплатные frontier-модели доступны на OpenRouter через обычный OpenAI-совместимый API. Hunter Alpha это Xiaomi MiMo-V2-Pro с 1M контекстом, Healer Alpha омни-модал с поддержкой видео и аудио, Elephant Alpha быстрый 100B для кода. Все логируют промпты, у всех лимит 200 запросов в день, и любая может стать платной без предупреждения.

Зачем лабы вообще выкатывают модели анонимно

Стелс-релиз это A/B-тест с реальными пользователями. Провайдер смотрит на сырые цифры: сколько токенов прошло через модель, какие вопросы её ломают, где она лучше Claude на слепой оценке. Никаких ожиданий от бренда, никакой заведомой лояльности к OpenAI или Anthropic.

Прецеденты уже были:

  • Quasar Alpha превратился в GPT-4.1 (OpenAI засветилась через месяц)
  • Horizon Alpha оказался GPT-5 (тот же приём)
  • Pony Alpha был GLM-5 от Zhipu AI (всплыло через 5 дней)
  • Hunter Alpha разоблачили как Xiaomi MiMo-V2-Pro (7 дней инкогнито)

Второй бонус: давление на ценообразование. Anonymous 100B кидает бесплатные токены на OpenRouter, и премиальные лабы скребут затылки. По данным asksurf.ai, Elephant Alpha за первые дни попал в #1 среди моделей на платформе и давит на цены OpenAI и Anthropic на 20-30%.

Hunter Alpha = Xiaomi MiMo-V2-Pro

Сухие цифры:

  • Параметры: ~1T общих, 42B активных (MoE)
  • Контекст: 1 048 576 токенов — поместится 700K слов, целый репозиторий средней руки
  • Скорость: ~48 токенов в секунду (16-й перцентиль, то есть медленно)
  • Архитектура: Hybrid Attention 7:1, Multi Token Prediction
  • Бенчмарки: 96% reasoning, 95% math, 93% coding, 100% instruction following (по данным popularaitools.ai от 15 марта 2026)
  • Цена после выхода из стелса: $1/$3 за миллион токенов до 256K, $2/$6 сверх, то есть пятая часть стоимости Claude Opus 4.6
  • Доступ через OpenRouter (пока бесплатно): xiaomi/mimo-v2-pro или openrouter/hunter-alpha

За первую неделю модель прожевала 160 миллиардов токенов в стелс-режиме. Пользователи не знали, кого тестируют, и всё равно гнали нагрузку.

Где реально хороша: длинные документы и codebase review, плюс агентные цепочки в OpenClaw, где MiMo-V2-Pro топит PinchBench и ClawEval. В Reddit-треде r/LocalLLaMA один пользователь пишет, что Hunter Alpha с OpenClaw работает в 10 раз лучше MiniMax 2.5.

Где сливает: скорость. 48 tok/s не для интерактивной беседы. Плюс странный баг: модель набирает 96% на reasoning-бенчмарках, но иногда косячит на базовой арифметике. Цепочка рассуждений у неё начинается с «Hmm, the user said…», один из фингерпринтов, по которым её изначально подозревали в родстве с DeepSeek.

Healer Alpha: omni-modal, провайдер до сих пор неизвестен

  • Параметры: не раскрыты (оценка сообщества ~500B активных)
  • Контекст: 262 144 токенов (262K)
  • Скорость: ~93 tok/s, почти в 2 раза быстрее Hunter Alpha
  • Входы: текст, изображения, аудио, видео
  • Цена: 0 за всё
  • Доступ: openrouter/healer-alpha

Кто за ней стоит — до сих пор открытый вопрос. Модель при запросе говорит «built by Xiaomi», но AI-модели врут про собственное происхождение как сивый мерин. Самая убедительная версия от popularaitools.ai: это Zhipu AI, потому что тот же аккаунт на OpenRouter уже сдал им Pony Alpha (GLM-5). Скорее всего Healer Alpha это GLM-5V или новый мультимодальный вариант.

Где хороша: быстрые UI-дашборды, анализ скриншотов, разбор видеокадров. Тесты popularaitools.ai показали, что она генерит чистый production-grade HTML с первого захода. Нужно прототипировать интерфейс по макету: берите Healer Alpha вместо Claude, выйдет быстрее.

Где слабая: меньший контекст, ограниченный tool use. Для длинных агентных цепочек не подходит.

Elephant Alpha: 100B, 250 tok/s, появился 13 апреля

Самый свежий стелс. Kilo анонсировал его 13 апреля, параллельно он засветился на OpenRouter под openrouter/elephant-alpha.

  • Параметры: 100B (вероятно sparse MoE, подтверждения нет)
  • Контекст: 262 144 токенов, max output 32K
  • Скорость: ~250 tok/s, в 5 раз быстрее Hunter
  • Функции: prompt caching, function calling, structured output
  • Цена: 0 на период preview
  • Доступ: openrouter/elephant-alpha, Kilo CLI, VS Code extension, KiloClaw

Kilo описывает провайдера как «prominent open model lab», что намекает на открытые веса в перспективе. Позиционирование: «snappy daily driver» для быстрого автодополнения кода и массовой обработки документов. Сообщество ставит на MoE-архитектуру из-за дикой скорости при 100B параметров. На бенчмарках пока молчат, потому что документации ноль.

Где хорош прямо сейчас: code completion и разбор больших dependency-деревьев. Kilo рекомендует его для KiloClaw, агента, который бегает по свежим research-отчётам и превращает их в LinkedIn-посты.

Где ломается: Reddit-треды r/openrouter и r/ArtificialInteligence отмечают две проблемы. Неанглоязычные запросы обрабатываются слабо (русский и испанский регулярно бьются). Tool calls фейлятся чаще, чем у Claude или GPT на тех же промптах. Модель не для production-агентов, пока не выйдет из стелса.

Как подключиться за 2 минуты

Всё это работает через обычный OpenAI SDK с переопределённым base URL. Никаких отдельных библиотек не нужно.

Шаг 1. Аккаунт на OpenRouter. Идёте на openrouter.ai, логинитесь через GitHub или Google. Кредитная карта не требуется, free-модели реально бесплатные.

Шаг 2. Получаете API-ключ. В разделе Keys нажимаете Create Key, копируете sk-or-v1-....

Шаг 3. Python-пример с Hunter Alpha:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

response = client.chat.completions.create(
    model="openrouter/hunter-alpha",  # или xiaomi/mimo-v2-pro
    messages=[
        {"role": "user", "content": "Проанализируй этот репозиторий..."}
    ],
    extra_body={"reasoning": {"effort": "high"}}  # включаем цепочку рассуждений
)

print(response.choices[0].message.content)
# Reasoning-цепочка доступна в response.choices[0].message.reasoning_details

Шаг 4. curl для быстрого теста Elephant Alpha:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer sk-or-v1-YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openrouter/elephant-alpha",
    "messages": [{"role": "user", "content": "Refactor this function..."}]
  }'

Шаг 5. Подключение к Claude Code. В ~/.claude/settings.json добавляете modelOverrides с OpenRouter endpoint, и Claude Code начинает гонять запросы через любую stealth-модель. Официальная документация OpenRouter подтверждает совместимость на OpenAI-compatible endpoint.

Подводные камни

Пункты, которые не пишут в красивых анонсах.

1. Все промпты логируются. OpenRouter в карточке моделей прямо пишет: «all prompts and completions are logged by the provider». Никакого NDA, никакого контроля данных. Вы бесплатно тренируете чью-то будущую модель. Про коммерческую тайну и персональные данные забудьте.

2. Лимиты 20 запросов в минуту, 200 в день. Для experimentation хватит, для production нет. После 200-го запроса ждёте до полуночи UTC или кладёте $10 кредита на OpenRouter, что переводит free-модели в paid-тариф.

3. Провайдер может снять модель в любой момент. Horizon Alpha исчез из OpenRouter за 24 часа до официального анонса GPT-5. Hunter Alpha после реализации стал платным на прямом API Xiaomi. План зависимости от stealth-модели в продуктовом коде это план боли.

4. Китайская цензура. Hunter Alpha и (вероятно) Healer Alpha — китайские модели. В системном промпте у Hunter Alpha находили фразу «strictly comply with Chinese laws and regulations». На вопросы про Тяньаньмэнь, Тайвань или определённых персоналий модель уходит в отказ.

5. Бенчмарки != реальность у Hunter Alpha. 96% reasoning на бумаге это прекрасно, но тестеры popularaitools.ai зафиксировали провалы на простых арифметических задачах. Ставите модель в production, тестируйте на своих кейсах, а не доверяйте цифрам из таблицы.

6. Elephant ломается на неанглийских языках и tool calls. Для русскоязычных промптов и агентных workflow с инструментами это не рабочая лошадь. Автодополнение кода, да. Агент, который должен вызывать 10 tools подряд, нет.

7. Скорость Hunter Alpha. 48 tok/s это как вчитывать текст со скоростью очень медленного человека. Ожидание ответа на 1000-токенный output растянется секунд на 20-25. Для интерактивной работы слишком медленно.

Вердикт

Из трёх моделей прямо сейчас практическую пользу извлечь можно так. Hunter Alpha (Xiaomi MiMo-V2-Pro) берите для задач с гигантским контекстом (целый репозиторий, книга в PDF) и длинных цепочек рассуждений, где качество важнее скорости. Healer Alpha для прототипирования UI по скриншоту или анализа видео, пока она бесплатна. Elephant Alpha для быстрого автодополнения на английских codebase, если вас устраивает нестабильный tool calling.

Ни одна из трёх не годится для production, пока их провайдер не признался публично. Честный use case: эксперимент на personal-проектах плюс сбор данных для сравнения с Claude и GPT. И hunting за сделкой, когда модель официально выйдет с хорошей ценой.

Как попробовать прямо сейчас

  1. Создайте аккаунт на openrouter.ai (2 минуты, без карты)
  2. Получите API-ключ в разделе Keys
  3. Скопируйте Python-пример выше и замените YOUR_KEY_HERE
  4. Попробуйте три промпта для сравнения:
    • Hunter Alpha: пастите туда файл на 500 строк кода и попросите рефакторинг
    • Healer Alpha: скриньте дашборд и попросите сгенерировать HTML
    • Elephant Alpha: попросите написать 10 unit-тестов для функции
  5. Сравните результат с тем, что даёт ваш текущий Claude или GPT на тех же промптах

Если работает, закладывайте экономию. Если не работает, вы знаете, что такое stealth-модели, и в следующий раз не поведётесь на хайп.

$ ls ./related/

Похожие статьи

claude-code-token-tips.md
70% токенов Claude Code уходит на мусор — 8 приёмов, которые это исправляют
> · 8 мин

70% токенов Claude Code уходит на мусор — 8 приёмов, которые это исправляют

Написание кода — самая дешёвая часть работы с Claude Code. 70% токенов уходит на невидимый контекстный оверхед: историю разговора, неиспользуемые MCP-серверы, раздутый CLAUDE.md. 8 конкретных приёмов с числами — от .claudeignore за 2 минуты до бага с кешированием, который незаметно умножает стоимость в 10 раз.

ai claude-code productivity tips
claude-opus-47-sonnet-48-leak.md
Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах
> · 10 мин

Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах

Двойная утечка кода Anthropic раскрыла Opus 4.7, Sonnet 4.8 и новый тир Capybara выше Opus. Одновременно директор AI в AMD доказала деградацию Opus 4.6 данными из 6852 сессий: reasoning упал на 67%, расходы выросли в 122 раза. Разбираем что произошло, зачем нерфить модель и как починить.

ai llm claude anthropic
microsoft-agent-framework-10.md
Microsoft Agent Framework 1.0 — один pip install вместо Semantic Kernel и AutoGen, и ваши MCP-серверы теперь работают из .NET
> · 6 мин

Microsoft Agent Framework 1.0 — один pip install вместо Semantic Kernel и AutoGen, и ваши MCP-серверы теперь работают из .NET

Microsoft выпустила Agent Framework 1.0 — эволюцию Semantic Kernel и AutoGen в одном пакете. Python, .NET, MCP из коробки, мульти-агентная оркестрация и коннекторы для Claude, GPT, Gemini, Ollama. Разбираем код, грабли и 766 багов.

ai agents open-source mcp
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe