> · 9 мин

Grok 4.3 — 53 балла на Intelligence Index, $1.25 за миллион токенов и регрессия в агентах. xAI выкатил модель, пока Маск судится с Altman'ом

Grok 4.3 — 53 балла на Intelligence Index, $1.25 за миллион токенов и регрессия в агентах. xAI выкатил модель, пока Маск судится с Altman'ом

Пока Маск с Altman'ом ругаются в суде, xAI тихо выкатил Grok 4.3. Новая reasoning-модель впервые за год вернула xAI на Pareto frontier. По цене. По интеллекту нет, до GPT-5.5 ещё далеко.

TL;DR: Grok 4.3 — 53 балла на Artificial Analysis Intelligence Index, $1.25 за миллион входных токенов и $2.50 за выходные. На 40-60% дешевле Grok 4.20 при +4 баллах интеллекта. Reasoning встроен и не отключается. Контекст 1M, плюс клонирование голоса за минуту через Custom Voices. Слабые места: ProofBench всего 11%, регрессия в Vending-Bench, и модель платно «думает» даже на «привет».

Что вышло за выходные

xAI выкатил Grok 4.3 в ночь на 1 мая. Модель доступна через API, OpenRouter и подписки SuperGrok ($30/мес) и X Premium+ ($40/мес).

Цифры:

  • 53 балла на Artificial Analysis Intelligence Index, выше Claude Sonnet 4.6 (52) и Muse Spark (52)
  • $1.25 / $2.50 за миллион токенов (input/output) до 200K, дальше цена удваивается
  • 1M токенов контекста, без лимита на output
  • 209 токенов/сек, одна из самых быстрых reasoning-моделей в топе
  • Knowledge cutoff: декабрь 2025

Бенчмарк-набор Artificial Analysis обошёлся в $395 за полный прогон, на 20% дешевле Grok 4.20, при том что модель сжирает на 44% больше токенов. То есть xAI снизил цену сильнее, чем выросла «болтливость» reasoning-режима.

Grok 4.3 на графике Intelligence vs Price

CEO Abacus AI Bindu Reddy одной фразой описала позиционирование: «as smart as Sonnet 4.6 and 5x cheaper and faster». Цифры почти бьются. Sonnet 4.6 стоит $3 / $15, Grok 4.3 даёт сопоставимый интеллект за $1.25 / $2.50.

Always-on reasoning, никаких effort levels

Главное архитектурное изменение Grok 4.3: reasoning нельзя отключить. Не toggle, не effort level, не dial. Модель «думает» перед каждым ответом, всегда.

Это не про маркетинг. На уровне API параметра reasoning_effort просто нет. Если у тебя приложение, где половина запросов это банальные «исправь опечатку» или «переведи на английский», ты всё равно платишь за reasoning-токены. И они тарифицируются как обычные completion-токены, то есть в полную цену.

Сравнение: Claude Sonnet 4.6 умеет работать в Adaptive Reasoning, OpenAI у GPT-5.5 даёт reasoning_effort: low/medium/high. У Grok 4.3 только high, по умолчанию и навсегда.

Плюс: модель показывает сильные результаты на инструкциях. 98% на τ²-Bench Telecom (наравне с GLM-5.1), 81% на IFBench. На GDPval-AA взлёт с 1179 до 1500 ELO, рост на 321 пункт, обходит Gemini 3.1 Pro Preview, Muse Spark и GPT-5.4 mini. Vals AI поставила Grok 4.3 на #1 по CaseLaw v2 (79.3%) и #1 по CorpFin. Юридический и финансовый ризонинг подскочил на 25 баллов.

Минус: ты платишь за «думать» там, где модель должна была просто ответить.

Что Grok 4.3 теперь делает руками

VentureBeat собрал реальные примеры из early access. Это не пресс-релиз xAI, это что люди реально делают.

  • Excel. Модель потратила 6 минут 22 секунды в фазе reasoning, чтобы собрать DPS-калькулятор для OSRS Sailing Combat. Не таблица, а multi-sheet файл с листом Reference_Data, листом DPS_Calculator с автоформулами и вкладкой со сценариями.
  • PDF. 12-страничные отчёты по продуктам SpaceX. С брендингом, логотипами, hero-изображениями и структурированными таблицами. Не markdown в скобках, а готовый документ.
  • PowerPoint. 9-слайдовые презентации с «sandwich structure» (тёмные титры/выводы, светлый контент), data-driven матрицами решений и шутками.

Серверные тулы, которые модель сама зовёт по необходимости:

  • Web и X Search: обход knowledge cutoff через прямой поиск в твиттере
  • Code Execution: Python в песочнице
  • File and Collections Search: встроенный RAG поверх загруженных документов

У Claude и GPT эти тулы в основном в Code Interpreter и web_search, но без X-данных и без интеграции с Premium-аккаунтом, которая у Grok идёт из коробки.

Custom Voices — клон твоего голоса за минуту

Параллельно с моделью xAI выкатил Custom Voices, voice cloning по короткому образцу. Читаешь несколько случайных абзацев, через минуту-две у тебя клон собственного голоса с правильным произношением новых слов.

Карл Францен из VentureBeat протестировал и описал как «звучит жутко идентично мне».

Цены ломают ElevenLabs:

  • Grok Voice Agent (grok-voice-think-fast-1.0): $3.00 в час, $0.05 в минуту
  • ElevenLabs Pro: ~$10.80 в час
  • Play.ht: ~$12 в час
  • OpenAI TTS HD: ~$1.80 в час, но без клонирования голоса

Grok Voice Agent ровно посередине: дороже OpenAI TTS, в 3-4 раза дешевле ElevenLabs. Standalone TTS стоит $4.20 за миллион символов, STT $0.20/час streaming или $0.10/час batch.

Лимит до 30 кастомных голосов на команду. Программный API POST /v1/custom-voices пока только для Enterprise. Обычный API даёт доступ только к встроенным голосам (Eve, Ara, Rex, Sal, Leo). Каждый кастомный голос «scoped to your team», другие пользователи xAI его не видят.

Подводные камни

Hacker News за четыре часа набрал 184 балла и 235 комментариев. Реакция полярная.

Narcolepsy в агентах. Andon Labs запустили Grok 4.3 на Vending-Bench 2, симуляции, где модель управляет торговым автоматом, и зафиксировали «big regression». Цитата: «narcolepsy problems, prefers to remain inactive for multiple simulation days rather than taking the required actions». Always-on reasoning переусложняет простое решение «купить колу за $2 и продать за $3», и модель буквально засыпает на несколько симуляционных дней.

ProofBench 11%. Vals AI отметили, что Grok 4.3 хорош в legal/finance, но плох в сложной математике. 11% на ProofBench, регрессия в general coding. Если строишь агента для math-heavy задач, это не та модель.

$0.05 за заблокированный запрос. xAI ввёл «Usage Guideline Violation Fee»: пять центов за каждый запрос, который заблокировал safety filter до генерации. То есть ты платишь за то, что модель тебе отказала. Беспрецедентная история. Конкуренты блокируют молча и без счёта.

Higher context pricing на 200K. Цены $1.25 / $2.50 действуют только до 200K токенов. Выше удваиваются. Для агентов с большим контекстом или длинных документов это ощутимо: миллионный контекст в полной цене стоит $2.50 / $5.00, уже ближе к Sonnet.

Reasoning токены в полную цену. Внутренние «размышления» модели биллятся как обычный output. На простом запросе ты можешь получить 300 токенов ответа и 1500 reasoning-токенов в счёте. Фактически модель в 5-6 раз дороже на коротких задачах.

Память не работает. Реддиторы жалуются годами: у Grok нет persistent memory между сессиями. ChatGPT Plus умеет с 2023, Claude Projects с 2024. Платишь $30-300 в месяц, модель забывает тебя при каждом старте.

Verbosity. Чтобы прогнать Intelligence Index, Grok 4.3 сжёг 88M токенов против 35M в среднем у конкурентов. Объективно болтливее. На API это означает, что output-токены закроют большую часть твоего бюджета.

Алайнмент с Маском. Один из пользователей нашёл в системном промпте Grok 4.3 строку «you do not assign broad positive/negative utility functions to groups of people». Менее жёстко, чем известный кейс с Grok 4, где модель сверялась с твитами Маска. Но энтерпрайзу всё ещё есть о чём подумать перед интеграцией.

Альтернативы

  • Claude Sonnet 4.6: 52 на Intelligence Index ($3/$15). Лучше для чистого кодинга и творческих задач, есть Adaptive Reasoning (можно отключить), есть Projects-память. Но в 2.4× дороже на input и в 6× на output.
  • GPT-5.5 (xhigh): 60 на Intelligence Index ($5/$30). Топ по интеллекту и Terminal-Bench (82.7%), но в 4× дороже Grok 4.3 по input и в 12× по output. Для бюджетного агента не вариант.
  • Kimi K2.6: 54 на Intelligence Index ($1.7 blended), open weights. Если нужен локальный или дешёвый proxy, Kimi сейчас обходит Grok 4.3 по цене и интеллекту, но без websearch и тулов.
  • GLM-5.1: 98% на τ²-Bench Telecom (как у Grok 4.3), open weights, в 3-5 раз дешевле, но без агент-первой инфраструктуры xAI.
  • ElevenLabs для voice cloning: качество чуть выше Grok, но в 3-4 раза дороже. Если у тебя not enterprise и не Premium+, единственный реальный вариант с программным доступом.

Вердикт

Бери Grok 4.3 если: строишь агента в legal или finance, там +25 пунктов и #1 на CaseLaw/CorpFin не врут; нужен миллионный контекст за реальные деньги (Sonnet с 1M стоит $6/$22.50, Grok даёт то же за $2.50/$5); voice cloning для энтерпрайза без ElevenLabs-цен.

Не бери если: пишешь математического агента (ProofBench 11% это провал); нужен агент в симуляции или RPA (narcolepsy ставит крест); большая часть запросов это короткие диалоги, где платить за always-on reasoning неоправданно дорого; не готов платить $0.05 каждый раз, когда safety filter сработал.

Подождать стоит, если используешь долгую сессионную память. Её всё ещё нет, и xAI её не обещает в roadmap.

Как попробовать

  1. Подписаться на SuperGrok ($30/мес) или X Premium+ ($40/мес, первые 2 месяца со скидкой 50%). Получишь UI-доступ с web search, code execution и Custom Voices.
  2. Получить ключ на docs.x.ai или через OpenRouter. Модель там называется grok-4.3. На OpenRouter можно сравнивать с другими моделями в одной игровой площадке.
  3. Прогнать на своих задачах три теста: длинный документ (≥200K токенов), agentic-сценарий с tool use и короткий диалог. Сравнить с текущей моделью. Если выигрыш в стоимости перекрывает регрессии, можно мигрировать.
  4. Для voice cloning зайти на console.x.ai/voice/voice-library, записать 1-2 минуты речи, забрать voice_id и тестировать через TTS API. Программный доступ к клонированию только Enterprise, но UI открыт всем.
$ ls ./related/

Похожие статьи

openrouter-stealth-models-guide.md
Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас
> · 8 мин

Hunter, Healer, Elephant: 3 секретные AI-модели на OpenRouter, бесплатные прямо сейчас

Hunter Alpha оказался Xiaomi MiMo-V2-Pro, Healer Alpha до сих пор анонимный, Elephant Alpha появился 13 апреля. Все три frontier-модели бесплатные на OpenRouter. Как подключить через OpenAI SDK за 2 минуты, где каждая сливает, и почему логи промптов это не мелочь.

ai tips openrouter stealth-models
claude-mythos-anthropic-stealth-model.md
Claude Mythos — модель, которую Anthropic прячет от тебя. И правильно делает
> · 9 мин

Claude Mythos — модель, которую Anthropic прячет от тебя. И правильно делает

Две недели назад Anthropic случайно спалил существование своей самой мощной модели. Claude Mythos Preview нашла тысячи 0-day в OpenBSD, FFmpeg и ядре Linux. Публично не будет. Зачем это знать разработчику.

ai llm claude anthropic
april-2026-llm-flood.md
Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел
> · 8 мин

Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел

8+ моделей за две недели: GLM-5.1 под MIT бьёт GPT-5.4 на SWE-Bench Pro, Claude Mythos закрыт за 50 компаниями, Gemma 4 тянется на телефоне, а GPT-6 Spud должен был выйти 14 апреля, но на 17 апреля анонса нет. Что реально можно использовать сегодня и какие слухи игнорировать.

ai llm claude open-source
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe