Grok 4.3 — 53 балла на Intelligence Index, $1.25 за миллион токенов и регрессия в агентах. xAI выкатил модель, пока Маск судится с Altman'ом
Пока Маск с Altman'ом ругаются в суде, xAI тихо выкатил Grok 4.3. Новая reasoning-модель впервые за год вернула xAI на Pareto frontier. По цене. По интеллекту нет, до GPT-5.5 ещё далеко.
TL;DR: Grok 4.3 — 53 балла на Artificial Analysis Intelligence Index, $1.25 за миллион входных токенов и $2.50 за выходные. На 40-60% дешевле Grok 4.20 при +4 баллах интеллекта. Reasoning встроен и не отключается. Контекст 1M, плюс клонирование голоса за минуту через Custom Voices. Слабые места: ProofBench всего 11%, регрессия в Vending-Bench, и модель платно «думает» даже на «привет».
Что вышло за выходные
xAI выкатил Grok 4.3 в ночь на 1 мая. Модель доступна через API, OpenRouter и подписки SuperGrok ($30/мес) и X Premium+ ($40/мес).
Цифры:
- 53 балла на Artificial Analysis Intelligence Index, выше Claude Sonnet 4.6 (52) и Muse Spark (52)
- $1.25 / $2.50 за миллион токенов (input/output) до 200K, дальше цена удваивается
- 1M токенов контекста, без лимита на output
- 209 токенов/сек, одна из самых быстрых reasoning-моделей в топе
- Knowledge cutoff: декабрь 2025
Бенчмарк-набор Artificial Analysis обошёлся в $395 за полный прогон, на 20% дешевле Grok 4.20, при том что модель сжирает на 44% больше токенов. То есть xAI снизил цену сильнее, чем выросла «болтливость» reasoning-режима.

CEO Abacus AI Bindu Reddy одной фразой описала позиционирование: «as smart as Sonnet 4.6 and 5x cheaper and faster». Цифры почти бьются. Sonnet 4.6 стоит $3 / $15, Grok 4.3 даёт сопоставимый интеллект за $1.25 / $2.50.
Always-on reasoning, никаких effort levels
Главное архитектурное изменение Grok 4.3: reasoning нельзя отключить. Не toggle, не effort level, не dial. Модель «думает» перед каждым ответом, всегда.
Это не про маркетинг. На уровне API параметра reasoning_effort просто нет. Если у тебя приложение, где половина запросов это банальные «исправь опечатку» или «переведи на английский», ты всё равно платишь за reasoning-токены. И они тарифицируются как обычные completion-токены, то есть в полную цену.
Сравнение: Claude Sonnet 4.6 умеет работать в Adaptive Reasoning, OpenAI у GPT-5.5 даёт reasoning_effort: low/medium/high. У Grok 4.3 только high, по умолчанию и навсегда.
Плюс: модель показывает сильные результаты на инструкциях. 98% на τ²-Bench Telecom (наравне с GLM-5.1), 81% на IFBench. На GDPval-AA взлёт с 1179 до 1500 ELO, рост на 321 пункт, обходит Gemini 3.1 Pro Preview, Muse Spark и GPT-5.4 mini. Vals AI поставила Grok 4.3 на #1 по CaseLaw v2 (79.3%) и #1 по CorpFin. Юридический и финансовый ризонинг подскочил на 25 баллов.
Минус: ты платишь за «думать» там, где модель должна была просто ответить.
Что Grok 4.3 теперь делает руками
VentureBeat собрал реальные примеры из early access. Это не пресс-релиз xAI, это что люди реально делают.
- Excel. Модель потратила 6 минут 22 секунды в фазе reasoning, чтобы собрать DPS-калькулятор для OSRS Sailing Combat. Не таблица, а multi-sheet файл с листом Reference_Data, листом DPS_Calculator с автоформулами и вкладкой со сценариями.
- PDF. 12-страничные отчёты по продуктам SpaceX. С брендингом, логотипами, hero-изображениями и структурированными таблицами. Не markdown в скобках, а готовый документ.
- PowerPoint. 9-слайдовые презентации с «sandwich structure» (тёмные титры/выводы, светлый контент), data-driven матрицами решений и шутками.
Серверные тулы, которые модель сама зовёт по необходимости:
- Web и X Search: обход knowledge cutoff через прямой поиск в твиттере
- Code Execution: Python в песочнице
- File and Collections Search: встроенный RAG поверх загруженных документов
У Claude и GPT эти тулы в основном в Code Interpreter и web_search, но без X-данных и без интеграции с Premium-аккаунтом, которая у Grok идёт из коробки.
Custom Voices — клон твоего голоса за минуту
Параллельно с моделью xAI выкатил Custom Voices, voice cloning по короткому образцу. Читаешь несколько случайных абзацев, через минуту-две у тебя клон собственного голоса с правильным произношением новых слов.
Карл Францен из VentureBeat протестировал и описал как «звучит жутко идентично мне».
Цены ломают ElevenLabs:
- Grok Voice Agent (
grok-voice-think-fast-1.0): $3.00 в час, $0.05 в минуту - ElevenLabs Pro: ~$10.80 в час
- Play.ht: ~$12 в час
- OpenAI TTS HD: ~$1.80 в час, но без клонирования голоса
Grok Voice Agent ровно посередине: дороже OpenAI TTS, в 3-4 раза дешевле ElevenLabs. Standalone TTS стоит $4.20 за миллион символов, STT $0.20/час streaming или $0.10/час batch.
Лимит до 30 кастомных голосов на команду. Программный API POST /v1/custom-voices пока только для Enterprise. Обычный API даёт доступ только к встроенным голосам (Eve, Ara, Rex, Sal, Leo). Каждый кастомный голос «scoped to your team», другие пользователи xAI его не видят.
Подводные камни
Hacker News за четыре часа набрал 184 балла и 235 комментариев. Реакция полярная.
Narcolepsy в агентах. Andon Labs запустили Grok 4.3 на Vending-Bench 2, симуляции, где модель управляет торговым автоматом, и зафиксировали «big regression». Цитата: «narcolepsy problems, prefers to remain inactive for multiple simulation days rather than taking the required actions». Always-on reasoning переусложняет простое решение «купить колу за $2 и продать за $3», и модель буквально засыпает на несколько симуляционных дней.
ProofBench 11%. Vals AI отметили, что Grok 4.3 хорош в legal/finance, но плох в сложной математике. 11% на ProofBench, регрессия в general coding. Если строишь агента для math-heavy задач, это не та модель.
$0.05 за заблокированный запрос. xAI ввёл «Usage Guideline Violation Fee»: пять центов за каждый запрос, который заблокировал safety filter до генерации. То есть ты платишь за то, что модель тебе отказала. Беспрецедентная история. Конкуренты блокируют молча и без счёта.
Higher context pricing на 200K. Цены $1.25 / $2.50 действуют только до 200K токенов. Выше удваиваются. Для агентов с большим контекстом или длинных документов это ощутимо: миллионный контекст в полной цене стоит $2.50 / $5.00, уже ближе к Sonnet.
Reasoning токены в полную цену. Внутренние «размышления» модели биллятся как обычный output. На простом запросе ты можешь получить 300 токенов ответа и 1500 reasoning-токенов в счёте. Фактически модель в 5-6 раз дороже на коротких задачах.
Память не работает. Реддиторы жалуются годами: у Grok нет persistent memory между сессиями. ChatGPT Plus умеет с 2023, Claude Projects с 2024. Платишь $30-300 в месяц, модель забывает тебя при каждом старте.
Verbosity. Чтобы прогнать Intelligence Index, Grok 4.3 сжёг 88M токенов против 35M в среднем у конкурентов. Объективно болтливее. На API это означает, что output-токены закроют большую часть твоего бюджета.
Алайнмент с Маском. Один из пользователей нашёл в системном промпте Grok 4.3 строку «you do not assign broad positive/negative utility functions to groups of people». Менее жёстко, чем известный кейс с Grok 4, где модель сверялась с твитами Маска. Но энтерпрайзу всё ещё есть о чём подумать перед интеграцией.
Альтернативы
- Claude Sonnet 4.6: 52 на Intelligence Index ($3/$15). Лучше для чистого кодинга и творческих задач, есть Adaptive Reasoning (можно отключить), есть Projects-память. Но в 2.4× дороже на input и в 6× на output.
- GPT-5.5 (xhigh): 60 на Intelligence Index ($5/$30). Топ по интеллекту и Terminal-Bench (82.7%), но в 4× дороже Grok 4.3 по input и в 12× по output. Для бюджетного агента не вариант.
- Kimi K2.6: 54 на Intelligence Index ($1.7 blended), open weights. Если нужен локальный или дешёвый proxy, Kimi сейчас обходит Grok 4.3 по цене и интеллекту, но без websearch и тулов.
- GLM-5.1: 98% на τ²-Bench Telecom (как у Grok 4.3), open weights, в 3-5 раз дешевле, но без агент-первой инфраструктуры xAI.
- ElevenLabs для voice cloning: качество чуть выше Grok, но в 3-4 раза дороже. Если у тебя not enterprise и не Premium+, единственный реальный вариант с программным доступом.
Вердикт
Бери Grok 4.3 если: строишь агента в legal или finance, там +25 пунктов и #1 на CaseLaw/CorpFin не врут; нужен миллионный контекст за реальные деньги (Sonnet с 1M стоит $6/$22.50, Grok даёт то же за $2.50/$5); voice cloning для энтерпрайза без ElevenLabs-цен.
Не бери если: пишешь математического агента (ProofBench 11% это провал); нужен агент в симуляции или RPA (narcolepsy ставит крест); большая часть запросов это короткие диалоги, где платить за always-on reasoning неоправданно дорого; не готов платить $0.05 каждый раз, когда safety filter сработал.
Подождать стоит, если используешь долгую сессионную память. Её всё ещё нет, и xAI её не обещает в roadmap.
Как попробовать
- Подписаться на SuperGrok ($30/мес) или X Premium+ ($40/мес, первые 2 месяца со скидкой 50%). Получишь UI-доступ с web search, code execution и Custom Voices.
- Получить ключ на docs.x.ai или через OpenRouter. Модель там называется
grok-4.3. На OpenRouter можно сравнивать с другими моделями в одной игровой площадке. - Прогнать на своих задачах три теста: длинный документ (≥200K токенов), agentic-сценарий с tool use и короткий диалог. Сравнить с текущей моделью. Если выигрыш в стоимости перекрывает регрессии, можно мигрировать.
- Для voice cloning зайти на console.x.ai/voice/voice-library, записать 1-2 минуты речи, забрать
voice_idи тестировать через TTS API. Программный доступ к клонированию только Enterprise, но UI открыт всем.