Claude Code Review — мульти-агентное ревью PR за $15-25, и почему Hacker News в ярости от цены
Claude Code Review — мульти-агентное ревью PR за $15-25, и почему Hacker News в ярости от цены
Anthropic наконец формализовала то, что многие делали руками — натравливали Claude на свои PR через кастомные скиллы, GitHub Actions или просто копипастом в чат. Теперь это отдельный продукт: Code Review, встроенный в Claude Code. Не линтер, не стайл-чекер — а команда AI-агентов, которые параллельно ищут логические баги в коде, перепроверяют друг друга и ранжируют находки по критичности.
TL;DR: Claude Code Review диспатчит несколько агентов на каждый PR, агенты ищут баги параллельно, фильтруют false positives и постят результат прямо в GitHub — один обзорный комментарий плюс inline-замечания. Стоит $15-25 за ревью, доступно в research preview для Team и Enterprise. На HN спорят: гениально или дорого?
Как это работает
Когда открывается PR, система запускает не одного агента, а несколько — количество масштабируется в зависимости от размера изменений. Маленький PR на 50 строк получит лёгкий проход, а монстр на 1000+ строк — полноценную команду.
Процесс выглядит так:
- PR триггерит workflow
- Несколько специализированных агентов инспектируют код параллельно
- Critic-агент верифицирует и ранжирует находки — отсеивает false positives
- Отранжированные комментарии постятся в GitHub
- Человек принимает финальное решение о мерже
Ключевое отличие от линтеров и SAST — Code Review ищет не синтаксические ошибки и не стилевые проблемы (это задача ESLint). Он ищет логические баги: изменения, которые ломают допущения в нетронутом коде, пропущенную обработку параметров между файлами, регрессии от фиксов, нарушения архитектурных инвариантов репозитория.
Настройка
Настройка занимает пару минут. Админ команды:
- Включает Code Review в настройках Claude Code
- Устанавливает GitHub App от Anthropic
- Выбирает репозитории для ревью
Для разработчиков — ничего делать не надо. Ревью запускается автоматически на новых PR.
Два файла управляют поведением:
REVIEW.md— приоритеты ревью. Например: "авторизационные регрессии", "пропущенные границы транзакций"CLAUDE.md— контекст архитектуры репозитория. Например: "packages/auth владеет проверкой прав"
Результат появляется прямо в PR: один обзорный комментарий с общей картиной и inline-комментарии к конкретным строкам.
Цифры от Anthropic
Anthropic гоняет Code Review почти на каждом своём PR. Внутренняя статистика:
- До Code Review: 16% PR получали содержательные замечания
- После: 54% PR получают содержательные замечания
- Точность: менее 1% находок отмечены инженерами как некорректные
- Большие PR (1000+ строк): 84% получают находки, в среднем 7.5 проблем
- Маленькие PR (до 50 строк): 31% получают находки, в среднем 0.5 проблем
- Время ревью: ~20 минут
Звучит впечатляюще, но есть нюанс. Все эти цифры — внутренние данные Anthropic, независимых замеров пока нет. И как справедливо заметил пользователь jgraettinger1 на Hacker News: "Claude всегда находит около 8 проблем, независимо от реального количества дефектов — когда находки заканчиваются, он скребёт по дну бочки". Это известная проблема LLM — они склонны генерировать находки даже на чистом коде, потому что обучены отвечать, а не молчать.
Сколько стоит
Тут начинается самое интересное. Pricing — per review, на основе потреблённых токенов:
- $15-25 за одно ревью — зависит от размера и сложности PR
- Доступно в research preview для Claude Team и Enterprise
Для небольшой команды с 5-10 PR в день — это $75-250 в день, $1,500-5,000 в месяц. Для крупной компании с 30 PR/день — уже $450-750 в день, то есть $10-16K в месяц.
На Hacker News эту цену разнесли. Пользователь cbovis указал, что GitHub Copilot Code Review стоит $0.04 за ревью — в 375 раз дешевле. Пользователь 8cvor6j844qw_d6 напомнил, что Greptile даёт 50 ревью за $30/месяц. А nnennahacks посчитал масштаб: при 2000 PR в неделю (крупная компания) это $1.5-2.5M в год.
Но есть и защитники. SkyPuncher написал: "$20 за ревью — это смешная цена, если senior-инженер за $100+/час может ревьюить PR за 10 минут вместо часа". Пользователь jjmarr сообщил о 20% снижении time-to-merge на похожих затратах.
Вопрос не в том, дорого ли $20 за ревью само по себе. Вопрос — что ты получаешь за эти деньги и сколько стоит альтернатива.
Подводные камни
False positives на чистом коде. LLM всегда найдёт что сказать — это их природа. Когда реальных багов нет, агенты начинают цепляться к стилю, теоретическим edge cases и "а что если вот тут null". По отзывам с HN, нужно быть готовым к шуму, особенно на маленьких, хорошо написанных PR.
Несовместимость с Zero Data Retention. Если у вашей организации включён режим ZDR в Anthropic — Code Review не работает. Для компаний в финтехе и healthcare, где ZDR обязателен, это блокер.
Цена масштабируется линейно, а не дегрессивно. 10 ревью стоят столько же за штуку, что и 1000. Пользователь lowsong на HN предупредил: текущие $15-25 — это "субсидированная цена", которая "запросто может вырасти в 10 раз". Для стартапа с 5 PR в день — терпимо. Для enterprise с сотнями PR — нужен серьёзный бюджет, и ROI нужно считать до подключения.
Не одобряет PR. Code Review только находит проблемы — мержить или нет, решает человек. Это правильно с точки зрения безопасности, но значит, что Code Review дополняет человеческий ревью, а не заменяет его. Экономия времени ревьюера — да, но полное замещение — нет.
Только GitHub. На момент запуска поддерживается только GitHub. GitLab, Bitbucket, Azure DevOps — нет. Self-hosted и self-managed команды перенаправляются на GitHub Actions или GitLab CI/CD.
Альтернативы
-
CodeRabbit — $24/user/мес, самый популярный AI-ревьюер на GitHub (2M+ репозиториев, 13M+ PR). Работает на уровне diff — видит что изменилось, но не анализирует взаимодействие с кодовой базой. Быстрый и дешёвый, но на системных багах промахивается: 1/5 в независимых бенчмарках на completeness. Зато работает с GitHub, GitLab, Bitbucket и Azure DevOps.
-
GitHub Copilot Code Review — ~$0.04 за ревью, встроен в Copilot подписку ($19-39/user/мес). В сотни раз дешевле, но работает на уровне diff и значительно поверхностнее — больше подсказки, чем глубокий анализ. Для лёгких PR хватает, для кросс-файловых багов — нет.
-
Qodo — $30/user/мес, анализирует PR с учётом shared libraries, API и зависимостей между сервисами. Сильнее CodeRabbit на breaking changes и downstream impact, но дороже и медленнее.
Вердикт
Code Review от Anthropic — первый инструмент, который пытается ревьюить код как senior-инженер, а не как линтер на стероидах. Мульти-агентная верификация с фильтрацией false positives — технически красивое решение, и цифры Anthropic (54% PR с замечаниями, <1% ошибок) впечатляют, хотя ждём независимых подтверждений.
Стоит подключать если: ваша команда генерирует много AI-кода, PR крупные и кросс-файловые, а senior-инженеры тратят часы на ревью. При средней зарплате $150K+/год — $20 за ревью окупается за один пойманный баг.
Не стоит если: у вас маленькие PR, бюджет ограничен, нужен GitLab/Bitbucket, или включён Zero Data Retention. В этом случае CodeRabbit за $24/мес или Copilot Code Review за копейки закроют 80% потребностей.
Как попробовать
- Убедитесь, что у вас Claude Team или Enterprise план
- В настройках Claude Code включите Code Review
- Установите Anthropic GitHub App и выберите репозитории
- Создайте
REVIEW.mdв корне репо с приоритетами ревью:
Focus on: - Authorization and authentication regressions - Missing error handling in API endpoints - Breaking changes in public interfaces
- Откройте PR — ревью запустится автоматически через ~20 минут