19 февраля 2026 года Google выпустила Gemini 3.1 Pro Preview, заявив о лидерстве по 13 из 16 основных бенчмарков при стоимости примерно вдвое ниже, чем у Claude Opus 4.6 от Anthropic. Однако доминирование в бенчмарках не означает автоматического превосходства для вашего конкретного проекта. Claude Opus 4.6, выпущенный двумя неделями ранее 5 февраля, по-прежнему сохраняет значительное преимущество в области экспертных знаний и рассуждений с использованием инструментов --- именно тех областях, которые имеют огромное значение для продуктивных приложений. Это руководство отсеивает маркетинговый шум и помогает понять, что на самом деле значат эти цифры и какая модель заслуживает вашего бюджета на API.
Краткое содержание
Gemini 3.1 Pro Preview выигрывает по абсолютным показателям бенчмарков и соотношению цена/производительность. Claude Opus 4.6 выигрывает в области экспертных знаний, качества кода и рассуждений с поддержкой инструментов. Вот краткий обзор перед подробным разбором:
| Категория | Победитель | Почему |
|---|---|---|
| Абстрактное мышление | Gemini 3.1 Pro | 77,1% против 68,8% на ARC-AGI-2 |
| Экспертная работа | Claude Opus 4.6 | 1606 против 1317 Elo на GDPval-AA |
| Программирование | Ничья (небольшое преимущество Claude) | 80,8% против 80,6% SWE-Bench |
| Рассуждения с инструментами | Claude Opus 4.6 | 53,1% против 51,4% HLE with tools |
| Мультимодальность | Gemini 3.1 Pro | Нативная поддержка аудио и видео |
| Контекстное окно | Gemini 3.1 Pro | 1M нативно против 200K (1M бета) |
| Стоимость | Gemini 3.1 Pro | $2/$12 против $5/$25 за MTok |
| Максимальный вывод | Claude Opus 4.6 | 128K против 64K токенов |
| Готовность к продакшену | Claude Opus 4.6 | GA против статуса Preview |
Итог: Выбирайте Gemini 3.1 Pro для проектов с ограниченным бюджетом, обработки длинных документов и мультимодальных задач. Выбирайте Claude Opus 4.6 для экспертной работы, сложных проектов по программированию и продакшен-развертываний, где важна стабильность.
Сравнение бенчмарков --- что на самом деле значат эти цифры

Когда Google объявила, что Gemini 3.1 Pro лидирует по 13 из 16 бенчмарков, естественная реакция --- объявить его безоговорочным победителем. Но такая интерпретация упускает критически важный нюанс: не все бенчмарки одинаково значимы для реальных приложений, и те бенчмарки, где побеждает Claude Opus 4.6, как раз наиболее сильно коррелируют с продуктивной ценностью. Понимание того, что именно измеряет каждый бенчмарк, помогает определить, какое преимущество важно для вашего конкретного рабочего процесса.
Рассуждения: где Gemini блистает ярче всего
Бенчмарк ARC-AGI-2 оценивает способность модели решать совершенно новые логические задачи --- проблемы, которых она никогда не встречала в процессе обучения. Gemini 3.1 Pro набрал здесь 77,1%, тогда как Claude Opus 4.6 показал 68,8%, что составляет разрыв в 8,3 процентных пункта (блог Google, 19 февраля 2026). Это действительно впечатляет, особенно учитывая, что Gemini 3 Pro набрал лишь 31,1% на том же тесте, а значит, Google более чем удвоила способности модели к абстрактному мышлению за одно обновление.
На практике это означает, что Gemini 3.1 Pro превосходно справляется с задачами, требующими креативного распознавания закономерностей --- например, отладка нестандартных пограничных случаев, выявление неочевидных зависимостей в данных или решение задач оптимизации, где путь к решению не сразу очевиден. Если ваше приложение включает сложные аналитические рассуждения, при которых модели нужно находить нестандартные подходы, а не применять известные шаблоны, у Gemini есть ощутимое преимущество.
Бенчмарк Humanity's Last Exam (HLE) рассказывает более сложную историю. Без доступа к внешним инструментам Gemini лидирует --- 44,4% против 40,0%. Но как только инструменты становятся доступны, Claude Opus 4.6 выходит вперед --- 53,1% против 51,4% у Gemini (Artificial Analysis, февраль 2026). Это изменение расстановки сил весьма показательно, поскольку большинство продуктивных ИИ-приложений предполагают использование инструментов --- API-вызовы, запросы к базам данных, выполнение кода, поиск в интернете. Модель, которая работает лучше с инструментами, в реальных развертываниях, пожалуй, ценнее той, которая лучше работает в изоляции.
Программирование: самая упорная борьба
Бенчмарки по программированию показывают самую плотную конкуренцию между двумя моделями. На SWE-Bench Verified, который оценивает способность модели решать реальные задачи с GitHub, написав реальные патчи кода, результаты практически идентичны: Gemini --- 80,6%, Claude --- 80,8% (объявление Google и Claude Opus 4.6 также превосходит GPT-5.3 по ряду бенчмарков, февраль 2026). Разница в 0,2 процентных пункта статистически незначима.
Однако картина меняется, если посмотреть на таблицы лидеров Arena Coding, где живые эксперты оценивают результаты моделей в слепых сравнениях. Claude Opus 4.6 стабильно занимает первое место в оценках предпочтений разработчиков, что указывает на то, что, хотя обе модели способны решать одни и те же задачи, Claude создает код, с которым разработчики на самом деле предпочитают работать --- более чистая архитектура, лучшая документация и более поддерживаемые паттерны. В то же время Gemini 3.1 Pro доминирует на бенчмарке MCP Atlas --- 69,2% против 59,5% у Claude, что свидетельствует о более высокой производительности в многоэтапных рабочих процессах программирования, охватывающих несколько файлов и требующих координации изменений по всей кодовой базе.
Экспертная работа: решающее преимущество Claude
Бенчмарк GDPval-AA оценивает экономически ценную интеллектуальную работу в области финансов, юриспруденции и других профессиональных сферах. Здесь Claude Opus 4.6 достигает 1606 баллов Elo, тогда как Gemini 3.1 Pro набирает 1317 --- разрыв в 289 очков Elo представляет собой существенную разницу в качестве (Artificial Analysis, февраль 2026). Для наглядности: разрыв в 289 Elo в шахматах --- это разница между сильным клубным игроком и титулованным мастером. На практике это означает, что Claude Opus 4.6 выдает заметно лучшие результаты для таких задач, как финансовый анализ, юридическая экспертиза документов, интерпретация медицинских отчетов и стратегический бизнес-анализ. Если ваше приложение обслуживает профессиональных пользователей, которым необходимо качество экспертного уровня, это самый важный бенчмарк для рассмотрения.
Разбор цен --- реальная стоимость каждой модели

Именно в области ценообразования Gemini 3.1 Pro представляет свое самое сильное ценностное предложение, обеспечивая сопоставимую или превосходящую производительность при значительно меньшей стоимости. Однако структура ценообразования имеет нюансы, которые влияют на общие расходы в зависимости от того, как вы используете каждую модель. Все цены ниже подтверждены из официальных источников по состоянию на 20 февраля 2026 года.
Сравнение стоимости за токен:
| Метрика | Gemini 3.1 Pro Preview | Claude Opus 4.6 | Разница |
|---|---|---|---|
| Ввод (стандартный) | $2,00/1M токенов | $5,00/1M токенов | Gemini в 2,5 раза дешевле |
| Вывод | $12,00/1M токенов | $25,00/1M токенов | Gemini в 2,1 раза дешевле |
| Ввод (длинный контекст) | $4,00/1M (>200K) | Применяется тариф длинного контекста | Варьируется |
| Пакетная обработка | $1,00/1M токенов | Недоступна | Только Gemini |
| Кэширование контекста | $0,20/1M токенов | Доступно с кэшированием | Gemini дешевле |
Источники: страница цен Google AI, 20 февраля 2026; официальная документация Anthropic, 20 февраля 2026.
Реальное влияние на затраты зависит от объема использования. Для типичного приложения, обрабатывающего 100 миллионов токенов в месяц с соотношением ввода/вывода 3:1, Gemini 3.1 Pro стоит приблизительно $450 по сравнению с Claude Opus 4.6 --- примерно $1000, что дает экономию $550 в месяц, или на 55% меньше. В масштабе предприятия при обработке 1 миллиарда токенов ежемесячно Gemini экономит приблизительно $5500 в месяц. Эта экономия значительно накапливается со временем, а доступность пакетной обработки со скидкой 50% делает Gemini еще более привлекательным для задач, не чувствительных к задержкам.
Для разработчиков, работающих с обеими моделями, платформы вроде laozhang.ai предоставляют единый API-доступ как к моделям Gemini, так и к моделям Claude через единую конечную точку, что упрощает интеграцию и может обеспечить дополнительную оптимизацию затрат по сравнению с управлением отдельными API-аккаунтами в Google и Anthropic. Подробный разбор цен и квот API Gemini 3 вы найдете в нашем специальном руководстве.
Стоит отметить, что стоимость за токен --- лишь половина уравнения. Claude Opus 4.6 поддерживает до 128K выходных токенов --- вдвое больше лимита Gemini в 64K --- что означает меньше API-вызовов для задач, требующих генерации объемного текста. Если ваш рабочий процесс включает создание подробных отчетов, полных файлов кода или обширных аналитических материалов, более высокий потолок вывода Claude может сократить количество необходимых вызовов, частично компенсируя его ценовую надбавку за токен. Для более глубокого изучения структуры цен Claude Opus мы подготовили полный разбор, включая пакетные скидки.
Контекстное окно, мультимодальность и технические характеристики
Технические характеристики за пределами бенчмарков раскрывают значимые архитектурные различия, которые влияют на то, как вы создаете приложения с каждой моделью. Это не просто цифры в спецификации --- они определяют, какие типы задач каждая модель способна обрабатывать нативно, а для каких потребуются обходные решения.
Контекстное окно: настоящее архитектурное преимущество
Gemini 3.1 Pro поддерживает нативное контекстное окно в 1 миллион токенов, что соответствует примерно 1500 страницам текста, целой средней кодовой базе или нескольким полноценным романам, обрабатываемым одновременно. Claude Opus 4.6 предлагает 200K токенов по умолчанию с бета-версией на 1 миллион токенов, доступной через специальный флаг-заголовок (документация Anthropic, февраль 2026). Хотя обе модели технически достигают 1M токенов, нативная поддержка Gemini обеспечивает более предсказуемую производительность и ценообразование на этом масштабе.
Практическая разница особенно важна для задач с большими наборами документов. Представьте юридическую команду, анализирующую контракт на 500 страниц вместе с 200 страницами прецедентов и нормативных указаний --- это легко укладывается в нативный контекст Gemini, но требует аккуратного управления со стандартным окном Claude в 200K. Аналогично, разработчики, анализирующие целые кодовые базы, выигрывают от возможности загрузить всю структуру проекта без разбиения, что позволяет избежать потери информации при разделении контекста между несколькими вызовами.
Тем не менее бета-режим Claude на 1M токенов активно доступен и хорошо работает на практике. Ключевые различия --- ценообразование (Anthropic применяет тарификацию длинного контекста свыше 200K токенов) и необходимость явного включения через бета-заголовок, что указывает на продолжающуюся доработку. Для большинства приложений с объемом менее 200K токенов --- а это подавляющее большинство сценариев --- обе модели работают сопоставимо.
Мультимодальные возможности: уникальная сила Gemini
Gemini 3.1 Pro является нативно мультимодальной моделью, обрабатывающей текст, изображения, аудио и видео в рамках единой архитектуры. Claude Opus 4.6 принимает текст и изображения, но не может обрабатывать аудио или видео. Это различие имеет значение, если ваше приложение предполагает анализ записей совещаний, обработку подкастов с аудиоконтекстом, понимание видеоматериалов или любой рабочий процесс, где информация поступает в нетекстовых форматах. Gemini обрабатывает все это нативно, без необходимости отдельных сервисов транскрипции или предварительной обработки, что снижает как сложность, так и стоимость.
Лимиты вывода и скорость
Claude Opus 4.6 поддерживает до 128K выходных токенов --- вдвое больше лимита Gemini в 64K. Это существенное преимущество для генеративных задач, где модели необходимо создавать объемный, детальный вывод за один вызов. Написание полных технических спецификаций, генерация целых наборов документации или создание развернутого контента --- все это выигрывает от более высокого потолка вывода Claude.
| Характеристика | Gemini 3.1 Pro Preview | Claude Opus 4.6 |
|---|---|---|
| Контекстное окно | 1M токенов (нативно) | 200K (1M бета) |
| Максимальный вывод | 64K токенов | 128K токенов |
| Входные модальности | Текст, изображения, аудио, видео | Текст, изображения |
| Скорость генерации | ~107 токенов/сек | Умеренная |
| Бесплатный уровень | Недоступен | Недоступен |
| Статус | Preview | Generally Available |
Какую модель выбрать? Схема принятия решения

Вместо того чтобы объявлять одну модель безусловно «лучшей», наиболее ценный подход --- сопоставить сильные стороны каждой модели с вашими конкретными требованиями. И Gemini 3.1 Pro, и Claude Opus 4.6 представляют интеллект уровня «фронтира», но каждый из них превосходит другой в разных аспектах, которые напрямую соответствуют разным рабочим процессам. Проанализировав полные данные бенчмарков и технические характеристики, мы предлагаем следующую схему принятия решения.
Выбирайте Gemini 3.1 Pro Preview, если ваши основные потребности включают:
Обработка длинных документов --- центральная часть вашего рабочего процесса. Нативное контекстное окно в 1M токенов исключает необходимость разбиения документов, резервных стратегий RAG или многоходовых подходов с потерей контекста. Если вы регулярно обрабатываете юридические документы, научные статьи, целые кодовые базы или объемные массивы данных, преимущество Gemini в контексте действительно значимо. Вы можете загрузить всю кодовую базу на 50 000 строк и задавать вопросы о кросс-файловых зависимостях, не беспокоясь о том, какие фрагменты включить.
Бюджетная эффективность важна для вашего проекта. При стоимости $2/$12 за миллион токенов по сравнению с $5/$25 у Claude, Gemini обеспечивает сопоставимую общую производительность при примерно на 55% меньших затратах. Для высоконагруженных приложений, стартапов с ограниченным бюджетом или команд, тестирующих несколько моделей в ходе разработки, экономия существенна. Дополнительная скидка 50% на пакетную обработку делает офлайн-задачи еще более доступными.
Требуются мультимодальные возможности. Если вашему приложению необходимо обрабатывать аудиозаписи, анализировать видеоконтент или работать со смешанными входными данными, Gemini --- на данный момент единственная модель уровня фронтира, нативно поддерживающая все четыре модальности. Нет необходимости в отдельных сервисах транскрипции или конвейерах предварительной обработки --- модель обрабатывает все напрямую.
Абстрактное мышление --- ключевое требование. Для приложений, связанных со сложным распознаванием паттернов, математическими рассуждениями или нестандартным решением задач, где модель сталкивается со сценариями, отличающимися от обучающих данных, результат Gemini в 77,1% на ARC-AGI-2 представляет значительное преимущество в 8,3 процентных пункта перед Claude.
Выбирайте Claude Opus 4.6, если ваши основные потребности включают:
Качество экспертного уровня --- обязательное условие. Если ваше приложение обслуживает профессионалов в области финансов, юриспруденции, медицины или других экспертных областей, преимущество Claude в 289 очков Elo на GDPval-AA напрямую транслируется в более высокое качество вывода. Разница между 1317 и 1606 Elo --- это разница между «адекватным» и «экспертным» качеством для задач профессионального анализа. Это имеет значение, когда ваши пользователи --- доменные эксперты, которые заметят недостатки качества.
Рабочие процессы с инструментами занимают центральное место в вашей архитектуре. Преимущество Claude Opus 4.6 в HLE с инструментами (53,1% против 51,4%) и его функция «команды агентов» --- где несколько агентов распределяют задачи и координируются параллельно --- делают его лучшим выбором для агентных приложений. Anthropic вложила значительные усилия в обеспечение надежности Claude для длительного многоэтапного использования инструментов, и это заметно на практике.
Генерация объемного контента происходит часто. Максимальный вывод Claude в 128K --- вдвое больше, чем у Gemini (64K) --- означает меньше API-вызовов для задач с объемными результатами. Генерация полной технической документации, написание подробных отчетов или создание развернутых статей выигрывает от возможности завершить весь вывод за один вызов без искусственного усечения.
Стабильность продакшена критически важна. Claude Opus 4.6 имеет статус General Availability, тогда как Gemini 3.1 Pro находится в Preview. Для продуктивных приложений, где стабильность API, последовательное поведение и предсказуемая производительность являются обязательными требованиями, GA-статус Claude предоставляет более надежные гарантии.
Preview против GA --- что это значит для продакшен-готовности
Различие между статусом «Preview» у Gemini 3.1 Pro и общей доступностью Claude Opus 4.6 --- это не просто семантика, оно имеет практические последствия для продакшен-развертываний, которые многие обзоры полностью упускают из виду.
Google прямо заявляет, что Gemini 3.1 Pro выпущен в Preview, чтобы «проверить эти обновления и продолжить дальнейшие улучшения в таких областях, как амбициозные агентные рабочие процессы, прежде чем модель станет общедоступной в ближайшее время» (блог Google, 19 февраля 2026). Эта формулировка сигнализирует о нескольких вещах: API модели может претерпеть изменения в поведении, ценообразовании или лимитах запросов до выхода в GA. Приложения, построенные на Preview API, должны учитывать возможность критических изменений, даже если исторически Google был достаточно консервативен в подобных вопросах.
Для продуктивных систем с платящими пользователями разработка на Preview API несет в себе риск. Если Gemini скорректирует характеристики ответов при переходе к GA, поведение вашего приложения может измениться без предупреждения. Это не повод полностью отказаться от Gemini --- многие команды успешно запускают Preview-модели в продакшен --- но это означает необходимость реализации фиксации версий, валидации вывода и стратегий отката как стандартной практики, а не опциональных мер предосторожности.
Claude Opus 4.6, выпущенный 5 февраля 2026 года как общедоступная модель, предоставляет гарантии стабильности, присущие GA-статусу. Система версионирования моделей Anthropic использует даты снимков (например, claude-opus-4-6) для обеспечения последовательного поведения, а устаревшие модели получают заблаговременное уведомление перед выводом из эксплуатации. Для предприятий с требованиями комплаенса, регулируемых отраслей или приложений, где последовательность вывода юридически значима, эта стабильность имеет большое значение.
Типичные сроки перехода Google от Preview к GA для крупных выпусков моделей составляют от 4 до 8 недель, исходя из исторических закономерностей. Gemini 3.1 Pro, вероятно, достигнет GA к концу марта или началу апреля 2026 года. Для команд, которые готовы работать с Preview-статусом и хотят использовать преимущества производительности, риск управляем. Для команд, которым нужны продакшен-гарантии уже сегодня, Claude Opus 4.6 --- более безопасный выбор до тех пор, пока Gemini не получит GA.
Как получить доступ к обеим моделям через API
Обе модели доступны через свои официальные API, основные облачные платформы и сторонних провайдеров. Процесс настройки различается у разных провайдеров, но основные паттерны интеграции схожи.
Gemini 3.1 Pro Preview доступен через Google AI Studio, Gemini API, Vertex AI и инструменты разработчиков, включая Gemini CLI и Android Studio. Идентификатор модели --- gemini-3.1-pro-preview в большинстве API-контекстов. Модель также доступна в GitHub Copilot с 19 февраля 2026 года, что делает ее сразу доступной для миллионов разработчиков без отдельной настройки API. Для разработчиков, изучающих альтернативы, наше руководство по лучшим альтернативам для доступа к Gemini API охватывает дополнительные варианты.
Claude Opus 4.6 доступен через Claude API (ID модели: claude-opus-4-6), AWS Bedrock (anthropic.claude-opus-4-6-v1), Google Cloud Vertex AI и Microsoft Azure Foundry. Модель поддерживает стандартный формат Anthropic Messages API с потоковой передачей, использованием инструментов и возможностями работы с изображениями.
Для команд, желающих использовать обе модели --- а это становится все более распространенным, поскольку организации выбирают лучшую модель для каждой задачи --- платформы вроде laozhang.ai предоставляют единый API-доступ через одну конечную точку. Такой подход избавляет от необходимости управлять отдельной аутентификацией, биллингом и SDK-интеграциями для Google и Anthropic, позволяя направлять запросы к той модели, которая лучше всего подходит для каждой конкретной задачи. Платформа поддерживает API-формат, совместимый с OpenAI, что делает переключение между моделями простой заменой параметра модели.
Быстрый пример интеграции в формате, совместимом с OpenAI:
pythonimport openai client = openai.OpenAI( base_url="https://api.laozhang.ai/v1", api_key="your-api-key" ) response = client.chat.completions.create( model="gemini-3.1-pro-preview", messages=[{"role": "user", "content": "Analyze this dataset pattern..."}] ) # Используем Claude Opus 4.6 для экспертного анализа response = client.chat.completions.create( model="claude-opus-4-6", messages=[{"role": "user", "content": "Review this legal contract..."}] )
Итоговый вердикт и рекомендации
Конкуренция между Gemini 3.1 Pro Preview и Claude Opus 4.6 отражает более широкую истину о современном ландшафте ИИ: ни одна модель не доминирует по всем параметрам. Инженерное достижение Google с Gemini 3.1 Pro впечатляет --- более чем удвоить производительность рассуждений, сохранив те же цены, --- это редкое сочетание прироста скорости и ценности. В свою очередь, Claude Opus 4.6 от Anthropic укрепил свои позиции как модель, которой профессионалы доверяют экспертный вывод и надежные рабочие процессы с инструментами.
Для большинства разработчиков и команд лучшая стратегия в феврале 2026 года --- не выбирать одну модель эксклюзивно, а строить системы, способные использовать обе. Применяйте Gemini 3.1 Pro для задач, где его преимущества очевидны: обработка длинных документов, мультимодальные входные данные, высоконагруженные задачи и вызовы абстрактного мышления. Используйте Claude Opus 4.6 там, где качество экспертного уровня важнее всего: профессиональный анализ, сложное программирование с нюансированными требованиями и агентные рабочие процессы, требующие изощренной координации инструментов.
Разрыв в ценах делает этот двухмодельный подход еще более привлекательным. Направляя бюджетно-чувствительные задачи с высоким объемом к Gemini и резервируя Claude для задач, где его качественная надбавка оправдывает стоимость, команды могут оптимизировать как производительность, так и расходы. Это не компромисс --- это действительно оптимальная стратегия, когда две модели уровня фронтира превосходят друг друга в комплементарных задачах.
Если вам нужно выбрать одну модель сегодня: выбирайте Gemini 3.1 Pro, если бюджет и мультимодальные возможности определяют ваше решение, или Claude Opus 4.6, если качество экспертного вывода и стабильность продакшена --- ваши приоритеты. Оба варианта --- отличный выбор; вопрос лишь в том, какой тип превосходства важнее для вашего конкретного проекта.
Часто задаваемые вопросы
Gemini 3.1 Pro Preview лучше, чем Claude Opus 4.6?
Зависит от задачи. Gemini лидирует по 13 из 16 бенчмарков, включая рассуждения (77,1% против 68,8% на ARC-AGI-2), и стоит в 2-2,5 раза дешевле. Однако Claude Opus 4.6 значительно превосходит Gemini в экспертной работе (1606 против 1317 Elo) и рассуждениях с инструментами. Ни одна модель не является безусловно лучшей --- правильный выбор зависит от вашего сценария использования.
Насколько дешевле Gemini 3.1 Pro по сравнению с Claude Opus 4.6?
Gemini 3.1 Pro стоит $2/$12 за миллион входных/выходных токенов по сравнению с $5/$25 у Claude (официальные цены Google AI и Anthropic, февраль 2026). Это делает Gemini примерно в 2,5 раза дешевле на ввод и в 2,1 раза дешевле на вывод. Для нагрузки в 100M токенов в месяц Gemini экономит примерно $550 ежемесячно.
Может ли Gemini 3.1 Pro обрабатывать аудио и видео?
Да. Gemini 3.1 Pro --- нативно мультимодальная модель, поддерживающая текст, изображения, аудио и видео на входе. Claude Opus 4.6 в настоящее время поддерживает только текст и изображения. Это делает Gemini лучшим выбором для приложений, которым необходимо анализировать записи совещаний, видеоконтент или аудиоданные.
Безопасно ли использовать Gemini 3.1 Pro Preview в продакшене?
Gemini 3.1 Pro имеет статус Preview, что означает возможные изменения API до выхода в общую доступность. Многие команды успешно используют Preview-модели в продакшене, но следует реализовать фиксацию версий и стратегии отката. Выход GA ожидается в течение 4-8 недель, исходя из исторических сроков Google.
Какая модель лучше для программирования?
Обе модели показывают практически одинаковые результаты на SWE-Bench Verified (80,6% против 80,8%). Claude Opus 4.6 занимает первое место в рейтингах Arena Coding по предпочтениям разработчиков, что говорит о более качественном коде с точки зрения пользователей. Gemini 3.1 Pro лидирует на MCP Atlas (69,2% против 59,5%) для многоэтапных рабочих процессов программирования. Для большинства задач программирования обе модели покажут отличные результаты.
