Рейтинг нейросетей

Сравнивай модели, бенчмарки и цены. Быстро находи лучшее под твои задачи.

Смотреть модели Бенчмарки

Обновлено: 5 апреляРейтинг моделей и их параметров

Мы фокусируемся на том, чтобы предоставить вам наиболее точные и актуальные данные от лучших разработчиков ИИ

OpenAI

Anthropic

Google

Каталог нейросетей

Топ моделей по дате выхода — новейшие разработки AI-компаний

Показано 1-10 из 233

#
1	MiniMax	MiniMax M2.7	205K	18 мар. 2026 г.	-	-	Нет	0.30	1.20	-	-	-	-	-	-	-
2	Xiaomi	MiMo-V2-Pro	-	18 мар. 2026 г.	-	-	Нет	-	-	-	-	-	-	-	-	-
3	xAI	Grok 4.20	-	9 мар. 2026 г.	-	-	Да	-	-	-	-	-	-	-	-	-
4	OpenAI	GPT-5.4	1000K	5 мар. 2026 г.	-	-	Да	2.50	15.00	-	93.0%	-	-	-	99.0%	-
5	Alibaba	Qwen3.5 27B	-	1 мар. 2026 г.	-	27.0B	Нет	-	-	-	-	-	-	-	-	-
6	Alibaba	Qwen3.5 122B A10B	-	1 мар. 2026 г.	-	122.0B	Нет	-	-	-	-	-	-	-	-	-
7	Alibaba	Qwen3.5 35B A3B	-	1 мар. 2026 г.	-	35.0B	Нет	-	-	-	-	-	-	-	-	-
8	NVIDIA	Nemotron 3 Super (120B A12B)	-	1 мар. 2026 г.	-	120.0B	Нет	-	-	-	83.0%	-	-	-	-	-
9	Alibaba	Qwen3.5 9B	-	1 мар. 2026 г.	-	9.0B	Нет	-	-	-	-	-	-	-	-	-
10	OpenAI	GPT-5.4 mini	400K	1 мар. 2026 г.	-	-	Да	0.42	5.50	-	88.0%	-	-	-	93.0%	-

Страница 1 из 24

Смотреть все текстовые модели →

Лучшие ИИ на апрель 2026

Рейтинг составлен на основе 6 ключевых бенчмарков: GPQA, SWE-Bench, Tau2, MMLU, MMMU-Pro и ARC-AGI

Gemini 3.1 Pro

Google

GPQA 94%SWE-Bench 81%

Tau2 99%GPQA 91%SWE-Bench 78%

GPQA 90%SWE-Bench 80%

85.3%

общий рейтинг

Лучший выбор по задаче

Llama 3.2 3B Instruct

← Листай для просмотра категорий →

Llama 3.2 3B Instruct

Как мы считаем общий рейтинг

GPQA(20%)+SWE-Bench(20%)+Tau2(20%)+MMLU(15%)+MMMU-Pro(15%)+ARC-AGI(10%)

Веса нормализуются по доступным данным. Модели с менее чем 2 бенчмарками не включаются в рейтинг.

Лучшие нейросети 2026 года отличаются высокой точностью в специализированных задачах: от написания кода до анализа документов. Мы ежемесячно обновляем рейтинг, чтобы вы могли выбрать оптимальную модель под свои задачи — будь то разработка, исследования или автоматизация рутинных процессов.

Новости ИИ

Последние события, новинки и горячие новости про нейросети

Все новости

anthropicclaude

Anthropic случайно раскрыла свою самую мощную модель

Утечка данных Anthropic подтвердила существование Claude Mythos — модели, которую компания называет step change в возможностях AI.

3 апр.7 мин

zhipuglm

GLM-5.1 набрала 94,6% от Claude Opus — без единого чипа NVIDIA

Zhipu AI выпустила GLM-5.1 с 744 млрд параметров. Модель обучена на Huawei Ascend и догоняет Claude Opus 4.6 в кодинге.

3 апр.7 мин

googleturboquant

Google сжала память LLM в 6 раз — и обвалила акции чипмейкеров

TurboQuant от Google Research сжимает KV-кеш до 3 бит без потери точности. Акции SK Hynix, Samsung и Micron упали на 3-6%.

3 апр.8 мин

intelgpu

Intel выпустила GPU с 32 ГБ VRAM за $949

Intel Arc Pro B70 — первая видеокарта с 32 ГБ VRAM дешевле $1000. Самая доступная карта для локального запуска больших языковых моделей.

3 апр.3 мин

Все новости

Демонстрация скорости генерации токенов

Интерактивная демка показывает разницу в скорости работы моделей. Меняй значения в полях и смотри, как это влияет на время ответа.

т/с

← Листай горизонтально для сравнения скоростей →

т/с

Значения сбрасываются каждые 15 секунд для демонстрации разных скоростей

Рейтинги LLM

Лучшие модели и API провайдеры в каждой категории

Лучшая модель - Код

Бенчмарк SWE-Bench

Claude Opus 4.5

Anthropic

81.0

Gemini 3 Flash

Google

MiniMax M2.5

MiniMax

80.0

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

Alibaba

14450.8

Gemini 3.1 Pro

Google

94.3

Qwen3.5-397B-A17B

Alibaba

93.3

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

Google

94.3

GPT-5.4

OpenAI

93.0

Claude Opus 4.6

Anthropic

91.3

Самый длинный контекст

Максимум входных токенов

Gemini 3.1 Pro

Google

1.0M tokens

Gemini 3 Flash

Google

1.0M tokens

GPT-5.4

OpenAI

1.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

OpenAI

1000 tokens/s

GPT OSS 120B

OpenAI

500 tokens/s

Step-3.5-Flash

StepFun

403 tokens/s

← Листай горизонтально для просмотра всех категорий →

Лучшая модель - Код

Бенчмарк SWE-Bench

Claude Opus 4.5

81.0

Gemini 3 Flash

MiniMax M2.5

80.0

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

14450.8

Gemini 3.1 Pro

94.3

Qwen3.5-397B-A17B

93.3

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

94.3

GPT-5.4

93.0

Claude Opus 4.6

91.3

Самый длинный контекст

Максимум входных токенов

Gemini 3.1 Pro

1.0M tokens

Gemini 3 Flash

1.0M tokens

GPT-5.4

1.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

$0.01 / 1M tokens

Gemma 3 4B

$0.02 / 1M tokens

Nova Micro

$0.03 / 1M tokens

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

1000 tokens/s

GPT OSS 120B

500 tokens/s

Step-3.5-Flash

403 tokens/s

Бенчмарки и тесты

Как понять, какая модель лучше справляется с математикой, программированием или пониманием текста? Мы собрали 300+ разных тестов. Вот некоторые из ключевых бенчмарков, которые мы используем:

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

← Листай горизонтально для просмотра всех бенчмарков →

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

Смотреть рейтинги

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Рейтинг нейросетей

Каталог нейросетей

Лучшие ИИ на апрель 2026

Лучший выбор по задаче

Новости ИИ

Anthropic случайно раскрыла свою самую мощную модель

GLM-5.1 набрала 94,6% от Claude Opus — без единого чипа NVIDIA

Google сжала память LLM в 6 раз — и обвалила акции чипмейкеров

Intel выпустила GPU с 32 ГБ VRAM за $949

Демонстрация скорости генерации токенов

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Бенчмарки и тесты

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

Каталог нейросетей

Лучшие ИИ на апрель 2026

Лучший выбор по задаче

Новости ИИ

Anthropic случайно раскрыла свою самую мощную модель

GLM-5.1 набрала 94,6% от Claude Opus — без единого чипа NVIDIA

Google сжала память LLM в 6 раз — и обвалила акции чипмейкеров

Intel выпустила GPU с 32 ГБ VRAM за $949

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API