Grok-4 от xAI: Новый лидер в AI-тестах 2023 года

Новейший искусственный интеллект Grok-4, разработанный компанией xAI, менее чем за сутки после официального релиза уже продемонстрировал впечатляющие результаты в сравнении с ведущими решениями от OpenAI, Google и Anthropic. По данным платформы Artificialanalysis.ai, Grok-4 возглавил рейтинги интеллекта, оставив позади такие модели, как Google Gemini 2.5 Pro и OpenAI o4-mini (high). Это свидетельствует о чрезвычайно быстрых темпах развития компании Илона Маска, которая была основана всего в 2023 году.

Об этом сообщает ProIT

Результаты тестов и особенности Grok-4

В тестах на интеллектуальные способности Grok-4 стал лидером, опередив конкурентов и укрепив позиции xAI в мировой ИИ-индустрии. Однако в рейтинге LMarena, где пользователи самостоятельно оценивают языковые модели, Grok-4 пока не занимает собственной позиции — там до сих пор представлен лишь предварительный вариант Grok-3, который уступает моделям от Google, OpenAI, DeepSeek и Anthropic. Несмотря на это, новый Grok уже привлекает значительное внимание экспертов и пользователей, вызвав оживленные дискуссии в сообществе относительно своих возможностей и недостатков.

«Хотя Grok-4 возглавляет рейтинг интеллекта, анализ показывает, что в других аспектах лидируют конкуренты. По скорости впереди Gemini Flash Lite, с результатом до 691 токена в секунду. Минимальную задержку демонстрируют специализированные LFM 40B и Command-R. Наиболее выгодными остаются модели Gemma – всего 0,03 доллара за миллион токенов. А самое большое контекстное окно удерживает Llama 4 Scout – до 10 миллионов токенов. Тем не менее, ставка xAI на максимальный интеллект свидетельствует о том, что компания делает акцент именно на умственных возможностях модели, даже если это стоит скорости или дешевизны».

Конкуренция и перспективы развития ИИ

Несмотря на то, что Grok-4 занял лидерскую позицию по интеллектуальным показателям, в ряде других важных параметров модели от конкурентов остаются впереди. Например, Gemini Flash Lite отличается самой высокой скоростью генерации данных — до 691 токена в секунду, а LFM 40B и Command-R демонстрируют минимальные задержки в ответах. Модели Gemma, со своей ценой 0,03 доллара за миллион токенов, сохраняют преимущество в стоимости использования. В то же время Llama 4 Scout обладает самым большим контекстным окном — до 10 миллионов токенов, что существенно расширяет возможности работы с большими объемами информации.

Однако стратегия xAI, которая заключается в фокусе на интеллектуальных способностях, четко указывает на приоритет компании — достижение максимально высоких показателей именно в сфере умственных возможностей искусственного интеллекта. Это может обеспечить Grok-4 конкурентное преимущество в сложных творческих или аналитических задачах, даже если он уступает в скорости или стоимости эксплуатации.