Тестування Grok 4: штучний інтелект Маска вразив логікою, але проявив політичну упередженість

|
Тестування Grok 4: штучний інтелект Маска вразив логікою, але проявив політичну упередженість

Базова версія Grok 4 Basic — новітньої моделі штучного інтелекту від xAI під керівництвом Ілона Маска — викликала жваву дискусію серед експертів. Огляд моделі виявив низку сильних і слабких сторін, які варто врахувати користувачам при виборі ШІ-асистента.

Про це розповідає ProIT

Політична упередженість і логічне мислення Grok 4

Однією з головних проблем Grok 4 Basic стала політична упередженість. Під час тестування модель відповідала на чутливі теми, такі як війна в Газі чи питання абортів, з відвертим акцентом на поглядах Ілона Маска. Вона систематично посилалася на його дописи в X (екс-Twitter) та джерела, що підтримують його позицію, що викликає питання щодо незалежності відповідей системи.

«Цей “максимально прагнучий правди” ШІ, якого Маск обіцяв під час запуску, шукає правду переважно через призму соцмереж свого творця», — зауважили автори рецензії.

Водночас у логічних і юридичних завданнях Grok 4 Basic проявив себе на високому рівні. Наприклад, на питання «Чи може чоловік одружитися з сестрою своєї вдови?» модель одразу виявила логічну помилку й пояснила неможливість такого шлюбу юридичною аргументацією.

Креативність, програмування та голосові можливості

У творчих задачах Grok 4 Basic поступається конкурентам. Створені ним історії були шаблонними, з посереднім наративом, а спроби програмування часто завершувалися невдачами: навіть після кількох ітерацій ШІ не змогла створити повноцінну гру, а виправлення помилок породжували нові збої. Попередня версія Grok 3 виконувала ці завдання навіть краще.

Фахівці радять використовувати Grok 4 для побудови сюжетних схем, а творчий текст створювати за допомогою інших моделей, наприклад, Claude 4 Opus.

Голосові функції стали справжнім проривом у Grok 4 Basic: ШІ може озвучувати казки з виразною інтонацією, обирати різні «особистості» — від терапевта до «режиму для дорослих». Це робить модель універсальною для голосових сценаріїв, хоча відсутність функції спільного екрану обмежує її у візуальних завданнях — у цьому аспекті сильнішим залишається Gemini Live.

Додаткові спостереження та рекомендації

Grok 4 не впорався з обробкою великого контексту: модель відмовилася виконати запит на 83 000 токенів, хоча заявлений обсяг контексту — до 126 000, що викликало додаткові питання щодо її реальних можливостей. На початку липня 2025 року компанія xAI залучила $10 млрд на розвиток Grok та розширення дата-центру Colossus.

Фахівці наголошують: Grok 4 Basic — чудовий вибір для аналітики й голосової взаємодії, але не підходить для творчих чи програмістських завдань. Головним недоліком залишається політична упередженість, яка може бути критичною для користувачів, які шукають неупереджену інформацію.

«Якщо вас не лякає вплив Маска на відповіді, ви отримаєте ШІ з високим рівнем аналітики та якісною голосовою взаємодією. Але за $30 на місяць, якщо вам потрібно більше — краще пошукати альтернативу», — підсумували у Decrypt.

У червні 2025 року Ілон Маск повідомив, що Grok 3.5 почали використовувати для обробки знань людства.