За підсумками грудневого рейтингу аналітичної компанії Relum, найнадійнішим серед чат-ботів для бізнесу у 2025 році став Grok від компанії xAI, заснованої Ілоном Маском. Експерти оцінювали десять провідних нейромереж за показником так званих “галюцинацій” — випадків, коли штучний інтелект надає неправдиву або недостовірну інформацію.
Про це розповідає ProIT
Grok лідирує за точністю серед конкурентів
Згідно з результатами дослідження, Grok фіксує лише 8% помилкових відповідей, що є найкращим показником серед усіх протестованих чат-ботів. Для порівняння, ChatGPT від OpenAI видає неточну інформацію у 35% випадків, а Google Gemini перевищує позначку у 40%. Відносно кращі результати продемонстрував Microsoft Copilot — 27% хибних відповідей.
Серед інших інструментів, які отримали високу оцінку за точність, експерти відзначили китайську нейромережу DeepSeek (14%), пошуковий сервіс Perplexity (13%) та модель Claude (17%).
Чому точність ШІ критично важлива для бізнесу
Експерти наголошують, що точність нейромереж критично важлива для бізнесу: понад 65% компаній у США вже інтегрували ШІ у робочі процеси, і у майбутньому при виборі інструментів корпорації все частіше орієнтуватимуться саме на фактичну точність відповідей моделей.
Рівень довіри до штучного інтелекту безпосередньо впливає на ефективність бізнес-процесів, автоматизацію та прийняття управлінських рішень. Тому компанії ретельно аналізують не лише функціонал, а й якість відповідей обраних систем штучного інтелекту.