Чому Google штучний інтелект помиляється у словах

Google активно впроваджує штучний інтелект (ШІ) у свою пошукову систему, але нещодавні оновлення показали, що навіть найсучасніші моделі досі не вміють правильно рахувати літери у словах або коректно їх писати. Користувачі помітили, що Google AI Overview, аналізуючи прості слова, часто робить курйозні орфографічні помилки. Наприклад, у відповіді на питання про кількість літер «P» у слові «Google», ШІ стверджує, що їх дві. Аналогічно, у слові «journalism» система нарахувала дві літери «d», але написала його як «j-o-u-r-n-a-d-i-s-m». Найбільш показовим є випадок, коли прізвище чинного президента США було написано як «t-r-p-u-m».

Про це розповідає ProIT

Чому ШІ погано справляється зі словами

Причина таких помилок криється в особливостях архітектури великих мовних моделей (LLM), на основі яких працює Google AI Overview. Як пояснюють дослідники, ці моделі не сприймають текст так, як людина – як послідовність літер і слів. Замість цього ШІ розбиває текст на так звані токени, які можуть бути як цілими словами, так і окремими складами або літерами, залежно від моделі. Після цього інформація перетворюється у числові значення, які потім аналізуються для формування відповіді.

“LLMs are based on this transformer architecture, which notably is not actually reading text. What happens when you input a prompt is that it’s translated into an encoding,” Matthew Guzdial, an AI researcher and assistant professor at the University of Alberta, told TechCrunch. “When it sees the word ‘the,’ it has this one encoding of what ‘the’ means, but it does not know about ‘T,’ ‘H,’ ‘E.’”

Проблеми зі сприйняттям мови та подальші перспективи

Google визнає існування таких проблем і запевняє, що працює над їх виправленням. Водночас експерти вважають, що поки що не існує ідеального рішення для обробки слів та літер у ШІ. Навіть якщо розробники створять досконалий словник токенів, моделі все одно намагатимуться розбивати інформацію на ще дрібніші частини.

Попри ці недоліки, такі помилки не є критичними для практичного використання великих мовних моделей, адже вони призначені передусім для створення текстів, а не для точного аналізу орфографії. Проте подібні казуси нагадують, що ШІ досі не є досконалим і потребує перевірки людиною, особливо коли йдеться про точність наданої інформації.