Порівняння ChatGPT, Grok і Gemini у навчанні фізики

Завдяки стрімкому розвитку штучного інтелекту все більше учнів користуються такими сервісами для вирішення складних завдань з алгебри та фізики. Батькам також стає непросто згадати шкільний матеріал, тому вони все частіше звертаються до сучасних цифрових помічників. У цьому огляді розглянуто, наскільки ефективно справляються з математичними задачами три найпопулярніші ШІ — ChatGPT 5, Google Gemini 2.5 та Grok 3, які наразі доступні безкоштовно.

Про це розповідає ProIT

Власний досвід та тестування можливостей ШІ

Під час підготовки матеріалу автор зіштовхнувся з необхідністю розрахунку коефіцієнта варіації, але навіть елементарні арифметичні дії в ChatGPT 4 вимагали кількох спроб. Через три місяці було проведено повторний експеримент із залученням ChatGPT 5, Gemini 2.5 та Grok 3. Результати виявилися такі:

ChatGPT 5 безпомилково вирішив задачу з першої спроби.
Grok спочатку допустив помилку, але після активації режиму “Think Harder” правильно розв’язав завдання.
Gemini не зміг дати коректної відповіді навіть після кількох спроб.

Перевірка ШІ на шкільних задачах з фізики

Для оцінки можливостей було обрано три завдання з фізики: механічний рух, механіка та оптика. Усі сервіси змогли правильно виконати розрахунки, проте користувачі відзначили дивні позначення у відповідях Gemini та Grok на мобільних пристроях. ChatGPT надав не лише правильну відповідь, а й докладне пояснення розв’язку.

У завданні на визначення висоти, де потенціальна й кінетична енергії рівні, ChatGPT і Grok врахували різні значення прискорення вільного падіння, що вплинуло на кінцевий результат. Gemini використав 10 м/с², тоді як ChatGPT — 9,8 м/с². Всі три ШІ правильно справилися із задачею з оптики, показавши вміння працювати з формулами та фізичними поняттями.

“Результати показують, що вибрані ШІ показують себе добре у розвʼязанні шкільних задач по фізиці.”

Рішення задач з алгебри: від простих до складних

Сервіси протестували на трьох задачах різної складності: від розрахунку вартості ляльок і м’ячів (3 клас) до складної тригонометричної задачі із зображенням. У простих прикладах усі ШІ швидко знаходили правильні відповіді, пояснюючи кроки доступно навіть дітям. При переході до складних завдань, зокрема з розпізнаванням формул із зображень, Grok та Gemini зіштовхнулися з труднощами: деякі етапи рішення були незрозумілими або неповними. ChatGPT продемонстрував кращу послідовність у поясненнях, хоча йому також знадобилася додаткова підказка для розкриття формули.

Загалом, із завданнями базового рівня сервіси впоралися без проблем, а в задачах підвищеної складності найкраще проявив себе ChatGPT 5.

Обмеження у безплатних версіях і висновки тестування

В процесі тестування з’ясувалося, що всі сервіси мають обмеження на кількість безкоштовних запитів. У ChatGPT 5 та Gemini 2.5 Pro діє ліміт у 10 запитів, але у Gemini відновлення ліміту відбувається раз на добу, а у ChatGPT — через певний проміжок часу. Grok дозволяє робити 15 звичайних і 2 «думаючих» запити кожні дві години, що залежить від індивідуальних налаштувань користувача. Для перевірки лімітів існують додаткові плагіни.

За результатами тестування лідером став ChatGPT 5, який справлявся із завданнями найефективніше та надавав зрозумілі пояснення навіть для складних задач. Grok 3 зайняв друге місце, продемонструвавши прогрес у порівнянні з попередніми версіями, але все ще допускає помилки. Gemini 2.5, попри правильність деяких відповідей, має труднощі з текстовими поясненнями, особливо на мобільних пристроях.

Загалом результати свідчать, що сучасні ШІ-інструменти можуть стати потужною підтримкою для школярів та їхніх батьків у навчальному процесі. Втім, користувачам потрібно уважно перевіряти відповіді, адже іноді ШІ може помилятися або не зовсім коректно пояснювати рішення.

Наприкінці експерименту автор пропонує задуматися над питаннями: чи створено вже «цифрового Бога» і чи не призведе це до нових викликів для людства?