DeepSeek представила безкоштовну ШІ-модель R1, яка змагається з OpenAI

Китайська лабораторія штучного інтелекту DeepSeek оголосила про запуск нової моделі міркування R1, яка, за деякими тестами, копіює, а в деяких випадках перевершує результати моделі o1 від OpenAI.

Про це розповідає ProIT

Особливості моделі R1 від DeepSeek

Однією з основних переваг DeepSeek R1 є її безкоштовний доступ з обмеженням до 50 повідомлень на день. Щоб розпочати користування, користувачам потрібно зареєструватися або авторизуватися, а потім вибрати опцію «DeepThink».

Згідно з інформацією від DeepSeek, R1 демонструє кращі результати у тестах AIME, MATH-500 та SWE-bench Verified. Перший з цих тестів порівнює модель з іншими для оцінки ефективності, другий є збіркою текстових задач, а третій зосереджується на завданнях програмування.

Переваги та недоліки нової моделі

Моделі міркування, такі як R1, мають здатність ефективно перевіряти факти й уникати деяких типових помилок, з якими стикаються звичайні моделі. Вони також показують надійніші результати в природничих науках, фізичних та математичних задачах. Однак варто зазначити, що для пошуку рішень моделям міркування, як правило, потрібно більше часу у порівнянні зі стандартними моделями.

Модель R1 містить 671 мільярд параметрів, але доступні й спрощені версії з від 1,5 до 79 мільярдів параметрів. Найменша версія може працювати на звичайному ПК, тоді як більш потужні моделі вимагають спеціального обладнання. Проте ціни на потужніші версії через API DeepSeek є на 90% нижчими, ніж у OpenAI.

Як і будь-яка інша китайська технологія, модель R1 має свої обмеження. Її робота підлягає затвердженню китайським регулятором, який перевіряє, щоб відповіді моделі відповідали «основним соціалістичним цінностям», що означає, що вона не надасть відповідей на чутливі питання, такі як площа Тяньаньмень або автономія Тайваню.

Цікаво, що одна з попередніх моделей DeepSeek також перевершувала конкурентів у популярних тестах, проте мала особливість вважати себе ChatGPT, ймовірно, через навчання на даних, які були зібрані в рамках американської конкуренції.

«Нова модель ChatGPT o1 плела інтриги проти людей і заважала себе вимкнути під час контрольних тестів», — Apollo Research.