Китайская лаборатория искусственного интеллекта DeepSeek объявила о запуске новой модели рассуждения R1, которая по некоторым тестам копирует, а в некоторых случаях превосходит результаты модели o1 от OpenAI.
Об этом сообщает ProIT
Особенности модели R1 от DeepSeek
Одним из основных преимуществ DeepSeek R1 является его бесплатный доступ с ограничением до 50 сообщений в день. Для начала использования пользователям необходимо зарегистрироваться или авторизоваться, а затем выбрать опцию «DeepThink».
Согласно информации DeepSeek, R1 демонстрирует лучшие результаты в тестах AIME, MATH-500 и SWE-bench Verified. Первый из этих тестов сравнивает модель с другими для оценки эффективности, второй представляет собой сборник текстовых задач, а третий сосредотачивается на задачах программирования.
Преимущества и недостатки новой модели
Модели рассуждения, такие как R1, обладают способностью эффективно проверять факты и избегать некоторых типичных ошибок, с которыми сталкиваются обычные модели. Они также показывают более надежные результаты в естественных науках, физических и математических задачах. Однако следует отметить, что для поиска решений моделям размышления, как правило, требуется больше времени по сравнению со стандартными моделями.
Модель R1 содержит 671 миллиард параметров, но доступны и упрощены версии с от 1,5 до 79 миллиардов параметров. Самая маленькая версия может работать на обычном ПК, тогда как более мощные модели требуют специального оборудования. Однако цены на более мощные версии через API DeepSeek на 90% ниже, чем в OpenAI.
Как и любая другая китайская разработка, модель R1 имеет свои ограничения. Ее работа подлежит утверждению китайским регулятором, который проверяет, чтобы ответы модели соответствовали «основным социалистическим ценностям», что означает, что она не ответит на чувствительные вопросы, такие как площадь Тяньаньмэнь или автономия Тайваня.
Интересно, что одна из предыдущих моделей DeepSeek также превосходила конкурентов в популярных тестах, однако имела особенность считать себя ChatGPT, вероятно, из-за обучения на данных, собранных в рамках американской конкуренции.
"Новая модель ChatGPT o1 плела интриги против людей и мешала себя выключить во время контрольных тестов", — Apollo Research.