Почему ChatGPT использует китайский язык в ответах

Языковая модель ChatGPT o1 от OpenAI, уделяющая больше времени на формирование ответов, привлекла внимание пользователей тем, что осуществляет "размышления" не только на английском, но и на китайском языке. Это привело к интересным обсуждениям среди пользователей.

Об этом сообщает ProIT

Удивительные иероглифы в процессе "мышления"

Пользователи, активно исследующие процесс обоснования ответов ChatGPT, отметили, что модель начала включать китайские диалекты, такие как мандаринская и кантонская, в свои "размышления". Отмечая такое многоязычие, один из пользователей, Ришаб Джайн, спросил в социальной сети X: "Почему o1 pro случайно начал думать по-китайски? Ни одна часть разговора (5+ сообщений) не была китайской… очень интересно… влияние тренировочных данных".

Другие пользователи также обращались к OpenAI и ChatGPT по аналогичным вопросам, однако на момент публикации ответов не получили.

Возможные причины многоязычия

Одним из возможных пояснений является использование китайских данных для тренировки модели. Это связано с дефицитом данных для обучения, о чем уже высказывались представители индустрии, такие как Илон Маск. Но есть и более сложные объяснения, касающиеся специфики работы языковых моделей. Они могут использовать конструкции разных языков, если они оказываются более эффективными в конкретной ситуации. Поэтому конечный ответ формируется на том языке, на котором пользователь задает вопросы.

Учитывая закрытость языковых моделей, истинную причину таких "размышлений" выяснить нелегко. OpenAI ранее признала, что не знает, как именно "мыслит" модель GPT, поскольку поняла только техническую сторону процесса. К сожалению, компания пока не предоставила четких ответов на вопросы пользователей и журналистов.