Как OpenAI контролирует безопасность сообщений ChatGPT в отношении угроз и насилия

|
Как OpenAI контролирует безопасность сообщений ChatGPT в отношении угроз и насилия

Компания OpenAI предоставила подробное разъяснение о том, как осуществляется мониторинг сообщений пользователей в ChatGPT для выявления признаков насилия и угроз. В случае подтвержденных рисков, особенно если речь идет о серьезных насильственных намерениях, данные могут быть переданы полиции. Об этом говорится в блоге компании, где подчеркивается многоуровневый подход к безопасности и защите пользователей.

Об этом сообщает ProIT

Особенности фильтрации и реакции на угрозы

С начала 2023 года искусственный интеллект ChatGPT обучается блокировать инструкции, касающиеся самоповреждений, и перенаправлять разговор в поддерживающее русло. Если пользователь сообщает о намерении причинить себе вред, ассистент должен проявить эмпатию и предложить контакты специализированных служб помощи. Для пользователей из США предоставляется горячая линия 988, в Великобритании — организация Samaritans, а для других стран — портал findahelpline.com.

Защита несовершеннолетних и реагирование на серьезные угрозы

Для несовершеннолетних и незарегистрированных пользователей действует усиленная система фильтрации: она блокирует более широкий спектр потенциально опасных сообщений и изображений. Во время длительных диалогов ChatGPT может рекомендовать пользователям сделать паузу для сохранения эмоционального здоровья. Отдельно сообщения с угрозами или призывами к насилию над другими людьми проверяются специальной командой. Если риск подтверждается, соответствующие материалы могут быть переданы правоохранительным органам.

«Сообщения пользователей ChatGPT проверяются на признаки насилия и угроз. В случае подтверждения риска компания может передавать данные полиции».

В то же время случаи, связанные с самоповреждениями, не передаются полиции, чтобы гарантировать конфиденциальность пользователей. OpenAI подчеркивает строгий запрет на использование ChatGPT для пропаганды самоповреждений, создания оружия, планирования атак или любых действий, которые могут угрожать безопасности сервиса или других лиц. На сегодняшний день компания не фиксировала случаев передачи переписки пользователей правоохранительным органам.