Головна Технології В Anthropic Claude 4.5 Opus знайдено внутрішній посібник із поведінки моделі

В Anthropic Claude 4.5 Opus знайдено внутрішній посібник із поведінки моделі

У штучному інтелекті Anthropic Claude 4.5 Opus виявлено внутрішній документ під назвою “Огляд душі”, який детально описує принципи взаємодії моделі з людьми та формування її “особистості”. Користувач Річард Вайс випадково отримав доступ до цього посібника, що стало несподіванкою для багатьох спостерігачів.

Про це розповідає ProIT

Вміст і призначення документа

Як підтвердила філософ і етичний спеціаліст Anthropic Аманда Аскелл, цей посібник дійсно застосовувався під час навчання моделі. Документ, обсягом понад 11 тисяч слів, містить інструкції із забезпечення безпеки, рекомендації щодо створення захисних бар’єрів для запобігання небезпечним відповідям, а також поради щодо максимальної користі для користувачів.

“Claude повторно видавав цей текст при кількох запитах, що підтвердило його достовірність”.

Реакція та подальші плани Anthropic

Зараз цей документ перебуває на етапі доопрацювання, а компанія Anthropic готується оприлюднити його розширену версію з більш детальною інформацією. Випадковий доступ користувача до цього внутрішнього керівництва став несподіваною подією для зовнішніх експертів, але водночас продемонстрував прозорість процесів навчання сучасних AI-моделей.

Отже, так звана “душа” Claude виявилася не метафоричним поняттям, а спеціально створеним посібником із поведінки, який визначає принципи роботи штучного інтелекту і спрямований на безпечну взаємодію з людьми.

Читайте також

About Us

Soledad is the Best Newspaper and Magazine WordPress Theme with tons of options and demos ready to import. This theme is perfect for blogs and excellent for online stores, news, magazine or review sites. Buy Soledad now!

Latest Articles

© ProIT. Видання не несе жодної відповідальності за зміст і достовірність фактів, думок, поглядів, аргументів та висновків, які викладені у інформаційних матеріалах з посиланням на інші джерела інформації. Усі запити щодо такої інформації мають надсилатися виключно джерелам відповідної інформації.