Компанія Perplexity анонсувала запуск інноваційної системи кібербезпеки BrowseSafe, призначеної для захисту штучного інтелекту в мережі від prompt injection — атак, коли шкідливі інструкції приховуються у вмісті веб-сторінок.
Про це розповідає ProIT
Особливості системи BrowseSafe
Як повідомляють розробники, новий продукт здатний блокувати до 91% потенційних загроз, реагуючи на них менш ніж за півсекунди. Це суттєво перевершує можливості попередніх рішень, які працювали із затримкою від 2 до 20 секунд.
Розробка BrowseSafe розпочалася після виявлення уразливості в серпні 2025 року: тоді браузер Comet від Perplexity відкрив ШІ-агентам доступ до конфіденційної інформації, зокрема електронної пошти, банківських рахунків та корпоративних систем. Особливо небезпечними були команди, замасковані у невидимих HTML-коментарях.
Архітектура та ефективність захисту
BrowseSafe демонструє кращі результати порівняно з іншими системами, адже більшість існуючих рішень здатні виявити лише до 85% загроз, а деякі — лише 35%. Таких показників вдалося досягти завдяки впровадженню унікальної архітектури і власного тестового набору BrowseSafe Bench, що враховує різноманітність атак, способи їхнього впровадження та мовну специфіку шкідливих інструкцій.
“За словами розробників, BrowseSafe блокує до 91% загроз і реагує менше ніж за півсекунди”.
Система функціонує на модифікованій моделі Qwen3-30B-A3B-Instruct-2507 та використовує три рівні захисту: спочатку відбувається швидка перевірка контенту, підозрілі випадки аналізуються більш глибокою моделлю, а залишок використовується для подальшого навчання. Це забезпечує швидкість та безперервність роботи для користувача.
Водночас, згідно з тестуванням, багатомовні атаки знижують точність захисту до 76%, а фрагменти, які нагадують команди, можуть вводити систему в оману. Хоча BrowseSafe вже демонструє високу ефективність, близько 9-10% загроз усе ще залишаються невиявленими, особливо якщо вони приховані у нестандартних форматах або на рідкісних мовах.