Новий захист для ШІ: BrowseSafe від Perplexity

Компанія Perplexity анонсувала запуск інноваційної системи кібербезпеки BrowseSafe, призначеної для захисту штучного інтелекту в мережі від prompt injection — атак, коли шкідливі інструкції приховуються у вмісті веб-сторінок.

Про це розповідає ProIT

Особливості системи BrowseSafe

Як повідомляють розробники, новий продукт здатний блокувати до 91% потенційних загроз, реагуючи на них менш ніж за півсекунди. Це суттєво перевершує можливості попередніх рішень, які працювали із затримкою від 2 до 20 секунд.

Розробка BrowseSafe розпочалася після виявлення уразливості в серпні 2025 року: тоді браузер Comet від Perplexity відкрив ШІ-агентам доступ до конфіденційної інформації, зокрема електронної пошти, банківських рахунків та корпоративних систем. Особливо небезпечними були команди, замасковані у невидимих HTML-коментарях.

Архітектура та ефективність захисту

BrowseSafe демонструє кращі результати порівняно з іншими системами, адже більшість існуючих рішень здатні виявити лише до 85% загроз, а деякі — лише 35%. Таких показників вдалося досягти завдяки впровадженню унікальної архітектури і власного тестового набору BrowseSafe Bench, що враховує різноманітність атак, способи їхнього впровадження та мовну специфіку шкідливих інструкцій.

“За словами розробників, BrowseSafe блокує до 91% загроз і реагує менше ніж за півсекунди”.

Система функціонує на модифікованій моделі Qwen3-30B-A3B-Instruct-2507 та використовує три рівні захисту: спочатку відбувається швидка перевірка контенту, підозрілі випадки аналізуються більш глибокою моделлю, а залишок використовується для подальшого навчання. Це забезпечує швидкість та безперервність роботи для користувача.

Водночас, згідно з тестуванням, багатомовні атаки знижують точність захисту до 76%, а фрагменти, які нагадують команди, можуть вводити систему в оману. Хоча BrowseSafe вже демонструє високу ефективність, близько 9-10% загроз усе ще залишаються невиявленими, особливо якщо вони приховані у нестандартних форматах або на рідкісних мовах.