Creative Commons, відома некомерційна організація, що просуває ліцензування для відкритого обміну контентом із збереженням авторських прав, оголосила про запуск нового проєкту CC signals, який має стати основою для прозорого використання даних у сфері штучного інтелекту.
Про це розповідає ProIT
Новий підхід до обміну даними для ШІ
Проєкт CC signals покликаний дозволити власникам датасетів детально визначати, як саме їхній контент може бути використаний машинами, наприклад, для навчання моделей штучного інтелекту. Це рішення має допомогти знайти баланс між відкритістю інтернету та потребою в дедалі більшій кількості даних для розвитку ШІ.
Creative Commons попереджає, що подальше безконтрольне вилучення даних може призвести до обмеження відкритості мережі, коли власники сайтів почнуть закривати доступ до своїх ресурсів або вводити платні стіни замість того, щоб ділитися інформацією.
Юридичні та технічні інструменти для прозорості
CC signals пропонує юридично та технічно обґрунтоване рішення для встановлення зрозумілих правил обміну датасетами між тими, хто контролює дані, та тими, хто використовує їх для навчання штучного інтелекту. Попит на такі інструменти стрімко зростає, оскільки компанії переглядають свої політики та умови використання, обмежуючи навчання ШІ на власних даних або чітко пояснюючи, як саме ці дані будуть використані у сфері ШІ.
Деякі великі інтернет-платформи вже експериментують із різними підходами до захисту своїх даних: наприклад, X спершу дозволила стороннім розробникам навчати ШІ на відкритих даних, але згодом відмовилася від цієї практики. Reddit використовує файл robots.txt для обмеження роботи ботів, які збирають контент для навчання ШІ. Cloudflare розглядає можливість стягування плати з ботів ШІ за скрапінг даних, а також впроваджує інструменти, що вводять їх в оману. Розробники відкритого коду створюють рішення, які уповільнюють роботу ботів, що ігнорують заборону на сканування.
Натомість CC signals пропонує набір інструментів із різним рівнем юридичної сили, але всі вони мають важливе етичне значення, як і ліцензії Creative Commons, які сьогодні охоплюють мільярди відкритих творів у мережі.
“CC signals призначені для підтримки спільного ресурсу в епоху ШІ”, — зазначила генеральна директорка Creative Commons Анна Тумадоттір. “Як колись ліцензії CC допомогли створити відкриту мережу, так зараз CC signals сприятимуть формуванню відкритої екосистеми ШІ на засадах взаємності”.
Наразі проєкт перебуває на етапі розробки: перші концепції вже опубліковано на офіційному сайті та GitHub. Організація запрошує громадськість до обговорення та збору відгуків перед запуском альфа-версії, який заплановано на листопад 2025 року. Також у рамках проєкту відбудеться серія відкритих зустрічей для обговорення та відповідей на запитання.