В январе 2025 года во время судебного процесса выяснилось, что компания Meta, основанная Марком Цукербергом, незаконно использовала миллионы книг для обучения искусственного интеллекта Llama. Теперь есть возможность узнать, какие именно произведения были «спиратены».
Об этом сообщает ProIT
Большие языковые модели искусственного интеллекта требуют значительных наборов текстовых данных, чтобы обеспечить точность в воспроизведении языка. Однако найти легальные оригинальные материалы становится все труднее.
Использование пиратской библиотеки
«У нас буквально заканчивается текст во Вселенной, на котором можно обучать эти системы», — отметил ученый-информатик Стюарт Рассел в 2023 году.
В рамках судебного разбирательства было установлено, что Meta незаконно загрузила известную пиратскую библиотеку LibGen, чтобы получить миллионы защищенных законом текстов. Программисты получили устное одобрение от Цукерберга на использование этих книг для обучения языковых моделей. Это вызвало возмущение, поскольку одна из крупнейших корпораций в мире не заплатила ни копейки за использованные материалы.
Новый инструмент поиска
Сайт The Atlantic разработал поисковую систему, которая позволяет пользователям выявить, какие книги из файлов LibGen были использованы Meta. Этот инструмент охватывает большой объем данных, содержащих более 7,5 миллиона книг и около 81 миллиона научных работ.
«Моя книга здесь — и это хорошо! LibGen делает тексты доступными для людей, которые иначе не имели бы доступа. Проблема заключается не в том, что LibGen делает контент доступным бесплатно, а в том, что Meta крадет этот материал ради прибыли», — заявил автор Wired Джастин Линг.
Иск был инициирован авторами Та-Нехиси Коутсом и Сарой Сильверман, которые ранее уже имели опыт в борьбе с пиратством данных через Meta. Ожидается, что окончательное решение по делу будет объявлено не ранее лета. Тем временем Llama доступен на таких платформах, как Facebook, Instagram и WhatsApp. Это не единственное судебное преследование против крупной корпорации: год назад авторы подавали в суд на NVIDIA.