Інноваційне стиснення даних на основі ШІ з LMCompress

Дослідники з Китаю та Канади презентували інноваційну концепцію стиснення даних на основі штучного інтелекту під назвою LMCompress. Цей алгоритм дозволяє суттєво зменшити обсяги даних без втрат, що особливо актуально в умовах швидкого обміну інформацією між користувачами.

Про це розповідає ProIT

З огляду на зростаючі потреби в ефективному зберіганні та передачі великих обсягів даних, особливо на електронних носіях, ця технологія стає надзвичайно важливою. Під час презентації концепції провідний автор дослідження, Мінг Лі, зазначив, що суть LMCompress полягає в розумінні даних.

Принципи роботи алгоритму

Як пояснює Мінг Лі, якщо людина добре розуміє матеріал, вона може подати його у стислій формі. Аналогічно, алгоритм LMCompress використовує потужні мовні моделі штучного інтелекту для глибшого засвоєння та обробки даних, що підвищує ефективність їхнього стиснення. Відомий математик Клод Шеннон висунув подібну ідею ще в 1948 році, вважаючи, що правильне розуміння даних дозволяє їх ефективніше передавати.

Мінг Лі наголошує, що якщо велика мовна модель здатна коректно аналізувати дані, вона може з точністю передбачити, які дані слід передавати наступними. Цей підхід дозволяє досягати істотного покращення стиснення даних без втрат їхньої якості. За результатами випробувань, дослідники підтвердили, що завдяки використанню ШІ вдається подвоїти показники стиснення для різних типів інформації, включно з текстами, відео та аудіофайлами.

Перспективи застосування

Мінг Лі також зазначив, що алгоритм LMCompress має потенціал для подальшого вдосконалення та впровадження у реальному житті. З його слів, дослідження відкриває нову еру у стисненні даних за допомогою великих мовних моделей на базі штучного інтелекту, які можуть стати стандартом у всіх гаджетах, замінюючи традиційні алгоритми.

«LMCompress — це алгоритм стиснення, який використовує великі моделі (велика мовна модель для текстів, велика модель для зображень, відео, тощо). Він стискає тексти більш ніж удвічі краще класичних алгоритмів, зображення та аудіо удвічі краще, а відео трохи менш ніж удвічі краще. Тому під час передачі даних ви можете працювати приблизно вдвічі швидше», — підкреслює Мінг Лі.

Наразі результати дослідження опубліковані у відомому журналі Nature Machine Intelligence, що підтверджує значущість цього досягнення в науковій спільноті.