Марія Крючок, старша викладачка НаУКМА та викладачка Київської школи економіки, в авторській колонці розглядає важливість контексту під час аналізу великих масивів даних, стверджуючи, що саме цей аспект має більшу вагу, ніж обсяги даних.
Про це розповідає ProIT
Під час пандемії COVID-19, авторка проводила аналіз пожертв для одного українського онлайн-медіа. Вона виявила, що існують певні дні тижня, коли читачі активно роблять пожертви, а середа виявилась днем, коли інформаційні кампанії не приносять результатів. Це дозволило змінити стратегії маркетингу, а редакторам планувати виходи матеріалів більш ефективно.
Найважливішим у цьому аналізі був контекст, в якому працювало медіа: пандемія, зміни в економіці, корпоративна культура редакції та необхідність трансформації бізнес-моделі. Хоча можна завжди збирати більше даних, важливо пам’ятати, що їхня кількість не завжди гарантує якість управлінських рішень.
Актуальність контексту в аналізі даних
Зараз даних стає все більше, а інструментів для їх аналізу — також. Однак, доступ до цих даних є у кожного, хто має інтернет. Здається, достатньо лише написати правильний запит. Проте великі дані часто створюють ілюзію об’єктивності, що призводить до перекручення висновків. Чи достатньо 2 ГБ даних, чи великі дані починаються з 100 ГБ? Важливо не просто зібрати більше даних, а знайти їхній сенс.
В Україні існує безліч відкритих державних даних завдяки публічним реєстрам, створеним після законодавчих змін 2015 року. У 2018 році зазначалось, що розвиток відкритих даних може принести економіці до 1,4 мільярда доларів до 2025 року. Однак, попри ці прогнози, відкриті дані не набули популярності, і лише кілька компаній, таких як YouControl та Opendatabot, змогли їх успішно використати.
Штучний інтелект та корпоративні дані
За даними Gartner, у 2024 році половина ІТ-директорів зізнавались, що мають завищені очікування від штучного інтелекту щодо повернення інвестицій. У 2025 році компанії почали зацікавлюватись генеративним ШІ (GenAI), який пропонує нові можливості для тестування гіпотез і підвищення точності даних. Проте важливо не забувати про контекст — якщо дані неоднорідні, це ускладнює їхній аналіз.
Дані можуть залишатись без дії, поки не знайдеться запит або подія, яка створить для них значення. Наприклад, доступ до паролів радника з національної безпеки США, які нікому не були цікаві, став важливим після появи скандалу, пов’язаного з ними.
Таким чином, справжня цінність даних визначається не їхньою кількістю, а глибиною розуміння контексту. Запитуйте себе: яку проблему ми вирішуємо? Яка інформація є значущою? Здатність розуміти сенси та задавати правильні запитання є ключем до ефективних рішень.