Мария Крючок, старший преподаватель НаУКМА и преподаватель Киевской школы экономики, в авторской колонке рассматривает важность контекста во время анализа больших массивов данных, утверждая, что именно этот аспект имеет большее значение, чем объемы данных.
Об этом сообщает ProIT
Во время пандемии COVID-19 автор проводила анализ пожертвований для одного украинского онлайн-медиа. Она обнаружила, что существуют определенные дни недели, когда читатели активно делают пожертвования, а среда оказалась днем, когда информационные кампании не приносят результатов. Это позволило изменить стратегии маркетинга, а редакторам планировать выходы материалов более эффективно.
Наиболее важным в этом анализе был контекст, в котором работало медиа: пандемия, изменения в экономике, корпоративная культура редакции и необходимость трансформации бизнес-модели. Хотя всегда можно собирать больше данных, важно помнить, что их количество не всегда гарантирует качество управленческих решений.
Актуальность контекста в анализе данных
Сейчас данных становится все больше, а инструментов для их анализа — также. Однако доступ к этим данным есть у каждого, кто имеет интернет. Кажется, достаточно лишь написать правильный запрос. Тем не менее большие данные часто создают иллюзию объективности, что приводит к искажению выводов. Достаточно ли 2 ГБ данных, или большие данные начинаются с 100 ГБ? Важно не просто собрать больше данных, а найти их смысл.
В Украине существует множество открытых государственных данных благодаря публичным реестрам, созданным после законодательных изменений 2015 года. В 2018 году отмечалось, что развитие открытых данных может принести экономике до 1,4 миллиарда долларов к 2025 году. Однако, несмотря на эти прогнозы, открытые данные не приобрели популярности, и лишь несколько компаний, таких как YouControl и Opendatabot, смогли их успешно использовать.
Искусственный интеллект и корпоративные данные
По данным Gartner, в 2024 году половина ИТ-директоров признавались, что имеют завышенные ожидания от искусственного интеллекта в отношении возврата инвестиций. В 2025 году компании начали интересоваться генеративным ИИ (GenAI), который предлагает новые возможности для тестирования гипотез и повышения точности данных. Однако важно не забывать о контексте — если данные неоднородны, это усложняет их анализ.
Данные могут оставаться без действия, пока не найдется запрос или событие, которое создаст для них значение. Например, доступ к паролям советника по национальной безопасности США, которые никому не были интересны, стал важным после появления скандала, связанного с ними.
Таким образом, настоящая ценность данных определяется не их количеством, а глубиной понимания контекста. Спрашивайте себя: какую проблему мы решаем? Какая информация является значимой? Способность понимать смыслы и задавать правильные вопросы является ключом к эффективным решениям.