Хотя визуальный анализ, возможно, в конечном итоге упрощает проблему, он также может помочь определить отправную точку или обобщить результаты более подробного исследования. Работая с большими объемами данных, человеку трудно разобраться в них только с помощью цифр и таблиц. Как только мы придаем этим данным некую форму и добавляем к ним цвет, направление и движение, они становятся намного понятнее.
Прежде чем перейти непосредственно к визуализации, давайте немного поговорим об аналитике.
Визуальный анализ: до или после анализа данных?
Мне нравится применять принцип Парето, чтобы проиллюстрировать, как визуальная аналитика может способствовать процессу анализа и обработки данных. Согласно этому принципу 80 % последствий являются результатом 20 % причин – концепция, часто применяемая в бизнесе для описания того, как, например, 20 % клиентов могут обеспечить 80 % продаж. Визуализация наших данных должна прояснить, где находятся наиболее релевантные записи данных, и, если время поджимает, легко показать, в каком месте массива данных мы должны сосредоточить свою энергию.
Этот подход эффективно работает до начала проекта, когда мы можем выделить корреляции на ранней стадии процесса. Визуальный анализ способен дополнительно помочь пересмотреть то, что мы уже обнаружили, и расширить контекст полученных результатов уже после завершения анализа. Это исключительно полезно для тех, кто имеет дело с одними и теми же массивами данных на долгосрочной основе: часто проводя визуальный анализ записей, мы можем быстро идентифицировать изменения и возникающие тенденции, не обращаясь к подробным алгоритмам.
Остается вопрос: визуализировать до или после анализа? Я рекомендую новичкам в науке о данных серьезно рассмотреть возможность визуализации данных как до, так и после проведения надлежащего анализа. В конце концов, когда мы полностью погружены в проект, распознать тенденции может быть сложно. И именно это Меган Патни, менеджер по развитию Mike’s Hard Lemonade Co (американского производителя напитка), делает, чтобы отслеживать продажи продукции своей компании.
Кейс: Mike’s Hard Lemonade Co
Меган еженедельно визуализирует большие массивы данных своей компании из более чем двух миллионов единиц, чтобы показать, каково положение с запасами и продажами продукции по всей территории Соединенных Штатов и в каждом штате. Визуализации в программе Tableau (см. раздел об использовании Tableau) помогают Меган не только сообщать о производительности компании заинтересованным сторонам, но и указывать отстающий штат, тем самым подталкивая команду к принятию мер по улучшению ситуации.