Если вы хотите потренироваться работать с Tableau, помните, что можете использовать любой из публичных массивов данных, перечисленных во введении к второй части этой книги. Когда вы загружаете массив данных в программу, Tableau дает вам возможность перетаскивать различные визуальные инструменты (например, географические карты, круговые диаграммы, точечные диаграммы) и тем самым сегментировать информацию. Графики и диаграммы могут быть дополнительно украшены цветом, который Tableau определит интуитивно, а также вам будет доступен широкий диапазон вариантов форматирования для выделения сегментов с помощью ярлыков. Лучший способ учиться – это практика, и благодаря Tableau вы сможете организовать собственное обучение: выделить некоторое время для себя в выходные дни, загрузить массив данных в программу и заняться визуализацией.
Использование визуального анализа для начала анализа
Давайте представим, что вас вызвали в качестве аналитика данных в общенациональный немецкий банк, который уже определил свою проблему: нужно пересмотреть и в конечном итоге изменить то, как банк рекламирует и продает страховые продукты своим клиентам, и сегментировать их в соответствии со сферами его интересов.
Вы могли бы сначала рассмотреть, есть ли какие-либо очевидные категории, чтобы сгруппировать людей на основе подготовленных банком данных.
Как мы видели в главах 6 и 7, для решения этой проблемы можно использовать множество различных подходов. С помощью визуального анализа, чтобы добавить цвет (в буквальном и переносном смысле) к нашим выводам, мы также можем получить любые демографические данные, которые банк собрал о своих клиентах, – возраст, почтовый индекс, арендная плата, лояльность, средние расходы, размер семьи – и изучить логические выводы и соотношения между этими демографическими данными. Добавляя данные в Tableau, Power BI или любое другое программное обеспечение визуализации, мы можем получить некоторые важные сведения, которые в противном случае было бы непросто увидеть. Прогоняя данные через инструмент визуализации, мы выделяем демографию и получаем представление о том, как данные функционируют в условиях сочетания различных демографических характеристик.
Моя первая попытка, учитывая специфику банковского дела, состояла бы в разделении клиентов по их возрасту. Я могу сделать логичное предположение, что деление по возрасту часто используется в банковской отрасли, потому что банковские кредиты (для студентов, для покупателей первого дома, для молодых семей) зависят в первую очередь от возраста клиентов. Инструмент визуализации данных может показать нам, как возраст влияет на другую демографическую информацию, предоставленную банком.