Анализ и визуализация данных в электронных таблицах - Валентин Юльевич Арьков

Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.

Читать Анализ и визуализация данных в электронных таблицах (Арьков) полностью

© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-4910-6

Создано в интеллектуальной издательской системе Ridero

Предисловие

Перед вами продолжение серии работ, позволяющих познакомиться с основными технологиями бизнес-аналитики. Как ни странно, многое можно сделать в рамках пакета Excel, который теперь выступает в роли знакомого и интуитивно понятного интерфейса к продвинутым инструментам анализа данных.

В данной работе мы рассмотрим создание реляционной модели данных, а также построение и визуализацию иерархии в агрегированных данных с использованием надстроек Power Pivot и Power View для Excel.

Введение

В предыдущих работах мы рассмотрели базовый инструмент анализа данных — сводные таблицы PivotTables. Затем мы познакомились со средствами ETL (извлечения, преобразования и загрузки данных) — Get & Transform / Power Query.

В данной работе мы сделаем следующий шаг в освоении средств бизнес-аналитики — рассмотрим модель данных и надстройку Power Pivot. Мы познакомимся с ними на примере Microsoft Excel в сочетании с надстройками из программного комплекса Power BI.

Power Pivot позволяет работать с гораздо бóльшими объёмами данных, чем стандартный Excel. Напомним, что в пакете Excel максимальное количество строк на одном листе составляет чуть больше ОДНОГО МИЛЛИОНА. Использование специализированной надстройки снимает это ограничение.

Название Power Pivot говорит о том, что это средство для обобщения данных: Pivot Table — это сводная таблица. Слово Power означает, что это часть программного комплекса Power BI.

Power Pivot позволяет обрабатывать данные и вычислять обобщённые показатели, которые затем можно представить на экране с помощью разнообразных средств визуализации:

— Excel;

— Power View;

— Power Map / 3D Maps;

— Power BI Dashboards.

Задание. Прочитайте статью «Power Pivot» в английской версии Википедии. При необходимости используйте машинный перевод, например, в браузере Google Chrome. Выясните, какую модель аналитической обработки реализует Power Pivot.

Модель данных

Построение сводных таблиц и агрегирование данных может выполняться по нескольким таблицам с использованием модели данных.

Английское название: Data Model.

Модель данных в Excel соответствует логической структуре реляционной базы данных. Данные расположены в нескольких таблицах, которые связаны друг с другом по ключевому полю.

Модель данных можно импортировать из базы данных либо сформировать вручную.

Надстройка PowerPivot позволяет работать с визуальным преставлением модели данных и создавать связи «один ко многим».