Лабораторная работа 4
OLAP-анализ
Цель работы: Освоение методов технологии OLAP и способов представления данных с использованием многомерных кубов. Изучения инструментария Deductor 4 по многомерному анализу данных.
Задание:
1) Создать первую сводную таблицу (например, товаров, включив в нее суммарные сведения о продажах, остатках и поставках). Таблицу получить путем слияния соответствующих полей из разных таблиц и последующей группировки.
2) Создать вторую сводную таблицу (например, организаций, включив в нее суммарные сведения о продажах и поставках).
3) Создать третью сводную таблицу (например, менеджеров, включив в нее сведения о продажах).
4) Для подготовленных сводных таблиц разработать сценарии OLAP-анализа на основе многомерного представления информации в виде куба и ее отображением с использованием кросс-таблиц и кросс-диаграмм.
5) Создать отчеты по всем разработанным сценариям.
6) Продемонстрировать проект преподавателю с использованием тестовых наборов данных и защитить работу.
Краткая теория и методические указания
OLAP-куб
Куб представляет собой один из распространенных методов комплексного многомерного анализа данных, получивших название OLAP (On-Line Analyzing Process). В его основе лежит представление данных в виде многомерных кубов, называемых также OLAP-кубами или гиперкубами. По осям многомерной системы координат откладываются те или иные параметры анализируемого бизнес-процесса. Например, для продаж это может быть товар, регион, тип покупателя.
Обычно в качестве одного из измерений используется время. По осям (измерениям) многомерной системы координат находятся данные, количественно характеризующие процесс - факты. Это могут быть объемы продаж в штуках или в денежном выражении, остатки на складе, издержки, суммы и т.д. Пользователь, анализирующий информацию, может выполнять сечение куба по различным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по неделям) данные и осуществлять другие операции необходимые для эффективного анализа.
Чтобы получить на основе текущей выборки данных кросс-таблицу и соответствующую кросс-диаграмму необходимо выполнить следующие шаги:
Настройка назначений полей, рассмотрена в лабораторной работе № 1.
Настройка размещения измерений.
Размещение измерений
Здесь следует определить расположение измерений, выбранных на предыдущем шаге, – по строкам или по столбцам. Для работы с измерениями в окне имеются 3 поля:
1) Доступные измерения – содержит заголовки измерений, размещение которых в кросс-таблице еще не определено (т.е. они в кросс-таблице отображаться не будут);
2) Измерения в строках – для измерений, помещенных в это поле, факты в кросс-таблице будут располагаться горизонтально;
3) Измерения в столбцах – для измерений, помещенных в это поле, факты в кросс-таблице будут располагаться вертикально.
Кроме полей для настройки размещения измерений в окне имеется поле «Факт», которое позволяет выбирать факты, отображаемые в кросс-таблице. Чтобы факт был отображен, слева от него должен быть установлен флажок. Сброс флажка позволяет скрыть факт. Для каждого факта можно установить функцию агрегации. Для этого дважды щелкнуть мышью в столбце «Агрегация» для соответствующего факта и из списка выбрать нужный пункт. Для вещественного и целого типов данных факта могут быть доступны следующие виды агрегации:
сумма, среднее;
минимум, максимум;
количество.
Для остальных типов данных доступна только одна функция агрегации - «Количество».
Кросс-таблица. Кросс-диаграмма
Кросс-таблица – удобное средство визуализации многомерных данных и получения необходимых форм отчетов. Кросс-таблица строится на основе многомерного представления в виде OLAP-куба и содержит измерения и факты, определенные при построении куба. Основной особенностью кросс-таблицы является то, что ее структура не является жестко определенной. Манипулируя с помощью мыши заголовками измерений, пользователь может добиться, чтобы кросс-таблица выглядела наиболее информативно.
Кросс-диаграмма представляет собой диаграмму заданного типа, построенную на основе кросс-таблицы. Основное отличие кросс-диаграммы от обычной диаграммы в том, что она однозначно соответствует текущему состоянию кросс-таблицы и при любых ее изменениях изменяется соответственно.
При работе с кросс-диаграммой предусмотрена возможность увеличения масштаба просмотра всей кросс-диаграммы или ее произвольной области. Для этого следует, удерживая левую кнопку мыши нажатой, выделить ту область кросс-диаграммы, которую нужно просмотреть более детально, при этом двигая мышь слева направо. Как только кнопка мыши будет отпущена, масштаб просмотра выделенной области будет увеличен. Для дальнейшего увеличения масштаба данную процедуру можно повторить. При выделении области диаграммы движением мыши слева направо масштаб просмотра диаграммы будет возвращен к исходному, независимо от размера выделенной области. Направив указатель мыши в произвольную точку диаграммы, и передвигая ее с нажатой правой кнопкой, можно перемещать диаграмму по экрану, делая доступными для просмотра различные ее части.
Контрольные вопросы
1) Поясните основные принципы технологии OLAP.
2) Какие операции используются в OLAP-анализе?
3) Какие манипуляции с кросс-таблицами и кросс-диаграммами используются для улучшения представления сводных данных?
4) Каким образом осуществляется слияние данных из нескольких наборов данных в платформе Deductor 4?
5) В чем заключается группировка данных, и в каких целях она применяется?