Статистика государственных финансов
Правила переоформления студенческих работ
Требования к оформлению студенческих работ

Прогнозирование с использованием метода скользящего окна

ГлавнаяИнформатикаБазы данных и экспертные системы
ДисциплинаБазы данных и экспертные системы
ВУЗМГУ

Содержание

Лабораторная работа 5 
Прогнозирование с использованием метода скользящего окна
Цель работы: Освоение основных методов и способов прогнозирования временного ряда, приобретение практических навыков по использованию инструментария Deductor 4, по использованию метода скользящего окна в задачах прогнозирования.
Задание: 
1)	Создать сводную временную таблицу (например, продаж отдельных категорий товаров по количеству и по сумме, включив в нее суммарные сведения о продажах). Таблицу получить путем слияния соответствующих полей из разных таблиц и последующей группировки. При необходимости выполнить сглаживание исходных данных.
2)	Разработать сценарии прогнозирования (например, продаж) на заданный временной период вперед.
3)	Создать сводную временную таблицу (например, сумм оплаты товаров). Таблицу получить путем слияния соответствующих полей из разных таблиц и последующей группировки.
4)	Разработать сценарии прогнозирования (например, сумм оплаты) на заданный временной период вперед.
5)	Создать отчеты по всем разработанным сценариям.
6)	Продемонстрировать проект преподавателю с использованием тестовых наборов данных и защитить работу.
Краткая теория и методические указания
Метод скользящего окна
Прогнозирование позволяет получать предсказание значений временного ряда на число отсчетов, соответствующее заданному горизонту прогнозирования. Алгоритм прогнозирования работает следующим образом. Пусть в результате преобразования методом скользящего окна была получена последовательность временных отсчетов: X(-n), ..., X(-2), X-(-1), X0, X(+1), где X(+1) прогнозируемое значение, полученное с помощью предыдущего этапа обработки (например, линейной регрессии) на основе n предыдущих значений. Тогда, чтобы построить прогноз для значения X(+2) нужно сдвинуть всю последовательность на один отсчет влево, чтобы ранее сделанный прогноз X(+1) тоже вошел в число исходных значений. Затем снова будет запущен алгоритм расчета прогнозируемого значения – X(+2) будет рассчитан с учетом X(+1) и так далее, в соответствии с заданным горизонтом прогноза.
Обработка данных методом скользящего окна применяется при предварительной обработке данных в задачах прогнозирования, когда на вход анализатора (например, нейронной сети) требуется подавать значения нескольких смежных отсчетов исходного набора данных. Термин «скользящее окно» отражает сущность обработки – выделяется некоторый непрерывный отрезок данных, называемый окном, а окно, в свою очередь, перемещается – «скользит» – по всему исходному набору данных. 
В результате будет получена выборка, где в каждой записи будет содержаться поле, соответствующее текущему отсчету (оно будет иметь то же имя, что и в исходной выборке), а слева и справа от него будут расположены поля, содержащие отсчеты, смещенные от текущего отсчета в прошлое и в будущее соответственно. 
Следовательно, обработка методом скользящего окна имеет два параметра: глубина погружения – количество отсчетов в «прошлое» и горизонт прогнозирования – количество отсчетов в «будущее». 
Необходимо отметить, что для граничных положений окна (конец и начало исходной выборки) будут формироваться неполные записи – в начале исходной выборки будут формироваться пустые значения для «прошлых» отсчетов, а в конце – для «будущих». В зависимости от конкретной ситуации, пользователь может включать такие неполные записи в результирующую выборку или исключать их.
Настройка параметров прогнозирования
На данном шаге необходимо настроить связи столбцов для прогнозирования временного ряда. В графе «Столбец» представлены все поля исходной выборки. При этом для них установлено то же назначение, что и при настройке параметров предыдущего этапа обработки, где строилась модель прогноза. В графе «При очередном шаге брать значения из» выбираются поля, значение которых следует использовать для расчета прогнозируемого значения на очередном шаге прогнозирования:
1)	Горизонт прогноза – в данном поле следует указать число шагов прогноза. Практически это определяет количество «будущих» отсчетов, которое будет рассчитано в результате прогноза. 
2)	Добавлять горизонт прогноза – установка данного флажка позволит добавить в результирующую выборку дополнительное поле «Шаг прогноза», в котором для каждой записи будет указан номер шага прогноза, в результате которого она была получена. 
3)	Исходные данные – установка данного флажка позволяет включить в результирующую выборку не только записи, содержащие прогнозируемые значения, но и все записи, которые содержат исходные данные. В этом случае записи, содержащие прогноз будут расположены в конце результирующей выборки.
Диаграмма прогноза
Диаграмма прогноза становится доступной в списке способов представления только для тех ветвей сценария, которые содержат прогноз временного ряда. Основное отличие диаграммы прогноза от обычной диаграммы в том, что на ней, кроме исходных данных отображаются результаты прогноза, при этом исходные данные и прогноз отличаются по цвету.
Все операции, доступные при работе с обычной диаграммой применимы и к диаграмме прогноза.
При настройке параметров диаграммы прогноза можно выбрать поля результирующего набора данных, полученного в результате выполнения операции прогнозирования, которые должны отображаться на диаграмме, назначить для них определенный цвет, определить тип диаграммы, а также настроить отображение подписей и значений по оси X. Для того чтобы поле отображалось на диаграмме прогноза нужно установить флажок рядом с его именем в списке «Имя поля». Сброс флажка, наоборот, позволит скрыть поле на диаграмме. Чтобы определить цвет, которым данное поле будет отображаться на диаграмме прогноза, нужно выполнить двойной щелчок мышью в графе «Цвет» напротив имени поля. В результате будет открыто стандартное окно Windows – «Цвет», в котором пользователь может выбрать нужный цвет. 
Контрольные вопросы
1)	Каким образом определяется достаточность данных для построения модели прогноза.
2)	Какие математические модели могут быть использованы при прогнозировании?
3)	Каким образом следует выбирать глубину погружения?
4)	Следует ли применять сглаживание исходных данных при проведении прогнозирования? Почему?
5)	Как связаны между собой глубина погружения и горизонт прогнозирования?