Лабораторная работа 8
Кластерный анализ с использованием карт Кохонена
Цель работы: Освоение основных методов и способов кластеризации с использованием самоорганизующихся карт Кохонена, освоение принципов построения и использования простейших нейронных сетей, приобретение практических навыков по использованию инструментария Deductor 4.
Задание:
1) Разработать сценарии построения самоорганизующихся карт Кохонена.
2) Создать сводную таблицу (например, организаций), включив в нее суммарные сведения (например, о продажах, оплате и поставках). Таблицу получить путем слияния соответствующих полей из разных таблиц и последующей группировки.
3) Для подготовленной сводной таблицы разработать сценарий кластеризации с использованием самоорганизующихся карт Кохонена.
4) Создать отчеты по всем разработанным сценариям.
5) Продемонстрировать проект преподавателю с использованием тестовых наборов данных и защитить работу.
Краткая теория и методические указания
Самоорганизующиеся карты признаков Кохонена
Самоорганизующиеся карты признаков (СКП) являются разновидностью неуправляемых нейросетей. Они были предложены Тьюво Кохоненом в начале 80 х г. и нашли широкое применение в инженерной области (для распознавания речи, в робототехнике и др.).
Технология СКП представляет собой набор аналитических процедур и алгоритмов, позволяющих преобразовать традиционное описание множества объектов, заданных в многомерном (n>3) пространстве признаков плоской базы данных, в двумерную карту. Полученная карта устроена таким образом, что близким объектам в многомерном пространстве отвечают рядом стоящие точки (их образы) на карте.
В результате, трудно анализируемые в совокупности многомерные объекты получают простой и наглядный вид на двумерной карте, которая сохраняет их основные свойства (топологию и распределение в многомерном пространстве).
Применение технологии СКП дает ряд преимуществ:
обнаружение групп объектов с одинаковыми характеристиками (далее – кластеров) по их локализованному расположению на специально создаваемой карте кластеров;
проверка содержательного описания обнаруженных групп по специфическим особенностям, обнаруженным на карте признаков, а также на проекциях карты кластеров на каждый признак в отдельности;
выявление неявных связей и закономерностей между признаками;
проведение оценки объектов в динамике, оценка изменений как в целом по структуре кластеров, так и по отдельности;
позиционирование на карту новых объектов для придания им статуса (рейтинга);
прогнозирование значений одних признаков объектов через другие;
фильтрация объектов за счет поисковых уникальных критериев, формируемых в терминах СКП.
Разберем действие нейросетевой модели самоорганизующихся карт Кохонена для маркетингового анализа.
Как уже было указано, в применении традиционных способов маркетингового анализа, в принципе, характеристики организаций на рынке можно получить, анализируя различные показатели их работы и связи между ними. Для этого следует использовать данные финансовых отчетов. Из них эксперты извлекают значения различных параметров (активы, капитализацию, прибыль и т.д.). Но для получения достаточно достоверной информации приходится анализировать много взаимосвязей большого количества параметров. Эта задача достаточно сложна. Часто для описания субъекта рынка используется несколько десятков различных показателей, а человек обычно не может оперировать более чем 3 параметрами одновременно. Поскольку информации для анализа нужно много и чаще всего она разнородна, то невозможно окинуть одним взглядом весь этот набор.
В современном маркетинге достаточно часто возникает задача анализа данных, которые с трудом можно представить в математической числовой форме. Это случай, когда нужно извлечь данные, принципы отбора которых заданы нечетко: выделить надежных партнеров, определить перспективный товар, выявить основных конкурентов.
Предположим, что имеется информация о деятельности нескольких десятков фирм на рынке (их открытая финансовая отчетность) за некоторый период времени. По окончании этого периода исследователю известно, какие из этих фирм обанкротились, а какие продолжают стабильно работать (на момент окончания периода). И теперь следует решить вопрос о том, какие из них являются приоритетными, с точки зрения сотрудничества. Значит, следует каким-то образом решить задачу анализа рисков сотрудничества с различными коммерческими структурами.
На первый взгляд, решить эту проблему несложно – есть данные о работе фирм и результат их деятельности. Но, при этом возникает сложность, связанная с тем, что имеющиеся данные описывают прошедший период, а исследователю интересно то, что будет в дальнейшем. Таким образом, необходимо на основании имеющихся априорных данных получить прогноз на дальнейший период. Для решения этой задачи можно использовать различные методы.
Так, например, наиболее очевидным является применение методов математической статистики. Однако недостатком подобных методов является потребность большого объема априорных данных, а в выбранном примере может быть ограниченное их количество. При этом статистические методы зачастую не могут гарантировать успешный результат.
Следовательно, нужно попытаться найти эти закономерности, с тем, чтобы использовать их в дальнейшем. И тут возникает вопрос о том, как найти эти закономерности. Для этого, если будут использоваться методы статистики, исследователь должен определить, какие критерии «похожести» использовать, это может потребовать от него каких-либо дополнительных знаний о характере задачи.
Другим путем решения этой задачи может быть применение нейронных сетей. Метод анализа с использованием самоорганизующихся карт Кохонена – это метод, позволяющий автоматизировать все действия по поиску закономерностей. Рассмотрим, как решаются такие задачи и как карты Кохонена находят закономерности в исходных данных. Для общности рассмотрения здесь и далее будем использовать термин объект (например, объектом может быть фирма-клиент, как в рассмотренном выше примере, но описываемый метод без изменений подходит для решения и других задач, например, анализа конкуренции, поиска оптимальной стратегии поведения на рынке). В данной работе описывается способ применения указанного метода для анализа клиентов на рынке (реальных и потенциальных).
Каждый объект характеризуется набором различных параметров, которые описывают его состояние. Для примера по анализу фирм-клиентов параметрами можно взять данные из финансовых отчетов. Эти параметры часто имеют числовую форму или могут быть приведены к ней.
Как уже было указано выше, решение задачи предполагает на основании анализа параметров объектов выделение схожих объектов и представление результата в форме, удобной для восприятия. Все эти подзадачи успешно и эффективно решаются самоорганизующимися картами Кохонена. В целях упрощения рассмотрения будем считать, что объекты имеют 3 признака (на самом деле их может быть любое количество).
Предположим, что все эти три параметра объектов представляют собой их координаты в трехмерном пространстве. Например, для промышленного предприятия это могут быть следующие показатели: капитализация, объем реализованной продукции, прибыль. Тогда каждый объект можно представить в виде точки в этом пространстве, что и сделаем (чтобы не было проблем с различным масштабом по осям, пронормируем все эти признаки в интервал [0,1] любым подходящим способом). В результате проведенной нормировки, все точки попадут в куб единичного размера. Отобразим эти точки (рис.2).
Рис. 2. Расположение объектов в трехмерном пространстве
Рис. 3. Карта Кохонена
Анализ полученного рисунка позволяет увидеть, как расположены объекты в пространстве, причем легко заметить участки, где объекты группируются (сгущения). Распределение объектов, таким образом, означает, что у них схожи параметры, значит, и сами эти объекты принадлежат одной группе. Очевидно, что такой легкий способ можно применить только в том случае, когда признаков немного, поскольку человеческий разум не может представить изображение четырехмерного пространства. Следовательно, необходимо найти способ, которым можно преобразовать данную систему в простую для восприятия, желательно двумерную систему (потому что уже трехмерную картинку невозможно корректно отобразить на плоскости) так, чтобы соседние в изучаемом пространстве объекты оказались рядом и на полученной картинке. Для этого используем самоорганизующуюся карту Кохонена. В первом приближении ее можно представить в виде гибкой сети (рис.3).
Эластичную сеть карты исследователь помещает в пространство признаков, где уже имеются объекты, которые необходимо проанализировать. Далее система работает следующим образом: берется один объект (точка в исследуемом пространстве) и выявляется ближайший к нему узел сети. После этого данный узел подтягивается к объекту (сетка эластична, поэтому вместе с этим узлом так же, но с меньшей силой подтягиваются и соседние узлы). Затем выбирается другой объект (точка), и процедура повторяется. В результате строится карта, расположение узлов которой совпадает с расположением основных скоплений объектов в исходном пространстве. Кроме того, полученная карта обладает следующим замечательным свойством – узлы ее расположились таким образом, что объектам, похожим между собой, соответствуют соседние узлы карты (рис.4). Теперь следует определить, в какие узлы карты попали те или иные объекты. Это также определяется ближайшим узлом – объект попадает в тот узел, который находится ближе к нему. В результате всех этих операций объекты со схожими параметрами попадут в один узел или в соседние узлы. Таким образом, можно считать, что благодаря системе самоорганизующихся карт Кохонена исследователь решает задачу поиска похожих объектов и их группировки.
Самоорганизующиеся карты Кохонена обладают и другими возможностями. Они позволяют также представить полученную информацию в простой и наглядной форме путем нанесения раскраски. Для этого исследователь раскрашивает полученную карту цветами, соответствующими интересующим признакам объектов. Возвращаясь к примеру с анализом фирм-клиентов на рынке, можно раскрасить одним цветом те узлы, куда попала хотя бы одна фирма, у которой наблюдаются убытки. Тогда после нанесения цвета мы получим зону, которую можно назвать зоной риска, и попадание интересующей нас фирмы в эту зону говорит о ее ненадежности.
С помощью карт можно также получить информацию о зависимостях между параметрами. Отмечая на карте различные статьи финансовых и экономических отчетов отдельными цветами, менеджер-исследователь получит атлас, хранящий в себе информацию о состоянии рынка. Сравнивая расположение цветов на раскрашенных картах, подготовленных таким образом, руководитель получает полную информацию о финансовом и экономическом портрете фирм-клиентов – банкротов, неудачников, процветающих фирм, «середняков». Например, таким показателем может быть чистая прибыль фирмы.
Рис. 4. Вид пространства после наложения карты
При всем этом, описанная технология является универсальным методом анализа. С ее помощью можно анализировать различные стратегии деятельности, производить анализ результатов маркетинговых исследований, проверять кредитоспособность клиентов и т.д. В данной работе технология самоорганизующихся карт Кохонена применяется для анализа клиентской базы. Этот универсальный многофункциональный инструмент анализа способен предоставить достаточно четкую картину реальных и потенциальных клиентов-фирм, работающих на рынке. Эта технология также полезна и потому, что в России большая часть деловой информации является засекреченной, и, в результате, информация, на основании которой приходится работать, крайне искажена и часто носит неправдоподобный характер.
Таким образом, имея перед собой карту, исследователь может достаточно достоверно судить об объектах, даже если имеет неполную информацию об этих объектах. В результате, можно извлекать информацию из базы данных, основываясь на нечетких характеристиках.
В отличие от классических методов, самоорганизующиеся карты обеспечивают простую визуализацию данных, навязывают несколько меньшее количество предположений и ограничений и обнаруживают изолированные структуры в данных, оперируя с большим количеством комплексных данных.
Учитывая показанные возможности самоорганизующихся карт, можно определить следующие основные области применения этих карт в маркетинге:
Анализ товарных рынков на основании потребительских предпочтений.
Сегментирование покупателей и клиентов.
Информационное обеспечение выработки маркетинговых решений и анализа рынка.
Конкурентный анализ.
Алгоритм функционирования самоорганизующихся карт (Self Organizing Maps – SOM) представляет собой один из вариантов кластеризации многомерных векторов – алгоритм проецирования с сохранением топологического подобия.
Примером таких алгоритмов может служить алгоритм k-ближайших средних (k means). Важным отличием алгоритма SOM является то, что в нем все нейроны (узлы, центры классов) упорядочены в некоторую структуру (обычно двумерную сетку). При этом в ходе обучения модифицируется не только нейрон-победитель (нейрон карты, который в наибольшей степени соответствует вектору входов, и определяет, к какому классу относится пример), но и его соседи, хотя и в меньшей степени. За счет этого SOM можно считать одним из методов проецирования многомерного пространства в пространство с более низкой размерностью. При использовании этого алгоритма, вектора, схожие в исходном пространстве, оказываются рядом и на полученной карте.
SOM подразумевает использование упорядоченной структуры нейронов. Обычно используются одно- и двумерные сетки. При этом каждый нейрон представляет собой n-мерный вектор-столбец, где n определяется размерностью исходного пространства (размерностью входных векторов). Применение одно- и двумерных сеток связано с тем, что возникают проблемы при отображении пространственных структур большей размерности (при этом опять возникают проблемы с понижением размерности до двумерной, представимой на мониторе).
Обычно нейроны располагаются в узлах двумерной сетки с прямоугольными или шестиугольными ячейками. При этом, как было сказано выше, нейроны также взаимодействуют друг с другом. Величина этого взаимодействия определяется расстоянием между нейронами на карте.
При реализации алгоритма SOM заранее задается конфигурация сетки (прямоугольная или шестиугольная), а также количество нейронов в сети. Некоторые источники рекомендуют использовать максимально возможное количество нейронов в карте. При этом начальный радиус обучения (neighborhood в англоязычной литературе) в значительной степени влияет на способность обобщения при помощи полученной карты. В случае, когда количество узлов карты превышает количество примеров в обучающей выборке, успех использования алгоритма в большой степени зависит от подходящего выбора начального радиуса обучения. Однако, в случае, когда размер карты составляет десятки тысяч нейронов, время, требуемое на обучение карты, обычно бывает слишком велико для решения практических задач. Таким образом, необходимо достигать допустимый компромисс при выборе количества узлов.
Перед началом обучения карты необходимо проинициализировать весовые коэффициенты нейронов. Удачно выбранный способ инициализации может существенно ускорить обучение и привести к получению более качественных результатов.
Существуют три способа инициирования начальных весов:
инициализация случайными значениями, когда всем весам даются малые случайные величины;
инициализация примерами, когда в качестве начальных значений задаются значения случайно выбранных примеров из обучающей выборки;
линейная инициализация, в этом случае веса инициируются значениями векторов, линейно упорядоченных вдоль линейного подпространства, проходящего между двумя главными собственными векторами исходного набора данных.
Обучение карты заключается в последовательности коррекции векторов, представляющих собой нейроны. На каждом шаге обучения, из исходного набора данных случайно выбирается один из векторов, а затем производится поиск наиболее похожего на него вектора коэффициентов нейронов. При этом выбирается нейрон-победитель, который наиболее похож на вектор входов. Под похожестью в данной задаче понимается расстояние между векторами, обычно вычисляемое в евклидовом пространстве.
После того, как найден нейрон-победитель, производится корректировка весов карты. При этом вектор, описывающий нейрон-победитель и векторы, описывающие его соседей в сетке, перемещаются в направлении входного вектора.
Обучение состоит из двух основных фаз: на первоначальном этапе выбирается достаточно большое значение скорости обучения и радиуса обучения, что позволяет расположить вектора нейронов в соответствии с распределением примеров в выборке, а затем производится точная подстройка весов, когда значения параметров скорости обучения много меньше начальных. В случае использования линейной инициализации, первоначальный этап грубой подстройки может быть пропущен.
Самоорганизующиеся карты могут использоваться для решения таких задач, как моделирование, прогнозирование, поиск закономерностей в больших массивах данных, выявление наборов независимых признаков и сжатие информации.
В результате обучения самоорганизующейся карты в исходную выборку данных будут добавлены следующие поля:
1) <ИМЯ ПОЛЯ>_OUT – содержат значения выходных полей, рассчитанные картой.
2) Номер ячейки – содержит номер ячейки карты, в которую попала данная запись.
3) Расстояние до центра ячейки – содержит значение расстояния от данной записи до центра ячейки, в которую эта запись попала.
4) Номер кластера – указывается номер кластера, где расположена ячейка в которую попала данная запись исходной выборки.
5) Расстояние до центра кластера – указывается значение расстояния от ячейки, куда попала данная запись исходной выборки, до центра кластера.
6) <имя поля>_ERR – содержит среднеквадратичную ошибку рассогласования реального значения поля и значения, рассчитанного картой.
Настройка назначения полей
Здесь необходимо определить, как будут использоваться поля исходного набора данных при обучении самоорганизующейся карты и практической работе с ней. Для настройки поля следует выделить его в списке, при этом в правой части окна будут отображены его параметры:
1) Имя поля – идентификатор поля, определенный для него в источнике данных. Изменить его здесь нельзя.
2) Тип данных – тип данных, содержащихся в поле (вещественный, строковый, дата). Он также задается в источнике данных и здесь изменен быть не может.
3) Назначение – здесь необходимо выбрать порядок использования данного поля при обучении и работе самоорганизующейся карты Кохонена. Выбор производится с помощью списка, открываемого кнопкой и содержащего следующие варианты:
Входное – поле будет использовано как одна из координат входного вектора, которые алгоритм построения карты Кохонена будет кластеризовать. По этому полю можно будет впоследствии посмотреть карту распределения значений этого поля.
Выходное – при построении карты это поле использоваться не будет, однако после построения по этому полю будет собрана статистика для каждой ячейки и для каждого кластера полученной карты. Таким образом, можно говорить о выходе (классе) ячейки по этому выходному полю. Например, если выходное поле – это дискретное поле, то выходом ячейки (по этому выходному полю) будет являться самое распространенное значение выходного поля тех строчек данных, которые «попали» в данную ячейку. Если же выходное поле – это непрерывное поле, то выходом ячейки (по этому выходному полю) будет являться среднее значение выходного поля тех строчек данных, которые «попали» в данную ячейку. При таком подходе это поле можно рассматривать как целевое, как если бы мы рассматривали задачу регрессии или классификации.
Информационное – поле не будет использоваться при обучении карты, но будет помещено в результирующий набор в исходном состоянии.
Неиспользуемое – поле не будет использоваться при построении и работе с картой и будет исключено из результирующего набора. В отличие от непригодного, такое поле может быть использовано, если в этом возникнет необходимость.
Непригодное – поле не может быть использовано при построении и работе алгоритма, но будет помещено в результирующий набор в исходном состоянии.
4) Вид данных – указывает на характер данных, содержащихся в поле (непрерывный или дискретный). Изменить это свойство здесь нельзя.
Статус непригодного поля устанавливается только автоматически и в дальнейшем может быть изменен только на неиспользуемое или информационное. Поле будет запрещено к использованию если:
поле является дискретным и содержит всего одно уникальное значение;
непрерывное поле с нулевой дисперсией;
поле содержит пропущенные значения.
Настройка обучающей выборки осуществляется так же, как при построении дерева решений (см. лабораторную работу 7).
Параметры карты Кохонена
В секции «Параметры карты» задается размер карты, т.е. количество ячеек из которых она будет состоять. Для этого в полях «Размер по оси Х» и «Размер по оси Y» следует указать количество ячеек по соответствующим координатам.
В поле «Количество ячеек» отображается общее число ячеек карты. Оно определяется как произведение значений полей «Размер по оси Х» и «Размер по оси Y» и меняется только при их изменении.
В списке «Форма ячеек» выбирается один из вариантов конфигурации ячейки – прямоугольная или шестиугольная. При задании формы ячеек нужно учитывать, что шестиугольники дают более корректные результаты, т.к. расстояние между центрами ячеек ближе к Евклидову, чем между центрами прямоугольников. Скорость обучения выше для прямоугольной формы ячеек.
На данном шаге необходимо задать условие, при выполнении которого обучение карты будет прекращено.
«Считать пример распознанным, если ошибка меньше» – критерием останова в данном случае является условие, что рассогласование между эталонным и реальным выходом карты становится меньше заданного значения.
«По достижению эпохи» – указывается количество эпох, по достижении которого процесс обучения будет остановлен, даже, если не достигнута заданная ошибка. Позволяет избежать «зацикливания» в ситуациях, когда ошибка не достижима. Кроме этого для обучающего и тестового множества в соответствующих секциях окна могут независимо устанавливаться следующие критерии останова обучения:
«Средняя ошибка меньше» – средняя квадратичная ошибка на обучающем множестве или тестовом множестве меньше заданного значения;
«Максимальная ошибка меньше» – максимальная квадратичная ошибка на обучающем множестве и тестовом множестве меньше заданного значения;
«Распознано примеров (%)» – количество распознанных примеров на обучающем множестве и тестовом множестве больше заданного процента.
При выборе нескольких условий останов процесса обучения происходит по достижении хотя бы одного из них.
Обучение карты Кохонена
Обучение карты производится итерационными циклами, каждый из которых называется эпохой. Во время каждой эпохи происходит подстройка весов нейронов карты Кохонена. Подстройка весов во время одной эпохи происходит следующим образом: каждый входной вектор (строчка таблицы) обучающей выборки «подтягивает» к себе ближайший по расстоянию нейрон (нейрон-победитель) карты Кохонена с определенной силой (скорость обучения). Вместе с нейроном-победителем подтягиваются и его соседи. Соседство определяется положением нейронов на 2-х мерной четырехугольной или шестиугольной сетке. Здесь расстояние – это обычное Евклидово расстояние между 2-мя точками в многомерном пространстве (входной вектор и веса нейрона победителя).
Способ начальной инициализации карты позволяет определить, как будут установлены начальные веса нейронов карты. Возможны три варианта:
случайными значениями – начальные веса нейронов будут случайными значениями;
из обучающего множества – в качестве начальных весов будут использоваться случайные примеры из обучающего множества.
из собственных векторов – начальные веса нейронов карты будут проинициализированы значениями подмножества гиперплоскости, через которую проходят два главных собственных вектора матрицы ковариации входных значений обучающей выборки.
При выборе способа начальной инициализации следует руководствоваться следующей информацией:
1) объемом обучающей выборки;
2) количеством эпох, отведенных для обучения;
3) размерами обучаемой карты.
Между указанными параметрами и способом начальной инициализации существует много зависимостей. Однако можно выделить несколько главных:
1) Если объем обучающей выборки значительно (раз в 100) превышает количество нейронов карты и время обучения не играет первоочередную роль, то лучше выбрать инициализацию случайными значениями, т.к. это снизит вероятность попадания в локальный минимум ошибки кластеризации.
2) Если объем обучающей выборки не очень велик или ограничено время обучения, или необходимо уменьшить вероятность появления после обучения «пустых» нейронов (в которые не попало ни одного экземпляра обучающей выборки), то следует использовать инициализацию примерами из обучающего множества.
3) Инициализацию из собственных векторов можно использовать при любом стечении обстоятельств. Единственное, вероятность появления после обучения «пустых» нейронов выше, чем если была бы использована инициализация примерами из обучающего множества. Именно этот способ необходимо выбирать при первом ознакомлении с данными.
Элементы группы Скорость обучения позволяют задать скорость обучения в начале и в конце обучения карты Кохонена. Значения можно выбрать из списка или ввести вручную с клавиатуры. Процесс обучения можно условно разделить на две фазы – грубую подстройку и точную подстройку. Для этапа грубой подстройки характерна достаточно большая коррекция весов нейронов сети по прохождении каждой эпохи. На этапе точной подстройки величина коррекции значительно уменьшается. При этом коэффициент (скорость обучения) с которым многомерные координаты (веса) нейрона победителя и его соседей будут двигаться в сторону очередного экземпляра данных изменяется в зависимости от текущей эпохи обучения по правилу, определяемому следующей функцией: ,(1)
где v – текущий радиус обучения;
vначало – начальная скорость обучения;
vконец – конечная скорость обучения;
Tmax – количество эпох обучения (задается на предыдущем шаге);
T – текущая эпоха обучения.
Рекомендуемые значения для скорости обучения:
в начале обучения 0.1-0.3;
в конце обучения 0.05-0.005.
Элементы группы Радиус обучения позволяют задать радиус обучения в начале и в конце обучения карты Кохонена, а также тип функции соседства. Радиус обучения – это параметр, который определяет, сколько нейронов кроме нейрона-победителя участвуют в обучении. В процессе обучения радиус обучения, обычно, должен постепенно уменьшаться так, чтобы на заключительных этапах в обучении участвовал только нейрон-победитель. При этом радиус обучения изменяется в зависимости от текущей эпохи обучения по правилу, определяемому следующей функцией: ,(2)
где r – текущий радиус обучения;
rначало – начальный радиус обучения;
rконец – конечный радиус обучения;
Tmax – количество эпох обучения (задается на предыдущем шаге);
T – текущая эпоха обучения.
Радиус обучения в начале должен быть достаточно большой – примерно половина или меньше размера карты (максимальное линейное расстояние от любого нейрона до другого любого нейрона); а в конце должен быть достаточно малым – примерно 1 или меньше. Чем больше текущий радиус обучения, тем более грубо подстраивается карта, т.к. приходится корректировать большое количество весов нейронов, и чем меньше текущий радиус обучения, тем более точно подстраивается карта. Начальный радиус обучения подбирается автоматически в зависимости от размера карты. Автоматически подобранный радиус – это всего лишь рекомендуемое значение.
Параметр Функция соседства определяет, какие нейроны, и в какой степени будут считаться соседними по отношению к нейрону-победителю. Этот параметр может принимать два значения: «Ступенчатая», «Гауссова».
Если функция соседства Ступенчатая, то «соседями» для нейрона-победителя будут считаться все нейроны, линейное расстояние до которых не больше текущего радиуса обучения. При этом варианте функции соседства процесс обучения происходит немного быстрее, но качество результата может быть немного хуже, чем если бы использовалась Гауссова функция соседства. Если используется Гауссова функция соседства, то «соседями» для нейрона - победителя будут считаться все нейроны карты, но в разной степени полноты. При этом степень соседства определяется следующей функцией: ,(3)
где h – значение, определяющее степень соседства;
d – линейное расстояние от нейрона - победителя до нейрона «соседа»;
r – текущий радиус обучения.
После определения степени соседства очередного нейрона, его веса будут изменены не с текущей скоростью обучения, а со скоростью равной текущей скорости обучения умноженной на коэффициент, определяющий степень соседства – h.
При использовании Гауссовой функции соседства обучение проходит более плавно и равномерно, т.к. одновременно изменяются веса всех нейронов, что может дать немного лучший результат, чем, если бы использовалась ступенчатая функция. Однако время, необходимое на обучение требуется немного больше по причине того, что на всех эпохах корректируются все нейроны.
Способ определения количества кластеров можно быть установлен как автоматический так и ручной.
Уровень значимости – параметр автоматического определения кластеров. Чем больше этот параметр, тем большее количество кластеров будет получено.
Фиксированное количество кластеров – параметр доступный при ручном определении количества кластеров. Собственно задает желаемое количество кластеров, на которое будут разбиты нейроны карты Кохонена.
Контрольные вопросы
1) Поясните необходимость использования карт Кохонена при кластеризации.
2) Объясните общий принцип построения самоорганизующейся карты признаков Кохонена.
3) Каким образом производится назначение размеров и формы ячеек (нейронов) карты Кохонена?
4) Как осуществляется назначение начальных значений весовых коэффициентов нейронов?
5) Поясните понятия скорости и радиуса обучения нейросети.
6) Какие критерии используются для остановки процесса обучения?