РАЗДЕЛ 2
МНОГОУРОВНЕВЫЕ МОДЕЛИ ВЕРОЯТНОСТНЫХ СЕТЕЙ
В данном разделе разработана архитектура многоуровневой вероятностной метасети для моделирования изменений байесовской сети в условиях изменяющегося контекста. На основе архитектуры разработаны модель вероятностной метасети для управления параметрами вероятностной сети и модель метасети для управления структурой вероятностной сети в условиях изменяющегося контекста, а также комбинированная модель.
2.1. Архитектура вероятностной метасети
2.1.1. Требования, выдвигаемые к многоуровневой модели вероятностной метасети. Рассмотрим следующую постановку задачи. Стохастическое поведение сложной системы, а точнее изменения значений атрибутов сложной системы, связанных причинно-следственными отношениями, может быть наиболее эффективно описано байесовской сетью с некоторой структурой и параметрами. Обучившись этой структуре и набору параметров, система может достаточно точно выводить значение целевого атрибута (узла классификации) при заданных значениях других атрибутов.
Представим себе, что в окружающей систему среде изменилась некоторая ситуация, как говорят, изменился контекст, и обученные прежде структура и параметры уже плохо описывают новые обучающие данные. В этом случае требуется проходить трудоемкий процесс обучения заново, и обучаться новым структуре и параметрам. При возврате к предыдущему контексту трудоемкий процесс повторяется, потому что вероятностная модель не имеет механизма сохранения предыдущего состояния и предыдущего контекста. В случае, когда смена контекста происходит часто, либо в случае, когда обучающие данные поступают на вход системы обучения беспорядочно, не в хронологическом порядке, процесс постоянной адаптации вероятностной сети невозможен, что следует из анализа сложности методов обучения, приведенного в подразделе 1.3.
Без учета контекста, используя всю выборку обучающих данных, мы получаем практически реализуемое обучение, но результаты такого обучения неудовлетворительны. Структура, которая получается при обучении на полном наборе данных, полученных в разных контекстах, - это некоторая "средняя" структура, которая ни один из контекстов не описывает достаточно хорошо. Точно так же, параметры, полученные при обучении на полном наборе данных, полученных в разных контекстах, - это некоторые "средние" значения параметров, которые ни один из контекстов не описывает достаточно хорошо. Отсюда получается недостаточно высокая точность вывода.
Требования, выдвигаемые к формализму, моделирующему изменения байесовской сети в условиях изменяющегося контекста:
- формализм должен использовать разделение атрибутов на определяющие (предсказывающие) атрибуты системы и контекстные атрибуты, а также отдельно их обрабатывать;
- должен быть реализован механизм управления параметрами вероятностной сети при изменении значений контекстных атрибутов;
- должен быть реализован механизм управления структурой вероятностной сети при изменении значений контекстных атрибутов;
- формализм должен быть многоуровневым и предоставлять возможность моделировать не только изменения предсказывающей вероятностной сети, но и возможные изменения в контекстной сети в случае многоуровневых и вложенных контекстов.
2.1.2. Выделение классов атрибутов для моделирования сложной информационной системы. Проанализировав возможные разделения атрибутов в сложных системах в подразделе 1.4 и взяв за основу работу [12], будем выделять предсказывающие, контекстные и метаконтекстные атрибуты в сложной информационной системе. Введем следующие определения.
Определение 2.1. Атрибут ai является предсказывающим, если хотя бы для одного из его значений ai?=?vij вероятность P(yk | ai?=?vij ) существенно отличается от вероятности P(yk) для некоторого класса yk.
Например, атрибут "курение", соответствующий факту, курит человек или нет, является предсказывающим для атрибута "туберкулез легких".
Определение 2.2. Атрибут aj является контекстным, если он является предсказывающим при предсказании предсказывающих атрибутов, то есть если вероятность P(ai - предсказывающий | aj) существенно отличается от P(ai - предсказывающий ) для некоторого значения атрибута aj.
Контекстным атрибутом может быть, например, "климат", в зависимости от которого влияние предсказывающего атрибута "тучи" на атрибут "дождь" может меняться. Контекстными атрибутами являются национальность и пол говорящего в задачах распознавания речи. В большинстве реальных процессов возможен скрытый контекст, то есть контекст, не отражаемый одним или несколькими атрибутами, присутствующими в системе.
Таким образом, сохраняем идею определения контекстных атрибутов через предсказывающие, предложенную в работе [12], не вводя отдельные определения для свойств атрибутов. Также требуется обеспечение требования из пункта 2.1.1 возможности моделировать не только изменения предсказывающей вероятностной сети, но и возможные изменения в контекстной сети в случае многоуровневых и вложенных контекстов. Для этого вводим определение метаконтекстного атрибута.
Определение 2.3. Атрибут ak является метаконтекстным, если он является контекстным при предсказании контекстных атрибутов, то есть если вероятность P(aj - контекстный | ak) существенно отличается от вероятности P(aj - контекстный) для некоторого значения атрибута aj.
Метаконтекстным атрибутом для контекстных атрибутов "климат" (см. пример к определению 2.2) и предсказывающего для него контекстного атрибута "техногенное состояние на нашей планете" является атрибут "степень экологической защиты", в зависимости от которого влияние "техногенного состояния на нашей планете" на "климат" может меняться. В большинстве реальных процессов метаконтекст является скрытым, то есть не отражается атрибутами, присутствующими в системе.
Так как разрабатываемый формализм многоуровневой вероятностной сети в общем случае будет обеспечивать моделирование изменения состояния вероятн