УДК 621.3911:519.281
АППРОКСИМАЦИОННЫЙ МЕТОД РАЗДЕЛЕНИЯ
КОНЕЧНЫХ СМЕСЕЙ ФУНКЦИЙ ГАУССА
И.К. Васильева, к.т.н, доцент
Национальный аэрокосмический университет им. Н.Е. Жуковского «ХАИ»
Построение адекватных аналитических описаний результатов наблюдений является неотъемлемым этапом их вторичной цифровой обработки с целью выявления скрытых закономерностей в совокупности анализируемых данных, исследования их геометрической и вероятностной природы и пр. Математическую суть этих прикладных задач составляют задачи кластерного анализа, классификации и разделения идентифицируемых смесей вероятностных распределений. Смесь базовых функций является одной из наиболее распространенных математических моделей, используемых в задачах классификации без обучения, когда каждый класс интерпретируется как параметрически заданная одномодальная генеральная совокупность (при неизвестном значении определяющего ее параметра), а классифицируемые наблюдения – как выборка из смеси таких совокупностей; при этом число компонент смеси трактуется как количество классов, а удельных веса этих компонент – как их априорные вероятности.
Основным методом решения задачи расщепления смеси является статистический анализ, проводимый в рамках одной из двух логических схем. В первой из них реализуется логика «от оценивания параметров смеси к классификации» (ЕМ-алгоритмы, основанные на методе максимального правдоподобия, методе моментов и т. д.). Во второй, напротив, идут «от классификации к оцениванию»: выбрав начальное разбиение выборочного множества на классы и получив оценки параметров распределений внутри классов, уточняют классификацию и т. д. (алгоритмы SEM адаптивного вероятностного обучения, а также CEM-алгоритмы, в которых для разделения выборочного пространства на множество кластеров используется детерминированное правило, эквивалентное классификации по принципу максимума апостериорной вероятности).
В докладе рассмотрен альтернативный метод оценки параметров смеси функций Гаусса и приведены результаты его применения для описания выборочных данных одномерной функцией в задачах классификации образов и группировки данных.Особенностью разработанного метода является отсутствие этапа предварительного статистического анализа описываемых данных с целью выбора оптимальных начальных приближений. Идея метода заключается в постепенном уточнении оценок параметров смеси по информации о невязках аппроксимации на предыдущей итерации; основные расчетные формулы выведены из аналитической зависимости между точечными значениями базовой функции и ее производной с использованием конечно-разностных уравнений.