УДК 004.932.2
КЛАСТЕРИЗАЦИЯ ЗНАЧЕНИЙ ПИКСЕЛЕЙ ИЗОБРАЖЕНИЙ С УЧЕТОМ МЕТРИКИ ЦВЕТОВОГО РАЗЛИЧИЯ CIEDE2000
В.В. Плетнев, студент 529СТ гр.; Н.Н. Пономаренко, д.т.н., профессор
Национальный аэрокосмический университет им. Н.Е. Жуковского «ХАИ»
Адекватное человеческому восприятию оценивание различия между двумя цветовыми образцами является востребованным при решении многих задач цифровой обработки изображений, в частности, при оценивании визуального качества изображений при наличии эталона, при внедрении в изображения цифровых водяных знаков, в сжатии изображений и видео с потерями. Для этого международным комитетом CIE был разработан ряд метрик, таких как CIE76, CIE94, CIEDE2000. Самой сложной и учитывающей наибольшее число факторов и особых случаев из них является метрика CIEDE2000, которая и рассматривается в данной работе.
При кластеризации изображений по цветовым признакам требуется разбить все пиксели изображения на заданное количество групп (кластеров), каждая из которых будет задана своим центром. При этом необходимо минимизировать среднеквадратическое отличие (СКО) цвета пикселей изображения от ближайшего к ним центра кластера. В случае использования для этого евклидова расстояния минимальное СКО обеспечивает кластеризация обобщенным алгоритмом Лллойда.
В случае, если используется метрика CIEDE2000, нелинейная по своей природе, использование кластеризации Ллойда уже не является оптимальным, так как при усреднении яркостей пикселей для получения центра кластеров метрика CIEDE2000 никак не может быть учтена.
В работе предлагается использовать совместно с метрикой CIEDE2000 кластеризацию по граничному элементу множества, которая может эффективно учитывать любую функцию расстояния между элементами множества. Для тестовых изображений выполнена кластеризация Ллойда и кластеризация предложенным методом. Показано, что предложенный метод обеспечивает СКО между пикселями и центрами кластеров (в соответствии с метрикой CIEDE2000) существенно меньшее, чем для кластеризации Ллойда. Исследована зависимость уменьшения СКО от количества кластеров и характеристик изображений.