Главная
страница 1страница 2страница 3


На правах рукописи



Потапов Алексей Сергеевич

 

АВТОМАТИЧЕСКИЙ АНАЛИЗ ИЗОБРАЖЕНИЙ И РАСПОЗНАВАНИЕ ОБРАЗОВ НА ОСНОВЕ ПРИНЦИПА РЕПРЕЗЕНТАЦИОННОЙ МИНИМАЛЬНОЙ ДЛИНЫ ОПИСАНИЯ



Специальности:

05.11.07 – Оптические и оптико-электронные приборы и комплексы

05.13.01 – Системный анализ, управление и обработка информации 

 

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

доктора технических наук


 Санкт-Петербург

2008
Работа выполнена в Санкт-Петербургском государственном университете

информационных технологий, механики и оптики


 

  Научный консультант: Доктор технических наук, профессор

Гуров Игорь Петрович

                                                  

     

  Официальные оппоненты: Член-корреспондент РАН,



доктор технических наук, профессор

Мирошников Михаил Михайлович


Доктор технических наук, профессор

Коняхин Игорь Алексеевич


Доктор технических наук, профессор

Ерош Игорь Львович

Ведущая организация:  Филиал ФГУП "ЦНИИ "Комета" "Научно-проектный центр оптоэлектронных комплексов наблюдения", г. Санкт-Петербург
    
Защита состоится  « 02 » декабря 2008 года в 15 часов 30 минут на заседании диссертационного совета Д212.227.01 при Санкт-Петербургском государственном университете информационных технологий, механики и оптики по адресу: Санкт-Петербург, пер. Гривцова, д.14, ауд. 314.

С диссертацией можно ознакомиться в библиотеке СПбГУ ИТМО.


Автореферат разослан «___» _________ 2008 г.


Отзывы и замечания по автореферату (в двух экземплярах), заверенные печатью, просим направлять в адрес университета:

197101, г.Санкт-Петербург, Кронверкский пр., д.49,

секретарю диссертационного совета.



Ученый секретарь


диссертационного совета

кандидат технических наук, доцент В.М. Красавцев



ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы


Оптико-электронные приборы и комплексы, использующие автоматические методы анализа изображений, широко применяются в робототехнике, системах навигации и управления движением [1], в системах обнаружения и сопровождения целей [2], промышленных приложениях (таких, как контроль качества выпускаемой продукции, мониторинг производственных помещений [3]), разнообразных областях биомедицины [4], фотограмметрии, дистанционном сборе данных [5] и др. Дальнейшее совершенствование оптико-электронных систем определяется приоритетными направлениями науки, технологии и техники Российской Федерации – «Безопасность и противодействие терроризму», «Перспективные вооружения, военная и специальная техника», «Рациональное природопользование», «Транспортные, авиационные и космические системы».

Однако на данный момент существуют предметные области, в которых замена человека-оператора автоматическими методами анализа изображений приводит к существенному снижению эффективности оптико-электронного комплекса. Как правило, это области, в которых имеется значительная априорная неопределенность в содержании изображений. В качестве примера можно привести аэрокосмические изображения, которые могут быть получены с разных ракурсов, в разные время суток и года, а также с помощью сенсоров различных типов. Невозможность для ряда областей замены человека автономными оптико-электронными системами обусловлена, в том числе, отсутствием достаточной теоретической базы в области анализа и распознавания изображений, являющейся источником алгоритмов обработки информации в оптико-электронных комплексах.

В то же время, благодаря развитию технологии приемников излучения, за последние 10-15 лет произошло существенное повышение детальности получаемых изображений и удешевление (примерно на два порядка) устройств, формирующих цифровые изображения, при обеспечении их компактности [6]. В результате, использование оптико-электронных приборов и комплексов, ориентированных на формирование и обработку цифровых изображений, стало экономически оправданным во многих приложениях. Возросла также и производительность электронных компонентов оптико-электронных приборов, что создало возможности использования вычислительно более ресурсоемких алгоритмов анализа изображений.

Однако разработанные к настоящему времени в рамках иконики (науке об изображениях) научно-технические решения не в полной мере обеспечили возможности реализации автоматических методов обработки и распознавания изображений в новых предметных областях. Востребованность этих методов привела к появлению большого числа сторонников «практичного» подхода [7], в рамках которого критикуются попытки создания общетеоретических основ обработки и анализа изображений за непрактичность и предлагается рассматривать лишь вопросы построения систем обработки изображений, предназначенных для решения конкретных прикладных задач [8]. Такой подход позволил заполнить нишу методов анализа изображений ad hoc алгоритмами. Эти алгоритмы, как правило, не являются переносимыми, то есть они не могут быть повторно использованы для решения других аналогичных задач. Как следствие, при создании оптико-электронного комплекса существенная часть стоимости приходится на разработку и реализацию алгоритмов анализа изображений [9].

Хотя указанный подход и сыграл определенную положительную роль в развитии оптико-электронных приборов, однако сложившаяся к настоящему моменту ситуация многими исследователями воспринимается как кризисная [10, 11], а ее причина заключается в недостаточном внимании к теоретическим аспектам иконики и применении большого числа эвристических и слабо проверенных методов [12, с. 12].

Таким образом, на настоящий момент созрела необходимость дальнейшего развития иконики и создания в ее рамках единой теории и методологии разработки алгоритмов автоматического анализа изображений и их применения для решения широкого круга задач. Решение этой крупной научной проблемы имеет важное хозяйственное значение, поскольку позволяет существенно снизить трудозатраты по разработке алгоритмов анализа изображений и повышает возможности их повторного использования, а также расширяет сферу применения и открывает новые пути применения оптико-электронных приборов и комплексов. Таким образом, данная проблема является актуальной, в особенности, в областях, для которых характерны изображения с большой априорной неопределенностью.

Теоретические положения, позволяющие решить проблему анализа изображений и распознавания образов, должны быть основаны на строгом математическом базисе, прежде всего, на теории индуктивного вывода, в рамках которой рассматриваются задачи выбора моделей, наилучшим образом описывающих данные наблюдений [13]. Под моделью обычно понимается результат обобщения данных с выделением некоторых существенных характеристик при отвлечении от несущественных, случайных, деталей. При этом основным элементом индуктивного вывода является критерий оптимальности, в соответствии с которым осуществляется выбор модели.

Достаточной универсальностью при решении проблемы определения критерия оптимальности обладает принцип минимальной длины описания (МДО) [14], вводимый в рамках теоретико-информационного (основанного на одном из вариантов теории информации) подхода и указывающий на необходимость поиска компромисса между точностью модели и ее сложностью. Однако данный принцип не вполне применим к задачам с существенным индуктивным смещением (определяемым априорной информацией предпочтением при выборе модели, задаваемым, в случае статистического подхода, в форме распределения априорных вероятностей на множестве решений), к которым относятся задачи анализа изображений.

Таким образом, одна из центральных проблем, которая должна быть разрешена с помощью разрабатываемой теории, – это проблема определения критерия оптимальности методов обработки информации в оптико-электронных системах, на основе которого могла бы производиться их направленная оптимизация. При этом теория должна быть единообразно применимой к различным аспектам анализа изображений – признаковому, текстурному, контурному и структурному, – которые различаются типами используемых представлений изображений, определяющих индуктивное смещение, поэтому принцип МДО необходимо уточнить с учетом понятия представления изображений как принцип репрезентационной минимальной длины описания (РМДО).


следующая страница >>
Смотрите также:
Автоматический анализ изображений и распознавание образов на основе принципа репрезентационной минимальной длины описания
458.65kb.
3 стр.
1 XI международная конференция «Распознавание образов и анализ изображений: новые информационные технологии»
510.41kb.
4 стр.
Структурное распознавание изображений на основе моделей голосования признаков характерных точек
174.61kb.
1 стр.
Автоматический синтез и анализ дифонов естественных языков
67.8kb.
1 стр.
Особенности передачи художественных образов и особенности перевода произведений Агаты Кристи
232.65kb.
1 стр.
Распознавание речи
110.2kb.
1 стр.
О критериях установления минимальной заработной платы
1927.13kb.
7 стр.
Создание повествовательного текста с элементами описания на основе картины В. Г. Перова
80.51kb.
1 стр.
Управление труда Мониторинг социально-трудовой сферы
151.94kb.
1 стр.
«История мер длины»
231.4kb.
1 стр.
Правила соревнований по стендовой стрельбе трап, дубль трап, скит, автоматический трап
956.13kb.
6 стр.
«Сказка о царе Салтане»
179.65kb.
1 стр.