Національний ТУ «Дніпровська політехніка» — відповідність Часу
Методи обробки зображень та комп'ютерний зір


обкладинка Вовк Гнатушенко Бондаренко МОЗКЗ 2016.jpg
УДК 004.9:621.391
ББК 32.972.131.2я7
В61
ISBN 978-966-383-699-7   С.М. Вовк, В.В. Гнатушенко, М.В. Бондаренко.– Д.: ЛІРА, 2016. – 148 c.

Вступ
   Сучасний етап розвитку інформаційних технологій характеризується розробкою, створенням та широким впровадженням відеоінформаційних технологій, що засновані на обробці та використанні зображень. На даний час актуальність відеоінформаційного напрямку здебільшого обумовлена потребами розвитку штучних інтелектуальних систем, які повинні мати можливості з візуальної орієнтації у просторі та є придатними до візуального аналізу сцен, візуального пошуку нерухомих та/або рухомих об’єктів з оцінюванням їх геометричних форм й кількісних характеристик. Такі можливості є важливими споживчими рисами для інтелектуальних систем не лише промислового, але й звичайного побутового призначення.
   З урахуванням сучасних викликів та тенденцій можна очікувати подальшого масштабного розвитку відеоінформаційного напрямку. У зв’язку з цим перед студентами комп’ютерних спеціальностей, зокрема спеціальності 122 «Комп’ютерні науки та інформаційні технології», постають задачі отримання достатніх знань з теоретичних основ та методів обробки зображень та комп’ютерного зору, придбання практичних навичок та формування професійних умінь з розробки, імплементації та використання відповідних методів, алгоритмів та програмного забезпечення. Поданий навчальний посібник був написаний з метою допомогти студентам засвоїти основний теоретичний матеріал та закріпити свої знання шляхом виконання лабораторних робіт.
   При написанні навчального посібника автори, що працюють на кафедрі автоматизованих систем обробки інформації (АСОІ) Дніпропетровського національного університету імені Олеся Гончара, спиралися як на власний багаторічний науково-дослідний і педагогічний досвід, так і на праці інших відомих вчених у галузі цифрової обробки сигналів, розпізнавання образів і комп’ютерної графіки. Кафедра АСОІ є випускаючою, багато років вона забезпечує підготовку бакалаврів за напрямом 6.050101 «Комп’ютерні науки» та спеціалістів і магістрів за спеціальністю 7.05010101, 8.05010101 «Інформаційні управляючі системи та технології (за галузями)».
   Навчальний посібник складається з п’яти розділів. Кожен розділ містить загальні теоретичні відомості й доповнюється контрольними питаннями та завданнями до лабораторної роботи. Наприкінці кожного розділу наведено посилання на літературні джерела, в яких можна знайти більш розширене викладення розлянутих питань. Для кращого розуміння завдань до лабораторних робіт і з метою поліпшення якості їх подальшого виконання в усіх розділах посібника наведено фрагменти програмного коду та/або приклади відповідної обробки зображень.
   У першому розділі посібника розглянуто питання детермінованого та імовірснісного опису зображень у просторовій та просторово-частотній областях, наведено необхідні визначення, а також прості приклади аналітичних розрахунків просторового спектра й їх особливості. Завдання до лабораторної роботи передбачають опрацювання питань з побудови математичних моделей напівтонових зображень у просторовій і просторово-частотній областях для випадку суперпозиції простих «ідеальних» об’єктів, аналіз просторового спектра зображень друкованих символів, синтез зображень за частиною просторового спектра, побудову математичних моделей простих кольорових зображень та моделювання випадкових зображень за заданими законами розподілу імовірності.
   У другому розділі посібника розглянуто питання фільтрації зображень. Спочатку наведено загальні відомості, а потім розглянуто методи лінійної та нелінійної просторової фільтрації. Серед методів лінійної просторової фільтрації зазначено методи низько-частотної простової фільтрації, які дозволяють сгладжувати адитивний шум на зображенні, та методи виділення границь зображень об’єктів, які побудовані на основі псевдодиференціальних операторів. Серед методів нелінійної просторової фільтрації зазначено методи нелінійної усереднювальної фільтрації, методи фільтрації на основі порядкових статистик та методи медіанної та комбінованої медіанної фільтрації.
   У третьому розділі посібника розглянуто лінійні методи відновлення тих зображень, що спотворені лінійною інваріантною до просторового зсуву системою. В межах цієї моделі системи, коли зображення на її виході є згорткою її двовимірної функції розсіювання точки та зображення на її вході, подано клас добре відомих відновлювальних фільтрів, що розгортається від інверсного фільтра (який, на жаль, не є практично уживаним через значне підсилення шуму) до узагальненого фільтра Вінера та еволюційного фільтра, які залежать від двох та трьох параметрів, що налаштовуються. В лабораторній роботі запропоновано два завдання з відновлення спотворених зображень, які розмиті за рахунок недосконалості системи формування зображень з гауссівською функцією розсіювання точки та за рахунок відносного руху камери й об'єкта зйомки.
   У четвертому розділі посібника подано теорію методів математичної морфології, яка заснована на теорії множин в евклідовому векторному просторі, та її застосування для обробки бінарних зображень. Розглянуто основні операції математичної морфології, а саме: операції додавання та віднімання за Мінковським, операції дилатації, ерозії, заповнення, поповнення, символьної підстановки та інші. На основі цих операцій наведено алгоритми виділення границь, порівняння, пошуку зв’язних компонентів, стоншення та потовщення. В лабораторній роботі запропоновано три завдання з моделювання операцій дилатації, ерозії, заповнення і поповнення, з виділення границь на бінарному зображенні та з підрахунку числа об'єктів на трьох зображеннях, якими є бінарне зображення тексту, штучне бінарне зображення множини геометричних фігур різної форми і розмірів та напівтонове зображення з природною сценою, що складається з множини приблизно однакових за формою об'єктів (наприклад, зерна рису чи еритроцити).
    П’ятий розділ посібника подає базові співвідношення щодо розрахунку відстані до об’єкта, який одночасно візуально спостерігається двома камерами з паралельними оптичними осями, у наближенні геометричної оптики. Лабораторна робота передбачає застосування простого вимірювального приладу, що складається з двох веб-камер (стереопари), розташованих на певній відстані одна від одної, а завдання до лабораторної роботи спрямовані на опрацювання питань суміщення зображень зі стереопари, визначення відстані до об’єктів зйомки, оцінювання геометричних розмірів об’єктів та оцінювання просторової орієнтації пласких протяжних об’єктів.

© 2006-2020 Інформація про сайт