Бюджетное учреждение высшего образования Ханты-Мансийского автономного округа – Югры «Сургутский Государственный Университет»
Введение
Машинное обучение
Машинное обучение
Машинное обучение
Интерполяционные методы
Интерполяционные методы
Интерполяционные методы
Интерполяционные методы
Интерполяционные методы
Super-Resolution
SRGAN (Generative Adversarial Network)
SRGAN (Generative Adversarial Network)
SRGAN (Generative Adversarial Network)
10.11M
Category: educationeducation

Применение машинного обучения для улучшения графических образов

1. Бюджетное учреждение высшего образования Ханты-Мансийского автономного округа – Югры «Сургутский Государственный Университет»

Диссертация
Применение машинного обучения
для улучшения графических образов
Выполнил: Студент группы 601-81М
Перекопский Александр Александрович
Научный руководитель: д.т.н. профессор Чалей Иван Вацлавович
2020 г.

2. Введение

Объект работы: методы машинного (глубокого) обучения
Предмет работы: метод улучшения изображений “Супер-Разрешение” (Super-Resolution),
модель улучшения качества изображений SRGAN
Цель: разработать программу для решения задач по качественному улучшению
растровых изображений с лицами людей
Задачи:
o
o
o
o
o
o
Изучить стандартные подходы улучшения качества изображений
Изучить архитектуру модели SRGAN и реализовать ее на Python
Разработать GUI при помощи фреймворка PyQt5
Преобразовать изображения с использованием SRGAN
Продемонстрировать возможности метода Super-Resolution
Провести сравнительный анализ результатов
2

3. Машинное обучение

Машинное обучение - это множество математических методов
для разработки алгоритмов, способных решать задачи,
которые
на поиске
во входных
Решение основаны
вычисляется
не
по закономерностей
четкой
формуле,
а
по
данных.
устанавливаемой в процессе обучения зависимости известных
результатов от конкретного набора признаков и их значений.
Риc. 1
Классификация
Риc. 2
Кластеризация
Риc. 3 Регрессия
3

4. Машинное обучение

Машинное обучение - это множество математичеких методов
для разработки алгоритмов, способных решать задачи,
которые
на поиске
во входных
Решение основаны
вычисляется
не
по закономерностей
четкой
формуле,
а
по
данных.
устанавливаемой в процессе обучения зависимости известных
результатов от конкретного набора признаков и их значений.
Риc. 4 Машинное зрение
Риc. 5 Машинный
слух
4

5. Машинное обучение

Обработка растровых изображений
Машинное
обучение
находит
свое применение и в задаче
обработки изображений.
Одна
из
распространенных
проблем
с
растровыми
изображениями

это
их
низкое разрешение, а значит
Качество
растрового
и качество.
изображения
зависит
от
размера
изображения
(количества
пикселей
по
горизонтали и вертикали) и
количества цветов, которые
Риc. 4 Видео с камер
наблюдения
5

6. Интерполяционные методы

Метод ближайшего соседа (алгоритм)
8pix
8pix
4pix
8pix
4pix
Исходное
изображение
Преобразование
8pix
Результат
6

7. Интерполяционные методы

Метод ближайшего соседа (пример)
Исходное изображение
(124х118)
Результат преобразования
(496х472)
Заметный эффект пикселизации
7

8. Интерполяционные методы

Бикубическая интерполяция (пример)
Исходное изображение
(124х118)
Результат преобразования
(496х472)
Заметный эффект размытия
8

9. Интерполяционные методы

Билинейная интерполяция (пример)
Исходное изображение
(124х118)
Результат преобразования
(496х472)
Усиленный эффект размытия
9

10. Интерполяционные методы

Сравнение результатов преобразования
Метод ближайшего
соседа
Бикубическая
интерполяция
Билинейная
интерполяция
10

11. Super-Resolution

11

12. SRGAN (Generative Adversarial Network)

12

13. SRGAN (Generative Adversarial Network)

13

14. SRGAN (Generative Adversarial Network)

14

15.

15

16.

16

17.

Заключение
Итог
работы:
В данной работе была рассмотрена проблема повышения разрешения
изображения и возможности ее решения с помощью относительно нового
GAN подхода.
Разработана
программа
предназначена
для
улучшения
качества
изображений на примере женскими лиц. Лежащий в основе способ
обработки изображения под названием Super-Resolution позволяет
качественно увеличить его разрешение. На вход нейросети подается
изображение низкого разрешения (например, 124 на 118), и после
преобразования изображение становится не просто увеличенным в
несколько раз по размерам, но и более четким с более различимыми на
нем образами.
Приведена не только теоретическая база, необходимая для реализации
архитектуры конкурирующих сверточных нейронных сетей, но и детали
технической реализации системы, включая библиотеки и основные
алгоритмы.
17
English     Русский Rules