5.94M
Category: programmingprogramming

ВКР: Разработка программы для анализа и классификации аудиоданных

1.

2.

Федеральное государственное бюджетное образовательное учреждение
высшего образования
Сибирский государственный университет телекоммуникаций и информатики
Кафедра прикладной математики и кибернетики
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ
РАБОТА БАКАЛАВРА
Разработка программы для анализа и классификации аудиоданных с
помощью глубокого обучения и Python
Выполнил
студент группы ИП-712
Артюх Никита Алексеевич
Руководитель –
к.т.н. доцент Мерзлякова Екатерина
Юрьевна
Новосибирск – 2021

3.

ПОСТАНОВКА ЗАДАЧИ
Постановку задачи, согласно заданию, можно сформулировать
следующим образом: Разработать программу для анализа и
классификации аудиоданных с помощью глубокого обучения и
Python. В данной работе в качестве аудиоданных взяты сэмплы
музыкальных композиций, а в качестве классов взяты жанры.

4.

СРЕДСТВА РАЗРАБОТКИ
• Google Colaboratory - облачный сервис,
направленный на упрощение
исследований в области машинного и
глубокого обучения.
• Python
• Librosa

5.

ОПИСАНИЕ РАЗРАБОТКИ

6.

ОПИСАНИЕ РАЗРАБОТКИ
Спеткограмма сэмпла в жанре блюз
Спеткограмма сэмпла в жанре классика
Спеткограмма сэмпла в жанре хип-хоп

7.

ОПИСАНИЕ РАЗРАБОТКИ

8.

ОПИСАНИЕ РАЗРАБОТКИ
Нейрон
Искусственная
нейронная сеть

9.

ОПИСАНИЕ РАЗРАБОТКИ
Сверточная нейронная сеть

10.

ОПИСАНИЕ РАЗРАБОТКИ
Увеличение числа
изображений с помощью
класса ImageDataGenerator

11.

ОПИСАНИЕ РАЗРАБОТКИ

12.

ЗАКЛЮЧЕНИЕ
• Была разработана программа для анализа и классификации
аудиоданных с помощью глубокого обучения и Python, а
конкретно жанровой классификации музыкальных
композиций. В программе использовались два вида
нейронных сетей, а именно: искусственная нейронная сеть
(ANN) и свёрточная нейронная сеть (CNN).

13.

Спасибо за внимание
English     Русский Rules