Распознавание звуков с помощью НС

alexey007 · 21.10.2021, 17:57

Привет, всем!

Кто знает самый простой и понятный способ подготовки звуков для создания обучающей выборки для НС. У меня есть примеры двух классов звуков. Примерно 10 звуков одного класса и 10 другого класса. Мне нужно обучить нейронную сеть, чтобы она могла потом различать эти два класса на других примерах. Я понимаю, что 10 это маловато будет, но все же, задача учебная, я потом еще базу данных пополуню.
Я могу эти звуковые файлы отцифоровать и получить графики амплитуды от времени. Что самое простое можно сделать, с этими графиками, чтобы создать вектора для обучения нейронной сети? Только, чтобы максимально понятно было, а то я пытался найти формулы и как-то вроде понятно, но не доконца.

ozheredov · 21.10.2021, 21:06

alexey007
ИМХО:

1 способ: перейти в пространство частот, т.е. вектор входа - первые -дцать коэффициентов Фурье-, а лучше вейвлет-преобразования

2 способ: учинить преобразование главных компонент, и соответственно брать некоторое число главных компонент каждого сигнала

zykov · 21.10.2021, 21:46

Если задача в распознавании звуков, которые человек распознаёт (например речь), то обычно препроцессинг делают нападобии анатомической Cochlea.
Вот была ещё в 82 году статья "A computational model of filtering, detection, and compression in the cochlea", R.Lyon.

-- 21.10.2021, 21:47 --

А вот готовый софт для этого: Auditory Modeling Toolbox

M_u_r_m_a_n · 01.10.2022, 20:34

Заманчивая идея!
Сделать простенькую цветомузыку с грубым распознаванием инструментов на 2-Д экране...

Есть у кого задел?

Научный форум dxdy

Распознавание звуков с помощью НС