2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Распознавание звуков с помощью НС
Сообщение21.10.2021, 17:57 
Привет, всем!

Кто знает самый простой и понятный способ подготовки звуков для создания обучающей выборки для НС. У меня есть примеры двух классов звуков. Примерно 10 звуков одного класса и 10 другого класса. Мне нужно обучить нейронную сеть, чтобы она могла потом различать эти два класса на других примерах. Я понимаю, что 10 это маловато будет, но все же, задача учебная, я потом еще базу данных пополуню.
Я могу эти звуковые файлы отцифоровать и получить графики амплитуды от времени. Что самое простое можно сделать, с этими графиками, чтобы создать вектора для обучения нейронной сети? Только, чтобы максимально понятно было, а то я пытался найти формулы и как-то вроде понятно, но не доконца.

 
 
 
 Re: Распознавание звуков с помощью НС
Сообщение21.10.2021, 21:06 
alexey007
ИМХО:

1 способ: перейти в пространство частот, т.е. вектор входа - первые -дцать коэффициентов Фурье-, а лучше вейвлет-преобразования

2 способ: учинить преобразование главных компонент, и соответственно брать некоторое число главных компонент каждого сигнала

 
 
 
 Re: Распознавание звуков с помощью НС
Сообщение21.10.2021, 21:46 
Если задача в распознавании звуков, которые человек распознаёт (например речь), то обычно препроцессинг делают нападобии анатомической Cochlea.
Вот была ещё в 82 году статья "A computational model of filtering, detection, and compression in the cochlea", R.Lyon.

-- 21.10.2021, 21:47 --

А вот готовый софт для этого: Auditory Modeling Toolbox

 
 
 
 Re: Распознавание звуков с помощью НС
Сообщение01.10.2022, 20:34 
Заманчивая идея!
Сделать простенькую цветомузыку с грубым распознаванием инструментов на 2-Д экране...

Есть у кого задел?

 
 
 [ Сообщений: 4 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group