|
alexey007 |
|
|
|
Привет, всем!
Кто знает самый простой и понятный способ подготовки звуков для создания обучающей выборки для НС. У меня есть примеры двух классов звуков. Примерно 10 звуков одного класса и 10 другого класса. Мне нужно обучить нейронную сеть, чтобы она могла потом различать эти два класса на других примерах. Я понимаю, что 10 это маловато будет, но все же, задача учебная, я потом еще базу данных пополуню. Я могу эти звуковые файлы отцифоровать и получить графики амплитуды от времени. Что самое простое можно сделать, с этими графиками, чтобы создать вектора для обучения нейронной сети? Только, чтобы максимально понятно было, а то я пытался найти формулы и как-то вроде понятно, но не доконца.
|
|
|
|
 |
|
ozheredov |
|
|
|
alexey007 ИМХО:
1 способ: перейти в пространство частот, т.е. вектор входа - первые -дцать коэффициентов Фурье-, а лучше вейвлет-преобразования
2 способ: учинить преобразование главных компонент, и соответственно брать некоторое число главных компонент каждого сигнала
|
|
|
|
 |
|
zykov |
|
|
|
Последний раз редактировалось zykov 21.10.2021, 21:47, всего редактировалось 1 раз.
Если задача в распознавании звуков, которые человек распознаёт (например речь), то обычно препроцессинг делают нападобии анатомической Cochlea. Вот была ещё в 82 году статья "A computational model of filtering, detection, and compression in the cochlea", R.Lyon. -- 21.10.2021, 21:47 --А вот готовый софт для этого: Auditory Modeling Toolbox
|
|
|
|
 |
|
M_u_r_m_a_n |
|
|
|
Заманчивая идея! Сделать простенькую цветомузыку с грубым распознаванием инструментов на 2-Д экране...
Есть у кого задел?
|
|
|
|
 |