2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Распознавание речи и обработка сигналов
Сообщение01.12.2012, 16:00 
Всем доброе время суток!

Столкнулся я недавно с интересной задачей. Три микрофона расположены в вершинах треугольника. Есть записи с каждого из этих микрофонов.
Задача: определить количество говорящих людей.

Это довольно не тривиальная задача, может у кого-то есть ссылки, ресурсы, идеи или алгоритмы?
Заранее спасибо.

 
 
 
 Re: Распознавание речи и обработка сигналов
Сообщение03.12.2012, 10:18 
Аватара пользователя
Подсказка на бегу: поищите "анализ независимых компонент" (ICA).
В частности, именно это называется cocktail party problem.

 
 
 
 Re: Распознавание речи и обработка сигналов
Сообщение03.12.2012, 20:49 
Спасибо!

Задача, немного упростилась, но добавились новые вопросы. Как решу, обязательно напишу, думаю, будет интересно. :-)

 
 
 
 Re: Распознавание речи и обработка сигналов
Сообщение03.12.2012, 22:48 
Интересно... А где в практике встречается необходимость решения этой задачи?

 
 
 
 Re: Распознавание речи и обработка сигналов
Сообщение03.12.2012, 23:14 
Если все говорят по очереди
(а в торжественных случаях, есть ещё и церемонимейстер, который объявляет докладчика),
то по голосу можно всех различить и посчитать.
Если же у всех одинаковые голоса и говорят одновременно, то это уже другая задача.
Задача не похожа на прикладную.

 
 
 
 Re: Распознавание речи и обработка сигналов
Сообщение04.12.2012, 00:03 
longstreet в сообщении #653829 писал(а):
Интересно... А где в практике встречается необходимость решения этой задачи?



Примеров можно придумать массу. Лично я сейчас занимаюсь задачами связанными с "машинным слухом" и распознаванием речи.

Есть много работ, посвященных задачам подобного рода. Например:

http://www.univie.ac.at/nuhag-php/bibte ... 41_r27.pdf
http://introlab.3it.usherbrooke.ca/pape ... _Valin.pdf
http://ee602.wdfiles.com/local--files/s ... /hioka.pdf
http://www.ecse.rpi.edu/homepages/rjrad ... eaes22.pdf

Эти 4 линка посвящены работам, которые связаны с локализацией источника звука.

В моем же случае мне нужно разделить "смесь". Другими словами дана запись разных голосов и нужно эти голоса попытаться разделить или хотя бы понять сколько имеется различных голосов на записи.

Решение таких задач имеет широкое применение в робототехнике. Это позволит дать роботам "слух".

Ну а вообще если не привязываться к тому, что источник сигнала звуковой, а сказать, что это любой физический сигнал, то можно обобщить данную задачу на более широкий спектр физических/технических проблем. Таких как: локализация источника сейсмических колебаний, разделение колебаний и пр.

-- Пн дек 03, 2012 23:04:58 --

Ales в сообщении #653839 писал(а):
то по голосу можно всех различить и посчитать


И как это сделать?

 
 
 
 Re: Распознавание речи и обработка сигналов
Сообщение04.12.2012, 01:04 
А разве бурное развитие ПВО в XX веке не породило пласт методов для обработки сигналов? Там ведь много чего есть интересного... Вы сами говорите, что физика сигнала не принципиальна, почему бы не воспользоваться развитой мощной теорией?

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group