2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 02:23 


28/11/11
2884
Наверняка есть хорошие программы для изучения звуков речи. Хочется, чтобы речь можно было записать через микрофон и для неё построить спектрограмму, на вроде той, что на картинке:

Изображение

Правда, я не знаю что отображает нижняя часть картинки. Не подскажите? А верхняя часть - вроде бы обычная спектрограмма.

-- 09.10.2012, 02:23 --

В идеале нужно, чтобы программа выделяла в речи фонемы, но думаю такое вряд ли бывает.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 14:31 


05/09/12
2587
Если есть вав-файл, то его спектр можно посмотреть во многих программах - от простеньких типа ГолдВэйв через оптимальные СпектраЛабы и СпектраПлюсы до каких угодно навороченных софтов. Фонемы выделять - не знаю, может и есть готовый софт, я бы написал свой.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 14:55 
Заслуженный участник


07/07/09
5408
Зелененькая кривая похожа на осциллограмму, по горизонтали время по вертикали сигнал микрофона (давление звука).

Ниже наверно спектрограмма, по горизонтали время, по вертикали частоты присутствующие в звуке в даный момент времени .

А фонема это что, сколько их, в чем различие.?

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 16:04 
Экс-модератор
Аватара пользователя


23/12/05
12064
Matlab частично может решить Вашу задачу: http://www.music.mcgill.ca/~gary/307/week1/matlab.html.

Выделить же отдельные фонемы - не знаю как.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 17:30 
Заслуженный участник


27/04/09
28128
Фонемы же зависят от языка. В одном они имеют такие аллофоны по одной области пространства признаков, в другом — другие по почти всегда довольно отличающейся области. Тут надо распознаватель образов, наверное, строить, которому за эталоны дают большое количество реализаций каждой из фонем.

Да и взгляды на фонематический инвертарь отдешльного языка могут отличаться: напр., для русского 5 гласных фонем от МФШ и 6 от ЛФШ.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 18:02 
Экс-модератор
Аватара пользователя


23/12/05
12064
погуглите по ключевой фразе "компьютерный транскрайбер" - возможно удастся найти что-то, что в каком-то приближении решает поставленную задачу

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение09.10.2012, 22:42 


28/11/11
2884
Сегодня спросил у специалиста. Говорит, программы хорошо выделять фонемы не умеют. omg!

-- 09.10.2012, 22:47 --

arseniiv в сообщении #628824 писал(а):
Фонемы же зависят от языка.

По-моему, не совсем. От языка зависит то, какие фонемы в нём присутствуют - во всех языках разные наборы фонем.
В то же время фонемы часто повторяются, то есть в разных языках часто можно встречать одинаковые фонемы. Существует Международный Фонетический Алфавит. В нём конечное (небольшое) число фонем, все которые только могут встречаться в естественных языках. Поэтому, если бы по спектрограмме можно было бы выделять фонемы в принципе, то не было бы проблемы и с конкретными языками.

-- 09.10.2012, 22:48 --

arseniiv в сообщении #628824 писал(а):
Да и взгляды на фонематический инвертарь отдешльного языка могут отличаться: напр., для русского 5 гласных фонем от МФШ и 6 от ЛФШ.

Что такое "МФШ" и "ЛФШ"?

-- 09.10.2012, 22:48 --

Xey в сообщении #628773 писал(а):
Зелененькая кривая похожа на осциллограмму, по горизонтали время по вертикали сигнал микрофона (давление звука).

Ниже наверно спектрограмма, по горизонтали время, по вертикали частоты присутствующие в звуке в даный момент времени .

А цвет что именно указывает? Вроде бы интенсивность, но я не понимаю что это значит в точности и зачем нужно для выделения фонем (и нужно ли). :oops:

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 17:03 
Заслуженный участник


27/04/09
28128
longstreet в сообщении #628926 писал(а):
По-моему, не совсем.
Видимо, вы фонемами называете что-то отличное от того, что называют фонемами как правило. :-)

longstreet в сообщении #628926 писал(а):
Что такое "МФШ" и "ЛФШ"?
Московская и Петербургская (была Ленинградская) фонологические школы.

longstreet в сообщении #628926 писал(а):
В то же время фонемы часто повторяются, то есть в разных языках часто можно встречать одинаковые фонемы.
Фонемы можно рассматривать только для каждого языка в отдельности. Это «логические», не «физические» объекты.

longstreet в сообщении #628926 писал(а):
Существует Международный Фонетический Алфавит. В нём конечное (небольшое) число фонем, все которые только могут встречаться в естественных языках.
В нём небольшое число символов для обозначения звуков, которые можно модифицировать диакритикой — и вариантов станет намного больше. Хотя он используется для записи фонем — и тогда эти символы не стоит понимать более чем абстракцию — он используется и для записи вариантов фонем — аллофонов, и один и тот же аллофон может быть реализацией разных фонем — так что программа на фонемы разделить не сможет, потому что для этого нужно иметь какие-то сведения о языке. Да и не нужны вам именно фонемы, скорее всего.

longstreet в сообщении #628926 писал(а):
А цвет что именно указывает? Вроде бы интенсивность
Да, её.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 17:39 


28/11/11
2884
arseniiv, посоветуйте учебник по фонетике.

-- 10.10.2012, 17:41 --

longstreet в сообщении #628926 писал(а):
Сегодня спросил у специалиста. Говорит, программы хорошо выделять фонемы не умеют. omg!

А почему по форме спектрограмм не удаётся определять фонемы? Вы говорите, что нужно иметь дополнительную информацию о языке. Но, насколько я понял ответ специалиста, у которого спрашивал, программы, достаточно хорошо выделяющей фонемы нет и для конкретных языков.

-- 10.10.2012, 17:45 --

Гуглил. Оказалось, что невозможно однозначно воспроизвести спектрограмму (т.е. по данной спектрограмме восстановить звучание). omg, это почему ещё?

-- 10.10.2012, 17:47 --

arseniiv в сообщении #629128 писал(а):
Да и не нужны вам именно фонемы, скорее всего.
Не нужны. Мне просто интересно стало. Читал учебник Реформатского, встретил, захотел соответствующие современные программы посмотреть (учебнику лет 50).

-- 10.10.2012, 17:49 --

arseniiv в сообщении #629128 писал(а):
эти символы не стоит понимать более чем абстракцию — он используется и для записи вариантов фонем — аллофонов, и один и тот же аллофон может быть реализацией разных фонем

То есть, фонем самих по себе в языке нет, это абстрактное понятие? Только их варианты, различные реализации есть непосредственно?

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 18:36 
Заслуженный участник


27/04/09
28128
longstreet в сообщении #629143 писал(а):
arseniiv, посоветуйте учебник по фонетике.
Не могу…

longstreet в сообщении #629143 писал(а):
А почему по форме спектрограмм не удаётся определять фонемы? Вы говорите, что нужно иметь дополнительную информацию о языке. Но, насколько я понял ответ специалиста, у которого спрашивал, программы, достаточно хорошо выделяющей фонемы нет и для конкретных языков.
Чтобы выделить фонемы, если выделены аллофоны, надо знать, в каких местах данным аллофоном что может реализоваться, а что нет (это зависит от языка), а для определения аллофонов нужно знать, какие звуки в языке считаются за разные аллофоны, а какие за один. Например, не изучавший русский англичанин почти наверняка воспримет реализации [л] и [л'] как равноценные, хотя и заметит, естественно, некоторую разницу — но она ему будет не важна. Если можно достаточно хорошо разделить запись речи на отдельные звуки (органы речи принимают новое положение за конечное время — поэтому некоторое время между двумя соседними звуками произносится нечто среднее), то, мне кажется, хороший результат для разделения на аллофоны должны дать алгоритмы распознавания образов.

longstreet в сообщении #629143 писал(а):
Гуглил. Оказалось, что невозможно однозначно воспроизвести спектрограмму (т.е. по данной спектрограмме восстановить звучание). omg, это почему ещё?
Странно. Вот это должно быть возможным.

longstreet в сообщении #629143 писал(а):
То есть, фонем самих по себе в языке нет, это абстрактное понятие? Только их варианты, различные реализации есть непосредственно?
Это смотря где. В потоке речи есть только звук. А что там в голове… (и в языке — это же вещь не материальная) В общем, эта модель с фонемами и аллофонами достаточно хорошо применима.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 18:54 


28/11/11
2884
arseniiv в сообщении #629165 писал(а):
longstreet в сообщении #629143 писал(а):
Гуглил. Оказалось, что невозможно однозначно воспроизвести спектрограмму (т.е. по данной спектрограмме восстановить звучание). omg, это почему ещё?
Странно. Вот это должно быть возможным.

И мне странно. Однако же так (вроде бы)! Даже конкурсы видел, где выкладывают спектрограмму и неделю дают на расшифровку звучания (и в конечном итоге текста), который ей соответствует. Вроде бы даже специалисты плохо "читают" спектрограммы, в основном, насколько я понял, люди большей частью догадываются (иногда в помощь задаётся контекст).

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 20:13 
Заслуженный участник


27/04/09
28128
А, по картинке с урезанной информацией неудобно читать, конечно! А если картинка содержит мало информации, то и действительно никак. Я подумал, по более-менее полным данным с помощью программы синтезировать. :roll:

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 20:18 


28/11/11
2884
arseniiv в сообщении #629212 писал(а):
А, по картинке с урезанной информацией неудобно читать, конечно! А если картинка содержит мало информации, то и действительно никак.

А что именно урезано? Какие характеристики звука на динамической спектрограмме не отображаются важные для восстановления звуковой речи?

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 21:04 
Заслуженный участник


27/04/09
28128
Детализация области частот — наверно, в первую очередь. И остального: детализация времени и громкости — но тут, наверно, людям обычно хватает.

Ещё не знаю, насколько звуки с большой долей шума отличаются по такой картине на глаз — тут может не хватить детализации громкости, возможно.

-- Чт окт 11, 2012 00:06:45 --

Ну и ещё влияет не-очень-то-и-удобство представления информации в таком виде и то, что для работы надо сравнивать частоты с какими-нибудь справочными. Человек это не быстро сделает.

 Профиль  
                  
 
 Re: Посоветуйте программу для построения спектрограммы речи.
Сообщение10.10.2012, 21:31 


28/11/11
2884
arseniiv в сообщении #629237 писал(а):
Детализация области частот — наверно, в первую очередь. И остального: детализация времени и громкости — но тут, наверно, людям обычно хватает.

Громкость в речи не играет большой роли.
Что такое детализация времени? Там по одной из шкал как раз время откладывается, а спектрограмма представляется классически с подписями значений по оси времени и по оси частот. Так что время есть.
Что такое детализация частот? Частоты можно определить из спектрограммы. Саму спектрограмму можно растянуть по горизонтали-вертикали, получая подробности. Т.е. именно спектрограмму дают (я так думаю), а не картинку спектрограммы.


arseniiv в сообщении #629237 писал(а):
Ну и ещё влияет не-очень-то-и-удобство представления информации в таком виде и то, что для работы надо сравнивать частоты с какими-нибудь справочными. Человек это не быстро сделает.

Компьютеру сравнивать частоты со справочными - не проблема. Мы же про компьютерные программы говорим.

-- 10.10.2012, 21:41 --

GoldWave строит осцилограммы и спекрограммы, интуитивно понятная программа для меня. Играюсь. http://www.goldwave.com

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 22 ]  На страницу 1, 2  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group