2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Электронный синтез речи - чего мы достигли?
Сообщение06.10.2016, 23:37 
Аватара пользователя


01/12/11

8634
Свежий видеоролик, повествующий о лауреатах Нобелевской премии по химии за этот год, откровенно испортил моё и без того скверное настоение. Особенно "прикололи" следующие перлы:

-- степень докторА философии
-- в университете оксфОрда
-- с 2009 годА
-- исполняющий обязанности директорА
-- амстЕрдам

...и ещё целый вагон и маленькая тележка...

Неужели это всё, на что способен современный искусственный интеллект?

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 00:09 
Заслуженный участник


27/04/09
28128
При чём тут ИИ? Просто кто-то недоразработал алгоритм расстановки ударений и/или список исключений.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 00:13 
Аватара пользователя


01/12/11

8634
arseniiv
Мне казалось, что для синтеза речи необходим ИИ...

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 01:40 
Заслуженный участник


27/04/09
28128
Конечно, можно вставить в эту задачу достаточно сложный ИИ. Вместе со сложным обучением на куче примеров, которые можно было бы, используя прикладные результаты некоторых разделов лингвистики, организовать в более стройную и меньшую по объёму систему. Особенно если есть словарь с фонетическими транскрипциями или хотя бы ударениями, а такие словари полезны не только для синтеза речи, так что их, как правило, есть где брать. Конкретика уже касается реальных подходов к синтезу, о которых я не в курсе. Впрочем, например, вот: https://en.wikipedia.org/wiki/Speech_synthesis.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 01:55 
Заслуженный участник
Аватара пользователя


20/08/14
8738
Здесь, кстати, неплохо бы определиться, что такое ИИ. Насколько я понимаю, этим термином обозначают любую систему, занятую "традиционно человеческим", т.е. плохо алгоритмируемым, делом - от игры в шахматы до распознавания речи. Или что-то иное? Не только же нейронную сеть.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 02:01 
Заслуженный участник


16/02/13
4214
Владивосток
Определение ИИ — программа, решающая задачи ИИ :wink: К таковым в разное время относили разные задачи. В том числе, кстати, и генерацию речи. Пришли, помнится, к выводу, что, как бы это сказать, звуковая речь — почти отдельный язык, и разумнее не пытаться читать текст, а генерировать тексты на двух языках — письменном и разговорном. Если, конечно, это возможно.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 16:23 
Заслуженный участник


27/04/09
28128
Хм. «Почти отдельный язык» — это всё равно что ничего не сказать, особенно если дело касается только чтения письменного текста. Надо будет только вместо пунктуации (не обязательно там, где она стояла, конечно) расставить паузы и интонацию. И тут надо признать одно из двух: или языкознание совсем сегодня не в курсе, что в естественных языках творится, или тут можно увидеть явные алгоритмы, пусть и зависящие от данных какого-то размера. Точнее, признать второе, конечно.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 18:36 
Заслуженный участник


16/02/13
4214
Владивосток
Паузы. Интонацию. Изменения звуков под действием соседних. Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных (или звуки по-другому называются?) звука. Большое видится на расстояньи, а глубокое — при погружении :wink:

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 01:42 
Аватара пользователя


01/12/11

8634

(Оффтоп)

iifat в сообщении #1158052 писал(а):
Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных ...

Это как???

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 02:34 
Заслуженный участник


20/08/14
11924
Россия, Москва

(Оффтоп)

Ktina в сообщении #1158118 писал(а):
iifat в сообщении #1158052 писал(а):
Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных ...
Это как???
Тоже удивился, но легко нашёл ответ (насколько адекватный - не проверял) - http://russkiy-na-5.ru/phonetics/%D0%BC ... 0%BA%D0%BE - в скобочках все три звука для "о" и правда разные ...

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 03:26 
Заслуженный участник


27/04/09
28128
iifat в сообщении #1158052 писал(а):
Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных (или звуки по-другому называются?) звука.
Вообще зависит от диалекта. Может быть и три разных аллофона. Но вещь в том, что даже сами аллофоны состоят из кучи немного отличающихся звуков. Но для целей синтеза можно принять, что каждый аллофон произносится всегда одинаково.

iifat в сообщении #1158052 писал(а):
Изменения звуков под действием соседних.
Фонетика этим да-авно занимается. :-) И не только соседних, и не только в каком-то синхронном срезе языка (а и исторические).

Небольшое предостережение: вообще не пробуйте определять, какие звуки в каком слове произносите вы или кто-то другой — в идеале это надо измерять прибором. И небольшой полуликбез: фонетика оперирует не только звуками, которые в конечном итоге получаются, но и абстракциями над ними: аллофонами, фонемами. Фонемы здесь более абстрактная штука, и у них даже не одно определение, так что об этом здесь не буду (т. к. могу только всё испортить, разбираясь в этом на уровне, нужном для своих скромных нужд). Так вот, сравнивать на одинаковость аллофоны или фонемы ещё осмысленно, а сравнивать звуки акустически на полное совпадение/несовпадение уже немного странно.

-- Сб окт 08, 2016 05:27:26 --

(Щас меня за такие описания специалисты покусают, чувствую.)

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 03:41 
Аватара пользователя


18/06/12

499
планета Земля
iifat в сообщении #1158052 писал(а):
Паузы. Интонацию. Изменения звуков под действием соседних.
По-моему, это задача не для AI, в лучшем случае для ANI. Совсем другое дело - воспринимать иронию, отличать возможные вещи от невозможных, суметь через считанные секунды быстро рассказать о достижениях только что объявившегося лауреата любому человеку планеты. Вот это - типичная задача для несуществующего ныне AGI.

(Оффтоп)

Завоевать пару-тройку этих премий за один год - плёвое дело для ASI.

Ktina в сообщении #1157896 писал(а):
Неужели это всё, на что способен современный искусственный интеллект?
Если говорить только про опен-сорсные реализации ИИ, то, короче говоря, его возможности ещё даже скромнее. Мы просто не знаем, что нужно для AGI, ещё меньше мы знаем, что уже есть у тех, кто действительно им занимается. Можем только помнить о том, что было показано.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение10.10.2016, 00:45 
Аватара пользователя


18/06/12

499
планета Земля
Нашёл говорилку на английском, мандаринском плюс музыка; судя по коротюсеньким отрывкам аудио, получается весьма недурно:
https://deepmind.com/blog/wavenet-gener ... raw-audio/
https://arxiv.org/pdf/1609.03499.pdf

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модератор: Модераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group