2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Электронный синтез речи - чего мы достигли?
Сообщение06.10.2016, 23:37 
Аватара пользователя


01/12/11

8634
Свежий видеоролик, повествующий о лауреатах Нобелевской премии по химии за этот год, откровенно испортил моё и без того скверное настоение. Особенно "прикололи" следующие перлы:

-- степень докторА философии
-- в университете оксфОрда
-- с 2009 годА
-- исполняющий обязанности директорА
-- амстЕрдам

...и ещё целый вагон и маленькая тележка...

Неужели это всё, на что способен современный искусственный интеллект?

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 00:09 
Заслуженный участник


27/04/09
28128
При чём тут ИИ? Просто кто-то недоразработал алгоритм расстановки ударений и/или список исключений.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 00:13 
Аватара пользователя


01/12/11

8634
arseniiv
Мне казалось, что для синтеза речи необходим ИИ...

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 01:40 
Заслуженный участник


27/04/09
28128
Конечно, можно вставить в эту задачу достаточно сложный ИИ. Вместе со сложным обучением на куче примеров, которые можно было бы, используя прикладные результаты некоторых разделов лингвистики, организовать в более стройную и меньшую по объёму систему. Особенно если есть словарь с фонетическими транскрипциями или хотя бы ударениями, а такие словари полезны не только для синтеза речи, так что их, как правило, есть где брать. Конкретика уже касается реальных подходов к синтезу, о которых я не в курсе. Впрочем, например, вот: https://en.wikipedia.org/wiki/Speech_synthesis.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 01:55 
Заслуженный участник
Аватара пользователя


20/08/14
8506
Здесь, кстати, неплохо бы определиться, что такое ИИ. Насколько я понимаю, этим термином обозначают любую систему, занятую "традиционно человеческим", т.е. плохо алгоритмируемым, делом - от игры в шахматы до распознавания речи. Или что-то иное? Не только же нейронную сеть.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 02:01 
Заслуженный участник


16/02/13
4195
Владивосток
Определение ИИ — программа, решающая задачи ИИ :wink: К таковым в разное время относили разные задачи. В том числе, кстати, и генерацию речи. Пришли, помнится, к выводу, что, как бы это сказать, звуковая речь — почти отдельный язык, и разумнее не пытаться читать текст, а генерировать тексты на двух языках — письменном и разговорном. Если, конечно, это возможно.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 16:23 
Заслуженный участник


27/04/09
28128
Хм. «Почти отдельный язык» — это всё равно что ничего не сказать, особенно если дело касается только чтения письменного текста. Надо будет только вместо пунктуации (не обязательно там, где она стояла, конечно) расставить паузы и интонацию. И тут надо признать одно из двух: или языкознание совсем сегодня не в курсе, что в естественных языках творится, или тут можно увидеть явные алгоритмы, пусть и зависящие от данных какого-то размера. Точнее, признать второе, конечно.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение07.10.2016, 18:36 
Заслуженный участник


16/02/13
4195
Владивосток
Паузы. Интонацию. Изменения звуков под действием соседних. Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных (или звуки по-другому называются?) звука. Большое видится на расстояньи, а глубокое — при погружении :wink:

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 01:42 
Аватара пользователя


01/12/11

8634

(Оффтоп)

iifat в сообщении #1158052 писал(а):
Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных ...

Это как???

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 02:34 
Заслуженный участник


20/08/14
11775
Россия, Москва

(Оффтоп)

Ktina в сообщении #1158118 писал(а):
iifat в сообщении #1158052 писал(а):
Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных ...
Это как???
Тоже удивился, но легко нашёл ответ (насколько адекватный - не проверял) - http://russkiy-na-5.ru/phonetics/%D0%BC ... 0%BA%D0%BE - в скобочках все три звука для "о" и правда разные ...

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 03:26 
Заслуженный участник


27/04/09
28128
iifat в сообщении #1158052 писал(а):
Читал где-то мельком, что, к примеру, в слове «молоко» три различных гласных (или звуки по-другому называются?) звука.
Вообще зависит от диалекта. Может быть и три разных аллофона. Но вещь в том, что даже сами аллофоны состоят из кучи немного отличающихся звуков. Но для целей синтеза можно принять, что каждый аллофон произносится всегда одинаково.

iifat в сообщении #1158052 писал(а):
Изменения звуков под действием соседних.
Фонетика этим да-авно занимается. :-) И не только соседних, и не только в каком-то синхронном срезе языка (а и исторические).

Небольшое предостережение: вообще не пробуйте определять, какие звуки в каком слове произносите вы или кто-то другой — в идеале это надо измерять прибором. И небольшой полуликбез: фонетика оперирует не только звуками, которые в конечном итоге получаются, но и абстракциями над ними: аллофонами, фонемами. Фонемы здесь более абстрактная штука, и у них даже не одно определение, так что об этом здесь не буду (т. к. могу только всё испортить, разбираясь в этом на уровне, нужном для своих скромных нужд). Так вот, сравнивать на одинаковость аллофоны или фонемы ещё осмысленно, а сравнивать звуки акустически на полное совпадение/несовпадение уже немного странно.

-- Сб окт 08, 2016 05:27:26 --

(Щас меня за такие описания специалисты покусают, чувствую.)

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение08.10.2016, 03:41 
Аватара пользователя


18/06/12

499
планета Земля
iifat в сообщении #1158052 писал(а):
Паузы. Интонацию. Изменения звуков под действием соседних.
По-моему, это задача не для AI, в лучшем случае для ANI. Совсем другое дело - воспринимать иронию, отличать возможные вещи от невозможных, суметь через считанные секунды быстро рассказать о достижениях только что объявившегося лауреата любому человеку планеты. Вот это - типичная задача для несуществующего ныне AGI.

(Оффтоп)

Завоевать пару-тройку этих премий за один год - плёвое дело для ASI.

Ktina в сообщении #1157896 писал(а):
Неужели это всё, на что способен современный искусственный интеллект?
Если говорить только про опен-сорсные реализации ИИ, то, короче говоря, его возможности ещё даже скромнее. Мы просто не знаем, что нужно для AGI, ещё меньше мы знаем, что уже есть у тех, кто действительно им занимается. Можем только помнить о том, что было показано.

 Профиль  
                  
 
 Re: Электронный синтез речи - чего мы достигли?
Сообщение10.10.2016, 00:45 
Аватара пользователя


18/06/12

499
планета Земля
Нашёл говорилку на английском, мандаринском плюс музыка; судя по коротюсеньким отрывкам аудио, получается весьма недурно:
https://deepmind.com/blog/wavenet-gener ... raw-audio/
https://arxiv.org/pdf/1609.03499.pdf

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модератор: Модераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group