Новости ИИ

Rasool · 28.12.2019, 22:43

Китайцы научили ИИ понимать язык лучше среднего человека. Под катом - подробности.

(Оффтоп)

В декабре ИТ-гигант Baidu, китайский эквивалент Google, без лишнего шума обошел западных конкурентов в гонке искусственного интеллекта. Точнее, в соревновании по пониманию языка GLUE (General Language Understanding Evaluation). Их новый алгоритм понимает естественный язык лучше, чем средний человек.

GLUE оценивает, насколько хорошо ИИ понимает человеческий язык. Состязание состоит из девяти различных тестов — надо выделить в предложении имена собственные или определить, на что указывает местоимение. Модель, заработавшая больше всего баллов, способна выполнять сложные задачи по пониманию текста. Средний человек тоже может пройти этот тест и обычно набирает 87 баллов из 100. ERNIE, модель Baidu получила 90.

Рейтинг чемпионов GLUE постоянно меняется, и в скором времени, скорее всего, другая команда потеснит Baidu. Однако достижение китайских разработчиков иллюстрирует то, как расширение географии участников идет на пользу исследованиям в области ИИ. Для того чтобы создать ERNIE, специалистам Baidu пришлось разработать языковую модель для китайского языка. Но оказалось, что она лучше понимает и английский.

Предшественником ERNIE был BERT, модель естественного языка, разработанная в Google в 2018. Она стала прорывом — ее предшественники учились предсказывать и интерпретировать значения слов, по контексту, расположенному либо до, либо после этого слова. BERT учитывал контекст в обоих направлениях, применяя метод наложения маски. В отрывке текста он случайным образом прятал 15% слов, а затем пытался предсказать их по оставшимся. Это позволяет делать более точные предсказания.

Специалисты Baidu тоже решили применить метод наложения маски, но им пришлось переработать его под китайский язык. В английском слово выступает семантической единицей: даже если лишить его контекста, оно сохранит свое значение. Но в китайском это не так. У некоторых иероглифов есть собственное значение, но у большинства — пока они не соединятся друг с другом — нет. Поэтому маска у ERNIE работала иначе — она прятала части иероглифов.

В результате ERNIE стал точнее предсказывать отсутствующие элементы. Такой подход оказался полезен при переводе текстов на другие языки и при восстановлении информации с бумажных носителей. Кроме того, исследователи быстро поняли, что метод лучше работает и для английского языка, в котором тоже бывают идиоматические выражения, которые отличаются по смыслу от суммы значений составляющих их слов.

В «обычной жизни» ERNIE помогает пользователям получить более точные результаты поисковых запросов и повышает способность виртуального помощника Сяо Ду точно отвечать за вопросы.

Источник: Хайтек+

photon · 30.12.2019, 09:59

Как по мне, это не совсем честно сравнивать лучшие решения AI со средним человеком. Почему-то о превосходстве шахматных или го-движков говорят в сравнении с сильнейшими человеко-игроками, а дорисовывание частей иероглифов - с людьми средними. Я не силён в китайском, но подозреваю, что средний китаец может просто не знать многих иероглифов, как средний русский может не знать многих слов, запихнуть которые в машину - не проблема.

Dmitriy40 · 30.12.2019, 11:41

Может и не совсем честно, но важно на практике: показывает что уже можно заменять обычных людей (типа секретарш разбирающих письменную почту) на ИИ. Ну а со временем прогресс дойдёт и до чемпионов распознавания текста — врачей и аптекарей. :mrgreen:

Emergency · 30.12.2019, 12:22

Мне кажется, что понимание языка ИИ лучше проверять путем перевода текстов на какой-то другой язык и обратно. Если смысл не изменится, значит ИИ понимает что делает.
Сейчас ни Яндекс, ни Гугол не могут переводить с русского на английский и обратно с сохранением смысла.

Andrey_Kireew · 30.12.2019, 13:35

promt может

mustitz · 30.12.2019, 13:56

Rasool в сообщении #1432462 писал(а):

Китайцы научили ИИ понимать язык лучше среднего человека. Под катом - подробности.

Ну... как по мне, язык позволяет достаточно свободно связывать местоимения с сущностями. Как их правильно связывать скорее зависит от понимания предметной области. Опять же в разных языках эта задача может быть разной сложности, так в русском языке грамматическая категория рода может давать подсказку. Типа «Ольга пила чёрный кофе. Он блестел солнце.» Несколько искусственно, но род показывает, что «он» относится к кофе. Ну а может ли человек блестеть на солнце?

Опять же, мне кажется, что тут нейросеть больше играет роль ассоциативной памяти, нежели речь идёт о понимании смысла. Есть дать какой-нить шахматный текст, мало представленнй в обучающей выборке, то шахматист обойдёт нейросеть.

Emergency · 30.12.2019, 14:25

Andrey_Kireew в сообщении #1432667 писал(а):

promt может

У меня сейчас нет Промта.
Если у вас есть, можете проверить его на предыдущем сообщении. Вот что из него сделал https://translate.google.com/

"Язык позволяет свободно ассоциировать место с сущностями. Как их правильно соединить, зависит от понимания предметной области. Эта грамматическая категория может дать подсказку. Типа «Ольга пила черный кофе». Он блестящее солнце. »Несколько искусственно связанных с кофе. Человек сияет на солнце?

Нежная речь о понимании смысла. Можно привести некоторый текст, который представлен в учебном образце."

Sender · 30.12.2019, 14:55

Emergency в сообщении #1432672 писал(а):

Вот что из него сделал https://translate.google.com/

У меня он выдал несколько иное.

GoogleTranslate писал(а):

Ну ... как по мне, язык позволяет свободно соотносить местоимения с сущностями. Как их правильно соединить, зависит от понимания предметной области. Опять же, на разных языках эта задача может быть различной сложности, поэтому на русском языке может дать подсказку грамматическая категория рода. Типа «Ольга пила черный кофе». Он сиял солнцем. Несколько искусственно, но род показывает, что «он» относится к кофе. Ну, может ли человек светить на солнце?

Опять же, мне кажется, что здесь нейронная сеть играет роль ассоциативной памяти больше, чем понимание смысла. Если в шахматном тексте есть нить, которая плохо представлена в тренировочном наборе, то шахматист обходит нейронную сеть.

Тут, конечно, и в исходном сообщении пропущен предлог:

mustitz в сообщении #1432671 писал(а):

Он блестел солнце.

Andrey_Kireew · 30.12.2019, 16:01

Emergency в сообщении #1432672 писал(а):

У меня сейчас нет Промта

он есть и онлайн, может похуже чем такой, но всё равно работает неплохо

Перевести туда-обратно, это обычный, и самый простой способ проверить правильность перевода. Но 100% гарантии он всё равно не даёт. Были случаи, когда promt возвращает тоже самое, а перевод не правильный. Здесь нужно понимать семантику. Хорошо известно, что узкоспециализированные тексты не в состоянии верно перевести даже профессиональные переводчики. Чего уж там говорить о ИИ, ему пока рано с этим тягаться. Если же в предметной области Вы хорошо ориентируетесь, несложно восстановить правильный смысл самого корявого перевода. Я так и делаю, перевожу сначала promt-ом, а потом пытаюсь понять, что там написано.

А вообще, не советую увлекаться онлайн-сервисами, они отслеживают всё, чем Вы занимаетесь

Emergency · 30.12.2019, 16:17

Sender в сообщении #1432676 писал(а):

У меня он выдал несколько иное.

Это очень интересно.
Я замечал, что Переводчик Гугол иногда выдает почти идеальный перевод, а иногда невозможную белиберду. Часто вижу белиберду в сообщениях от АлиЭкспресс. Иногда мои собственные сообщения на другой форум превращаются в белиберду, но при обновлении страницы приходят в исходный вид... Такое впечатление, что ИИ проникает везде и иногда дурИт.

-- 30.12.2019, 16:22 --

Andrey_Kireew в сообщении #1432684 писал(а):

узкоспециализированные тексты не в состоянии верно перевести даже профессиональные переводчики.

Когда я сдавал минимум по английскому, завкафедрой ин-яза спросил чем я занимаюсь и мы довольно долго вдвоем пытались перевести на английский "электрохимическая размерная обработка (ЭХРО)"... вариантов было много, но ни одного правильного, каковым оказался ECM - electrochemical machining.

photon · 30.12.2019, 17:03

(Оффтоп)

Может все-таки Prompt, а не promt?

Sender · 30.12.2019, 17:06

(photon)

Увы, именно Promt.

photon · 30.12.2019, 17:08

(Оффтоп)

Sender в сообщении #1432702 писал(а):

Увы, именно Promt.

О, точно -- от «PROject of Machine Translation». Не пользуюсь, но хотя бы буду знать.

mihaild · 30.12.2019, 18:02

photon в сообщении #1432640 писал(а):

Как по мне, это не совсем честно сравнивать лучшие решения AI со средним человеком. Почему-то о превосходстве шахматных или го-движков говорят в сравнении с сильнейшими человеко-игроками, а дорисовывание частей иероглифов - с людьми средними

(Картинка в тему)

В течении довольно долгого времени разница между машиной и средним человеком была намного больше, чем между средним и лучшим человеком. И с го, насколько я понимаю, было именно так: при форе, достаточной чтобы любитель выиграл у чемпиона, машины всё еще проигрывали любителям. Но в го переворот произошел очень быстро: от "машина безнадежно проигрывает любителям" до "чемпионы безнадежно проигрывают машине" прошло полтора года.
Я не знаю про особенности китайского, но вообще задача "предскажи слово по контексту" - стандартная для NLP, и она считается одной из основных (если мы это умеем делать очень хорошо, то мы "поняли" что-то важное про язык).

mustitz · 30.12.2019, 18:20

Почему видеоигры и настольные игры не самый лучший показатель способностей ИИ (интервью с создателем Keras)

Небольшая цитата

Цитата:

Например возьмем OpenAI Five: он не смог справиться со сложностью Dota 2, потому что его обучали на 16 персонажах, и он не смог распространить знания на всю игру, в которой больше 100 персонажей. На его тренировку ушло 45000 лет игрового процесса – опять же, обратите внимание, как требования к тренировочным данным растет вместе со сложностью задачи – тем не менее, полученная модель оказалась очень хрупкой: игроки, не являющиеся чемпионами, смогли найти стратегии, позволяющие победить бота через несколько дней после того, как ИИ стал доступен для публики.

Научный форум dxdy

Новости ИИ