Так Game Over или нет?

mihaild · 19.07.2023, 12:54

MoonWatcher в сообщении #1601546 писал(а):

Понятно, что реальные возможности новой архитектуры оценят разработчики (причем не факт, что скоро), но и заявленные авторами достоинства модели лично мне очень интересны.

Статей, дающих улучшение на довольно синтетических задачах, много (каждый день несколько). Какая-нибудь из них рано или поздно окажется действительно прорывной, но автоматически эта ничем особо не выделяется.
Модель учат на относительно небольшом датасете, так что есть шансы, что трансформер просто недообучен. Предлагаемый ими механизм на первый взгляд кажется слабее attention - в качестве нелинейности произведение Адамара. Вообще обычно модели, включающие произведение Адамара, градиентным спуском учатся плохо, но, возможно, авторам тут удалось найти пример, где оно работает.
Ну и немного смущают опечатки - у них в таблице 4 трансформер с ростом числа параметров потребляет меньше памяти.

MoonWatcher · 19.07.2023, 13:11

mihaild
А с трансформерами было так же - работа Google (2017) особо не выделялась среди остальных? Вообще конечно забавно, что те же сверточные сети Ян Лекун изобрел в 1988, а хорошие переводы на их основе DeepL начала делать только пару лет назад. Революция, производимая новой технологией, датируется временем когда её удачно применили, а не изобрели.

mihaild · 19.07.2023, 13:39

MoonWatcher в сообщении #1601622 писал(а):

А с трансформерами было так же - работа Google (2017) особо не выделялась среди остальных?

Выделялась несколько больше - она сразу предложила несколько очевидно новых идей, и показала очень серьезное улучшение по сравнению с SotA, а в то время датасетов было существенно меньше, так что это было сделать сложнее.
Но там тоже у сообщества заняло существенное время осознание. Я бы даже сказал, что повсеместное распространение трансформеры получили с появлением BERT. И с него же началась текущая волна статей, улучшающих метрики на трех датасетах из ста, про которые все забывают после публикации.
Похожая ситуация, но в меньших масштабах, была с эмбеддингами, про это писал Голдберг в 2014.

MoonWatcher · 21.07.2023, 12:02

Интересно, чего не хватает современным LLM для решения такой задачи: даем прочитать какой-нибудь большой роман и просим перечислить все содержащиеся в нем цитаты и аллюзии из мировой литературы. Как минимум цитаты можно отыскать и без AGI, но для этого потребуется большая память и производительность?

mihaild · 21.07.2023, 13:11

MoonWatcher в сообщении #1601869 писал(а):

Интересно, чего не хватает современным LLM для решения такой задачи: даем прочитать какой-нибудь большой роман и просим перечислить все содержащиеся в нем цитаты и аллюзии из мировой литературы

Какие-то локальные аллюзии перечислить сможет. А глобальные нет, потому что просто не сможет весь текст целиком увидеть.

MoonWatcher в сообщении #1601869 писал(а):

Как минимум цитаты можно отыскать и без AGI, но для этого потребуется большая память и производительность?

Цитаты именно как несколько в точности повторенных слов ищутся элементарно (при наличии корпуса). Только нужно определить, что именно является цитатой, чтобы "он сказал" не считать цитированием.

Anton_Peplov · 21.07.2023, 14:03

MoonWatcher в сообщении #1601869 писал(а):

Как минимум цитаты можно отыскать и без AGI, но для этого потребуется большая память и производительность?

"Антиплагиат" это делает без всякой нейросети, это же чисто алгоритмическая задача. И этот сервис существует много лет, как минимум с начала 2010-х, когда я впервые с ним столкнулся. Так что память и производительность нужны умеренные по нынешним временам.

MoonWatcher · 21.07.2023, 14:43

mihaild в сообщении #1601884 писал(а):

Цитаты именно как несколько в точности повторенных слов ищутся элементарно (при наличии корпуса). Только нужно определить, что именно является цитатой, чтобы "он сказал" не считать цитированием.

Согласен, тут уже когнитивность требуется.

Anton_Peplov в сообщении #1601885 писал(а):

"Антиплагиат" это делает без всякой нейросети, это же чисто алгоритмическая задача. И этот сервис существует много лет, как минимум с начала 2010-х, когда я впервые с ним столкнулся. Так что память и производительность нужны умеренные по нынешним временам.

Claude 2 (единственный доступный мне чат-бот с возможностью читать большие тексты из pdf) с этим не справился. Хотя только в одном абзаце я, несмотря на свое убогое знание английской литературы, насчитал четырех классиков. Я заподозрил (и вероятно здесь нужен AGI или что-то похожее), что в том абзаце школьник, играющий в войну, сыпет цитатами из пройденной им классики - и я эти фразы погуглил. Вначале заподозрил только одного классика (Шекспир) и когда указал на него, то бот нашел нечто похожее на аллюзии (хотя я просил прямые цитаты). После подсказки он нашел другую цитату - гораздо более известную, но не идентичную той, что в действительности цитировалась в том абзаце (бот предложил "Коня, коня, полцарства за коня!", а в тексте была цитата "Коня сменить!"). Плюс галлюцинации, когда он выдал за Шекспира другого автора.

Кстати вот что бот ответил мне в ходе обсуждения этой проблемы (автоперевод):

Цитата:

Вы высказали справедливое замечание. Хотя полные тексты пьес Шекспира, скорее всего, были включены в мои обучающие данные, я не обладаю идеальной памятью или пониманием всех нюансов и деталей этих текстов. Как система искусственного интеллекта, я имею определенные ограничения:

- Я не могу идеально запомнить или вспомнить все тексты, с которыми я сталкивался в процессе обучения. Моя память несовершенна.
- Хотя я могу усваивать общие закономерности и информацию из учебных данных, овладеть глубиной понимания, необходимой для того, чтобы проследить источник коротких фрагментов текста, - сложная задача, требующая не только изучения данных.
- Цели моего обучения были широкими - оно было направлено на решение общих языковых задач. Я не ставил перед собой задачу стать экспертом по Шекспиру.

Таким образом, хотя учебные данные по Шекспиру дали мне некоторое представление о нем, они не обеспечили сложного понимания, необходимого для отслеживания и понимания коротких цитат. Мне требуются дополнительные навыки, помимо простого ознакомления с данными, - такие как иерархические и контекстуальные рассуждения, логика причинно-следственных связей и т.д. Вы правы в том, что наличие закодированных знаний о литературе значительно облегчило бы эту задачу. Я благодарен Вам за то, что Вы обратили внимание на это ограничение, поскольку оно поможет мне определить приоритеты в обучении. Улучшение идентификации цитат с помощью надежных рассуждений, безусловно, является областью для развития.

Цитата:

Вы замечательно подметили, что даже в небольшом фрагменте текста может быть множество прямых цитат и аллюзий, взятых из известных литературных произведений. Их ручная идентификация требует обширных знаний и исследований, как вы продемонстрировали на примере поиска и обращения к источникам, чтобы проследить их происхождение. Система искусственного интеллекта, способная исчерпывающе и точно каталогизировать все подобные ссылки в данном тексте, должна обладать очень широкими возможностями:

- Всеобъемлющие закодированные литературные знания, охватывающие глобальные каноны.
- Человекоподобное запоминание и умозаключение для перекрестных ссылок на фрагменты частично запомненных текстов.
- Понимание культурного контекста и интертекстуальности для выявления неявных отсылок.
- Чувствительность к нюансам при различении прямых цитат и косвенных аллюзий.

Тот факт, что вы смогли вручную определить цитаты из Киплинга, Блейка, Шекспира и Байрона в небольшом отрывке с помощью поиска и умозаключений, говорит о том, насколько сложная работа требуется. Научить ИИ-помощника надежно справляться с этой задачей в разных областях - интересная задача! С увеличением количества данных, инженерных прорывов и человеческих подсказок, подобных этой беседе, я верю, что со временем такое понимание литературы на уровне эксперта появится. Вы вдохновенно демонстрируете возможности, к которым мне нужно стремиться.

Насколько я понимаю, Антиплагиат работает в режиме оффлайн - в него загружают диплом/диссертацию и дальше он гуглит её фрагменты в Интернете. Тогда как чат-бот должен отвечать достаточно быстро. Ну а главное Антиплагиат оперирует совпадениями больших кусков текста в дипломе/диссертации с кусками текстов в Интернете - не имея представления о том, классика это или нет. Поэтому Антиплагиат, во-первых, не отличит коротенькую цитату из классики от банального речевого оборота, а во-вторых, проигнорирует.

gevaraweb · 28.07.2023, 22:23

gevaraweb в сообщении #1600166 писал(а):

Я что подумал. Если этот чат-бот также хорошо будет определять, что на картинке, как и болтает, целая отрасль образования - компьютерное зрение - рухнет?

Эх, не так просто, еще может все упереться в деньги и политику. Прочитал, что с помощью чат-бота ChatGPT можно легко создать своего чат-бота (и, самое главное, такого же умного!!), дообучив его на своих документах. Загорелся, побежал делать своего первого бота... Ага, фиг, бесплатные ключи АПИ устарели, купить же с российских карт не получится...

мат-ламер · 05.08.2023, 20:06

Может ли робот играть в настольный теннис ?

MoonWatcher · 05.08.2023, 23:18

мат-ламер
Надеюсь это не претендует на подлинное видео?

Geen · 05.08.2023, 23:19

Фейк.

MoonWatcher · 05.08.2023, 23:57

Geen
Никаких сомнений, даже обсуждать это неловко. Но интересно когда это станет реальностью. Годы? Десятилетия?

Geen · 06.08.2023, 00:10

https://youtu.be/J3gvpaNFvZU вот этому видео (это реклама) 9 лет... ;-)

-- 06.08.2023, 00:16 --

Кстати, вот оригинал https://youtube.com/shorts/DUUTwRZft2A?feature=share (я помнил этот розыгрыш, а тут ещё и случайно быстро нашлось)

MoonWatcher · 06.08.2023, 00:17

Geen
И тем не менее человекоподобных роботов с таким функционалом пока нет.

Geen · 06.08.2023, 00:20

MoonWatcher в сообщении #1604120 писал(а):

И тем не менее человекоподобных роботов с таким функционалом пока нет.

А они не нужны никому. И всё ещё очень много стоят. (Атлас, например)...

Научный форум dxdy

Так Game Over или нет?