2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 37, 38, 39, 40, 41  След.
 
 Re: Тестирование возможностей ChatGPT
Сообщение05.08.2024, 05:03 
Аватара пользователя


07/01/15
1213
ozheredov в сообщении #1648403 писал(а):
"You need a Replicate API token to run this demo."

Да, при этом достаточно профайла на Гитхабе, чтобы получить заветный API.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение05.08.2024, 12:49 
Аватара пользователя


17/10/22
339
ozheredov в сообщении #1648445 писал(а):
- это комедия, и тем не менее совершено не вкуриваю смысл. Видимо, итальянский уровень понимания юмора для меня недостижим.

А мне понравилось :mrgreen: Сейчас дам свое объяснение, а потом сравню с объяснением чат-ботов. Я бы объяснил так:

Я
Цитата:
Юмор состоит в абсурдности ситуации. Профессиональный консультант (в данном случае - официант) демонстрирует свою некомпетентность, клиент его поправляет, и консультант дает уже новую рекомендацию. В данном эпизоде обыгрывается некомпетентность и бесполезность консультанта, который дает клиенту его же собственный совет.

GPT-4o:
Цитата:
Юмор этого эпизода основан на игре с логикой и повторением фраз, что создает комический эффект. Вот несколько моментов, которые делают его смешным:

Ирония и непоследовательность: Официант сначала предлагает вино из Боргонии 74-го года, а затем сам признает, что град уничтожил весь урожай в том году. Это противоречие само по себе забавно, потому что официант предлагает что-то, чего не существует.

Парадокс: Когда посетитель говорит, что к карпу подойдет Мозельское белое 76-го года из винограда, выращенного на левом берегу, официант повторяет это предложение слово в слово, как будто это его собственная рекомендация. Это создает комический парадокс: официант делает вид, что он специалист, но на самом деле просто повторяет слова посетителя.

Повторение: Повторение фразы "Потому что в Боргонии в 74-м град уничтожил весь урожай винограда" создает комический эффект за счет неожиданного и абсурдного завершения разговора. Эта фраза, которая сначала выглядит как обоснование отказа, затем становится причиной для согласия, что еще больше усиливает комичность ситуации.

Неожиданность: Ожидается, что официант будет давать экспертные советы, а он просто повторяет слова посетителя, что идет вразрез с ожиданиями зрителей.

Этот юмор может показаться смешным не всем, так как он зависит от восприятия абсурдности ситуации и игры с логикой. Вашему другу, возможно, не показалось это смешным, потому что восприятие юмора очень субъективно и может зависеть от личных предпочтений и опыта.

Claude 3.5 Sonnet:
Цитата:
Этот диалог действительно содержит юмористический элемент. Давайте разберем, в чем заключается юмор:

Неожиданный поворот: Официант начинает с уверенной рекомендации, но посетитель сразу ее отвергает, обладая неожиданно глубокими познаниями о виноделии.
Смена ролей: Обычно официант выступает экспертом, а клиент полагается на его рекомендации. Здесь же клиент демонстрирует более глубокие знания.
Ирония ситуации: После того как клиент отвергает первую рекомендацию и объясняет почему, официант, не моргнув глазом, предлагает именно то вино, которое клиент сам упомянул.
Цикличность диалога: Диалог заканчивается тем же объяснением, с которого начался отказ клиента, что создает комический эффект "полного круга".
Абсурдность ситуации: Весь этот сложный разговор о винах происходит до того, как официант вообще узнал, какую рыбу заказал клиент.
Пародия на снобизм: Диалог высмеивает чрезмерную придирчивость и претенциозность, часто ассоциируемую с винной культурой.

Юмор в этой сцене во многом основан на неожиданности, иронии и абсурдности ситуации. Однако восприятие юмора субъективно, и не все могут найти эту сцену одинаково смешной. Это может зависеть от личного опыта, знаний о винной культуре или просто индивидуального чувства юмора.

Обратите внимание на "не моргнув глазом" - Claude 3.5 Sonnet очень точно передал, пожалуй, ключевой элемент юмора в этом эпизоде. В своем ответе я хотел написать "Официант как ни в чем не бывало...", но решил, что раз в эпизоде об этом прямо не говорится, то лучше так не формулировать. Чат-бот не только уловил этот момент, но и упомянул о нем.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение05.08.2024, 14:01 


10/03/16
4435
Aeroport
MoonWatcher в сообщении #1648488 писал(а):
Профессиональный консультант (в данном случае - официант) демонстрирует свою некомпетентность, клиент его поправляет, и консультант дает уже новую рекомендацию. В данном эпизоде обыгрывается некомпетентность и бесполезность консультанта, который дает клиенту его же собственный совет.


Пожалуй, да.

MoonWatcher в сообщении #1648488 писал(а):
Claude 3.5 Sonnet очень точно передал, пожалуй, ключевой элемент юмора


++. Клаудия что-то реально уделывает всех по интеллекту, не первый раз замечаю

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение05.08.2024, 14:08 
Аватара пользователя


17/10/22
339
ozheredov
При том, что это средняя версия, Sonnet. Интересно каким будет Claude 4 Opus...

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение05.08.2024, 15:23 
Заслуженный участник
Аватара пользователя


15/10/08
11961
Лично я даже после расстрела чат-ботами не улавливаю тут юмора. Троллинг есть, а юмора нет.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение05.08.2024, 20:03 


12/07/15
3100
г. Чехов
ozheredov в сообщении #1648445 писал(а):
Видимо, итальянский уровень понимания юмора для меня недостижим.

Один сказал, что весь урожай винограда был уничтожен, хотя это на самом деле нереально, а второй принял это буквально и научил первого выражаться по-русски (по-итальянски) поточнее.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение11.08.2024, 20:37 
Заслуженный участник
Аватара пользователя


15/10/08
11961
Бесплатная версия снизошла до рисования картинок по описанию. Правда всего по две штуки в сутки. Вот, например, как выглядят в представлении чата прогуливающиеся по лесам Берен и Лютиен. По-моему, ничего так, "романтишненько". Хотя с Береном он малость накосячил, сделав его эльфом. Причём бородатым.


Вложения:
IMG_20240811_194231.jpg
IMG_20240811_194231.jpg [ 495 Кб | Просмотров: 0 ]
 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 14:10 
Аватара пользователя


17/10/22
339
По моим ощущениям (хотя довелось потестить далеко не все модели, а те что тестил - бесплатные или с уже исчерпанным лимитом) этот - самый умный. Но все портит чрезмерная цензура и постоянные "технические проблемы". Хороший бы придумать бенчмарк для таких моделей. В котором оценивается не зрелищность, а точное соответствие промпту - на предмет интерьера, внешности, поз, действий, выражений лица, породы животного и т.д. Но скорее всего это нереально, потому что цензура забракует множество из промптов.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 15:05 
Заслуженный участник
Аватара пользователя


16/07/14
8934
Цюрих
MoonWatcher в сообщении #1649747 писал(а):
Хороший бы придумать бенчмарк для таких моделей. В котором оценивается не зрелищность, а точное соответствие промпту
T2I-CompBench
Правда популярностью особой не пользуется.
MoonWatcher в сообщении #1649747 писал(а):
Но скорее всего это нереально, потому цензура забракует множество из промптов
Причем тут вообще цензура?

И у ChatGPT цензура сравнительно мягкая. В Gemini куда жестче, людей вообще не генерирует (хотя у меня есть надежда что когда-нибудь это изменится).

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 15:10 


10/03/16
4435
Aeroport
MoonWatcher в сообщении #1649747 писал(а):
цензура забракует множество из промптов


А что, промпт прям-таки обязан содержать экстремизм или похабщину? Ну например:

40-калетний мужик у себя на кухне, сгорбившись, паяет выпрямитель на двуханодной лампе, внутренне радуясь предстоящему отключению света у соседей.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 15:27 
Аватара пользователя


17/10/22
339
Интереснее задания с процессом, вовлекающим двух и более человек. Например:
Цитата:
"40-летний мужик у себя на кухне, сгорбившись, паяет выпрямитель на двуханодной лампе, внутренне радуясь предстоящему отключению света у соседей. На него недовольно смотрит его неряшливо одетая жена, со сковородкой в руке. С подоконника эту сцену с живым интересом наблюдает рыжий кот."

Ваш запрос:
Изображение

Ваш запрос с моим дополнением:
Изображение

Неплохо, но не идеально, конечно.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 15:30 


10/03/16
4435
Aeroport
MoonWatcher
КЛА-А-АСС!!!!!!!!

Мне первая картинка прям безумно нравится)

P.S. Какие у него красивые жена и кот, а он кухню довёл до такого состояния..

Не, конечно сказать, что я потрясён - это ничего не сказать

-- 13.08.2024, 15:43 --

MoonWatcher

P.P.S. На нижней картинке (которая по Вашему запросу) мужик очень напоминает Атруса из миров братьев Миллеров, работающего над своим очередным изобретением. Благородные черты лица состарившегося человека, мозг которого вмещает все 10 томов Ландау-Лифшица. У него, кажется, что-то начинает получаться... Рядом стоит жена Катерина с недовольным выражением лица - опять очередную глупость паяет, нет бы затеять ремонт на кухне.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 19:54 
Аватара пользователя


17/10/22
339
Жена действительно красивая, вопреки моего промпту (в будущем ждем массовые иски от некрасивых женщин, с обвинениями ИИ в сексизме и сексуальной эксплуатации женщин) - я скорее воображал себе домохозяйку не первой свежести, преисполненную раздражения по поводу чудачеств своего придурка. Сковородку в руках заменила их экспозиция на стене, а к подоконнику вместо кота сместилась жена. Но в целом неплохо, согласен. И все-таки я бы хотел убрать все эти ограничения - на насилие, даже легкую эротику, "расизм", физиономии знаменитостей... Однако этого нет и не предвидится - что делает подобные приложения довольно пресными.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение13.08.2024, 20:11 
Заслуженный участник
Аватара пользователя


15/10/08
11961
MoonWatcher в сообщении #1649814 писал(а):
к подоконнику вместо кота сместилась жена
Ибо жена наблюдает луна.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение14.08.2024, 18:39 
Заслуженный участник
Аватара пользователя


28/09/06
10790
А в первом рисунке цензура вырезала кота.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 611 ]  На страницу Пред.  1 ... 37, 38, 39, 40, 41  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group