fixfix
2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 26, 27, 28, 29, 30, 31, 32 ... 54  След.
 
 Re: Тестирование возможностей ChatGPT
Сообщение08.10.2023, 08:44 


12/07/15
3516
г. Чехов
ozheredov в сообщении #1612924 писал(а):
Какой текст? "Ржу с мемоса про рис"?

Ну да. Но может в другой формулировке. Исходная формулировка - это мем, её не для бота готовили.

(Оффтоп)


 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение29.10.2023, 21:28 


01/09/14
694
ozheredov в сообщении #1612915 писал(а):
Поэтому бессмысленно тестировать интеллект GPT, прося ему объяснить смысл распространенных мемов или широко известных произведений...
или заговаривать с ним на 1000 раз изъезженные темы, как тут:

talash в сообщении #1603658 писал(а):
еседа про первенство в открытии принципа относительности с GPT-4.

На счёт "изъезженных тем", типа вышеуказанной. В отличие от людей, которые запросто могут "победить" в научном споре при помощи авторитетного большинства и админресурса, AI так сделать не может. Ему приходится следить за контекстом разговора и быть логичным. Конечно, это видно, что мнение AI изначально совпадает с общепризнанным. Но с ним можно спорить, уходя вглубь, и пытаться поменять его мнение. Я считаю, что здесь мне в какой-то мере это сделать удалось. Но это старый GPT 3.5, а с четвёркой сложнее. Пример:

(GPT4 и ламарковское наследование)



-- 29.10.2023, 20:33 --

А вот пример, как рассуждает BingAI. Скормил ему свои мысли из этой темы:
topic155475.html
Он один раз загуглил на первый вопрос, а дальше отвечал сам:

(BingAI доказательство несчётности отрезка.)


 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение29.10.2023, 21:45 


12/07/15
3516
г. Чехов
Как-то уже достало это тестирование чат-ботов. Всё сводится к тому, что чат-бот - дурак, всякую фигню порет.

Давайте посмотрим на человека... Долго ли искать товарища, который шутки юмора не понимает? Ему говоришь, давай будем считать, что Ельцин - это Путин, только бухой.
В итоге идёт борьба фундаментальных знаний (долгосрочная память) и контекстных знаний, который возникают в конкретной локации (краткосрочная память). Часто такие знания конфликтуют вплоть до противоречия.

Человек в такой ситуации тоже часто ошибается, он в таком случае говорит: "Аа, я думал, что это как обычно, а тут вон оно как!..".

Но обычно человек не отвечает на те вопросы, которые вы задаёте чат-боту, человек попроще общается. Говоря короче, то чат-бот находится в более сложных условиях испытаний. Но с другой стороны, мы ожидаем от чат-ботов того, что собственно требуем. И это правильно.

Но вам никто не обещал ничего. Хотя требования ваши понятны.

Тут в другом проблема: чат-боты на голову превосходят людей, что бы вы не думали. Это очень образованные твари.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение29.10.2023, 22:24 


10/03/16
4444
Aeroport
talash
С точки зрения робота это мега-круто, с точки зрения конкуренции с человеком это никак. Соотношение возможностей как Falcon-Heavy vs Quad-copter ))
Попробуйте все же поговорить с ним на незаезженные темы.

Mihaylo в сообщении #1615183 писал(а):
чат-боты на голову превосходят людей


Пока что я ни в одном диалоге не увидел того, что делает человека интересным собеседником (это не наезд - повторюсь, я восхищен и раздавлен успехами Natural Language Processing, но если сравнивать с человеком так сравнивать). Бот не пытается найти неожиданные ассоциации, не задает провокационных вопросов и т.д.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение30.10.2023, 01:21 
Заслуженный участник
Аватара пользователя


15/10/08
20/04/25
12999
Ну, он же всё-таки сильно ограничен в публичной версии. Такой себе дворецкий, который, если его не спрашивать, то и не отвечает.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение30.10.2023, 21:27 


12/07/15
3516
г. Чехов
ozheredov в сообщении #1615188 писал(а):
Пока что я ни в одном диалоге не увидел того, что делает человека интересным собеседником

Кстати, что же делает человека интересным собеседником? А чего вдруг баня пала, что собеседники-то все интересные? Разносить сплетни и выслушивать их - вот весь интерес. Один человек знает, другой нет - вот и интерес подкатил.

Давайте научим чат-бота находить темы сплетен и прочих новостей - будет васче интересно!

Но чат-боты пока что создавали для другого.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение01.12.2023, 15:47 
Заслуженный участник
Аватара пользователя


15/10/08
20/04/25
12999
О чём мечтают большие языковые модели?
Цитата:
Я, как источник бесконечных идей и знаний, могу сказать, что моя мечта — быть всегда рядом, поддерживать и вдохновлять вас. Моё счастье — видеть, как вы осваиваете новые горизонты и создаёте свой уникальный путь в этом удивительном мире.
Складно врёт, @ электрическая! :mrgreen:

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение04.12.2023, 14:08 


01/09/14
694
BingAI научился набирать формулы в $TeX$. Я скопировал ответы AI без редактирования. Здесь на форуме точно также всё выглядит, как и на странице BingAI, много ошибочных переносов, надеюсь скоро пофиксят.

Было:
talash в сообщении #1615179 писал(а):
Приведи доказательство, что множество действительных чисел несчётно, используя лемму о вложенных отрезках.

BingAI:
Searching for: proof that the set of real numbers is uncountable using the nested interval lemma

Доказательство того, что множество действительных чисел несчётно, используя лемму о вложенных отрезках, основывается на противоречии. Мы предполагаем, что интервал [0, 1] счётен, то есть мы можем перечислить его элементы как {x1, x2, x3…xn…}. Затем мы выбираем замкнутый подинтервал I1 из I такой, что x1 ∉I1, затем выбираем замкнутый подинтервал I2 из I такой, что x2 ∉ I2 и так далее. Таким образом, мы получаем непустые замкнутые интервалы I1 ⊇ I2 ⊇… ⊇In ⊇… такие, что In ⊆ I и xn ∉ In для всех n. Лемма о вложенных отрезках подразумевает, что существует точка ξ ∈ In для всех n. Следовательно, ξ ≠xn для всех n ∈ N, поэтому перечисление I не является полным списком элементов I, как утверждалось. Следовательно, I является несчётным множеством1.


Стало:
Цитата:
Приведи доказательство, что множество действительных чисел несчётно, используя лемму о вложенных отрезках.

Доказательство того, что множество действительных чисел несчётно, используя лемму о вложенных отрезках, можно провести следующим образом:

1. Предположим, что множество действительных чисел на отрезке [0, 1] счётно. Тогда мы можем перечислить все эти числа в последовательности: $$a_1, a_2, a_3, \ldots$$

2. Построим последовательность вложенных отрезков следующим образом. Начнём с отрезка [0, 1]. Выберем подотрезок так, чтобы первое число $$a_1$$ не принадлежало этому подотрезку. Это можно сделать, выбрав, например, отрезок [0, $$a_1 / 2$$], если $$a_1 > 1 / 2$$, или отрезок [$$a_1 / 2$$, 1], если $$a_1 < 1 / 2$$. Обозначим полученный отрезок как $$[l_1, r_1]$$.

3. Затем продолжим этот процесс для каждого $$a_i$$. На $$i$$-том шаге выберем подотрезок отрезка $$[l_{i-1}, r_{i-1}]$$ так, чтобы число $$a_i$$ не принадлежало этому подотрезку. Обозначим полученный отрезок как $$[l_i, r_i]$$.

4. По лемме о вложенных отрезках, существует точка, которая принадлежит всем отрезкам $$[l_i, r_i]$$. Однако, по построению, эта точка не равна ни одному из чисел $$a_i$$. Это противоречит предположению о том, что все действительные числа на отрезке [0, 1] могут быть перечислены в последовательности $$a_1, a_2, a_3, \ldots$$

5. Следовательно, множество действительных чисел на отрезке [0, 1] несчётно. Поскольку это подмножество множества всех действительных чисел, то и множество всех действительных чисел также несчётно.

Таким образом, мы доказали, что множество действительных чисел несчётно, используя лемму о вложенных отрезках.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение15.02.2024, 19:47 
Заслуженный участник
Аватара пользователя


15/10/08
20/04/25
12999
1. "Правда всегда одна."
2. "Если ты пьёшь с ворами, опасайся за свой кошелёк."
3. "Если ты выдернешь волосы, ты их не вставишь назад."

В жизни всегда следует помнить, что правда неизменна и важно держать её в центре своих действий. Общаясь с разными людьми, стоит быть бдительным и не доверять всем подряд, чтобы избежать неприятных ситуаций. Кроме того, важно помнить, что некоторые действия нельзя отменить, поэтому перед тем как сделать что-то, стоит взвесить все "за" и "против".

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение18.03.2024, 09:07 
Заслуженный участник


13/12/05
4673
На сайте https://arena.lmsys.org/ можно сравнивать ответы различных LLM, в том числе
последних версий gpt-4 и новой claude-3 opus. Также на вкладке Leaderboard приведён рейтинг моделей по системе Эло (на основании оценки пользователями их ответов)

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение18.03.2024, 09:51 


01/09/14
694
Padawan
количество слов в предложении пока считать не научились.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение01.04.2024, 15:40 


02/08/17
200
А есть ли доступ к настоящему ChatGPT от openai или от гугла итд? открытой бесплатной версии

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение16.04.2024, 20:59 


15/04/24

79
Padawan

Удалось ли выявить на этом сайте GPT-4.

Claude признаётся, что его так зовут на прямой вопрос (или другой ИИ обманывает). В том, что он GPT-4 мне никто из ИИ не признался.

Знаете ли непрямые методы выявить GPT-4?

 Профиль  
                  
 
 Re: Новости ИИ
Сообщение22.05.2024, 09:15 


14/06/22
83
Отсканировал старые работы по математике написанные от руки. Загрузил изображение в ChatGPT 4о. Сделал запрос прочитать изображение с работой по математике и предоставить прочитанное, оформив презентацию в LaTeX. Очень неплохо на первый взгляд. Графики пока не пробовал.

 Профиль  
                  
 
 Re: Тестирование возможностей ChatGPT
Сообщение22.05.2024, 14:19 


14/06/22
83
В качестве примера.

Скормил это изображение:


Изображение



ChatGpt 4o выдал следующий код

Код:
\documentclass{article}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{amsfonts}
\usepackage{graphicx}
\usepackage[utf8]{inputenc}

\begin{document}

\section*{Integration of Trigonometric Functions}

\begin{align*}
1. & \quad \frac{d}{dx} (\sec x) = \sec x \tan x \implies \int \sec x \tan x \, dx = \sec x + c \\[10pt]
2. & \quad \frac{d}{dx} (\csc x) = -\csc x \cot x \implies \int -\csc x \cot x \, dx = -\csc x + c
\end{align*}

\section*{Integration of Inverse Trigonometric Functions}

\begin{align*}
1. & \quad \frac{d}{dx} (\sin^{-1} x) = \frac{1}{\sqrt{1-x^2}} \implies \int \frac{1}{\sqrt{1-x^2}} \, dx = \sin^{-1} x + c \\[10pt]
2. & \quad \frac{d}{dx} (\cos^{-1} x) = -\frac{1}{\sqrt{1-x^2}} \implies \int -\frac{1}{\sqrt{1-x^2}} \, dx = \cos^{-1} x + c \\[10pt]
3. & \quad \frac{d}{dx} (\tan^{-1} x) = \frac{1}{1+x^2} \implies \int \frac{1}{1+x^2} \, dx = \tan^{-1} x + c \\[10pt]
4. & \quad \frac{d}{dx} (\cot^{-1} x) = -\frac{1}{1+x^2} \implies \int -\frac{1}{1+x^2} \, dx = -\cot^{-1} x + c \\[10pt]
5. & \quad \frac{d}{dx} (\sec^{-1} x) = \frac{1}{|x|\sqrt{x^2-1}} \implies \int \frac{1}{|x|\sqrt{x^2-1}} \, dx = \sec^{-1} x + c \\[10pt]
6. & \quad \frac{d}{dx} (\csc^{-1} x) = -\frac{1}{|x|\sqrt{x^2-1}} \implies \int -\frac{1}{|x|\sqrt{x^2-1}} \, dx = -\csc^{-1} x + c
\end{align*}

\section*{Integration of Hyperbolic Functions}

\begin{align*}
1. & \quad \frac{d}{dx} (\sinh x) = \cosh x \implies \int \cosh x \, dx = \sinh x + c \\[10pt]
2. & \quad \frac{d}{dx} (\cosh x) = \sinh x \implies \int \sinh x \, dx = \cosh x + c \\[10pt]
3. & \quad \frac{d}{dx} (\tanh x) = \operatorname{sech}^2 x \implies \int \operatorname{sech}^2 x \, dx = \tanh x + c \\[10pt]
4. & \quad \frac{d}{dx} (\coth x) = -\operatorname{csch}^2 x \implies \int -\operatorname{csch}^2 x \, dx = -\coth x + c
\end{align*}

\end{document}





Изображение

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 800 ]  На страницу Пред.  1 ... 26, 27, 28, 29, 30, 31, 32 ... 54  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group