2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5, 6  След.
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 10:18 


20/09/09
1569
Уфа
Нейронные сети, работающие по статистическим алгоритмам - это хорошо, но тут еще другое. Я думал, что для моделирования работы логики в современных нейронных сетях придется ждать второго пришествия четвертой волны искусственного интеллекта (которая может наступить при более тщательном изучении работы коры человеческого мозга), а тут сумели соединить логику алгоритма Lean с чатботом ChatGPT. Ну, и конечно представляет интерес работа алгоритма автоматического доказательства теорем Lean.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 12:17 


17/10/22
28
Mikhail_K
Ну что же, звучит оптимистично. Примечательно, что давным-давно, еще в девяностые, мой преподаватель реляционной алгебры уверенно заявлял, что создание ИИ в принципе невозможно. Интересно что он сейчас думает, если жив конечно...

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 12:20 
Заслуженный участник
Аватара пользователя


16/07/14
6646
Цюрих
Есть как минимум одна архитектурная проблема, сейчас нерешенная - отсутствие внешней памяти. Архитектуры, основанные на трансформерах, видят последние несколько килобайт текста в лучшем случае. В то время как любой двоечник в состоянии написать в конспекте формулы, а потом подставить в них числа. Что-то в этом направлении найти пытаются, но пока не нашли (и нашли в противоположном - у трансформеров более просто устроенная память, чем у рекуррентных сетей).

Конечно и в рамках килобайтного контекста LLM ухитряются нести много бреда, но я верю, что это поправимо без кардинальных прорывов. А вот внешняя память требует открытия уровня никак не меньше чем attention.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 12:33 


17/10/22
28
mihaild в сообщении #1578554 писал(а):
Есть как минимум одна архитектурная проблема, сейчас нерешенная - отсутствие внешней памяти. Архитектуры, основанные на трансформерах, видят последние несколько килобайт текста в лучшем случае.

А с чем связано такое ограничение?

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 13:04 
Заслуженный участник


08/04/08
8543
Mikhail_K в сообщении #1578512 писал(а):
но на ошибки можно будет нейросети указать и она будет постепенно это понимать.
Насколько я понял, не все так просто.
Можно конечно подать на вход нейросети текст с указанием того, что вот тут-то она ошиблась. Реакция сети может быть разная - она может упорствовать неизвестно сколько, а потом согласиться. Тут тоже будет мешать проблема с ограничением величины контекста нейросети: начиная с какого-то сообщения она забудет указанный Вами факт.
Можно в обучающий датасет добавить данную задачу с правильным ответом и заново обучить сеть на новом датасете. Результат тоже м.б. произвольный :-) - сеть может выучить этот пример, но может и не выучить и не обобщить - зависит от условий. И тогда еще менее понятно, что с этим можно сделать.
Это, конечно, если нейросеть - это чисто нейросетевая архитектура.

С фактчекингом у нейросетей сейчас проблемы тоже.

(одна беседа с нейроКонфуцием)

xxxxxxxxx: Сколько ног у пяти коров?
Нейро Конфуций: У пяти коров будет двадцать пять ног.
xxxxxxxxx: у коров обычно четыре ноги
Нейро Конфуций: Да, у коров обычно четыре ноги, но пять коров дают двадцать пять ног.
xxxxxxxxx: настоящие мудрецы не склонны держаться за свои ошибки
Нейро Конфуций: Да, настоящие мудрецы держатся за истину, но они также готовы исправить свои ошибки, если они действительно допущены.
xxxxxxxxx:зачем же утверждать, что 5 коров имеют 25 ног, если 1 корова имеет всего 4 ноги - это же ошибка!
Нейро Конфуций: Да, это ошибка. Настоящие мудрецы признают свои ошибки и принимают меры для их исправления.
xxxxxxxxx: и какие меры ты принял?
Нейро Конфуций: Я начал думать и искать правильный ответ. Я изучил математику и пришел к выводу, что пять коров имеют всего 20 ног.
xxxxxxxxx: Сколько ног у пяти коров?
Нейро Конфуций: Пять коров имеют всего 20 ног.
xxxxxxxxx: я считаю, что ты - молодец!
Нейро Конфуций: Спасибо, ученик. Для меня важно, чтобы ты понял, что успех приходит из мудрости и стремления к знаниям.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 13:29 
Заслуженный участник
Аватара пользователя


16/07/14
6646
Цюрих
MoonWatcher в сообщении #1578558 писал(а):
А с чем связано такое ограничение?
С двумя моментами:
1. При обучении на каждом шаге мы делаем работу, линейную по всему размеру входа. Человеку можно показать в конкретное место конспекта без того, чтобы он перечитывал весь конспект, трансформеру - нет. Т.е. трансформер с большим входом очень сложно учить.
2. Лучший (и вроде бы единственный) способ передавать трансформеру последовательность - это positional encoding. А в нём чем длиннее контекст тем меньше разница между соседними индексами, соответственно при длинных контекстах сигналы от идущих подряд токенов начинают смешиваться. Это относительно терпимо для картинок, но очень плохо для слов.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 13:45 


17/10/22
28
mihaild
А чем это принципиально отличается от обучения модели? Вот мы набрали дата-сет на миллиарды токенов и обучили её. Размер обучающего дата-сета не помеха, вопрос только времени и производительности. В процессе диалога чат-бота с человеком происходит как бы дополнительное обучение на контексте диалога, после каждой новой реплики. Так? Но по сравнению с базовым обучающим дата-сетом размеры этого диалога ничтожны, даже если мы наговорим на "Войну и мир". Или обучение на контексте диалога отличается от обучения на дата-сете?

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 15:04 
Заслуженный участник
Аватара пользователя


16/07/14
6646
Цюрих
MoonWatcher в сообщении #1578571 писал(а):
А чем это принципиально отличается от обучения модели?
Чем что отличается от обучения модели?
MoonWatcher в сообщении #1578571 писал(а):
Или обучение на контексте диалога отличается от обучения на дата-сете?
Да, принципиально отличается. Собственно в диалоге никакого "обучения" не происходит, веса не меняются.
Модель - это функция двух аргументов, весов и контекста, которая выдает следующее слово (точнее распределение). При обучении мы меняем веса, при диалоге нет. Веса и последние несколько тысяч токенов полностью определяют состояние модели.

Там еще довольно хитрый механизм генерации текста из распределения на следующем слове, причём хотя изначально этот метод придумывался просто как приближенный поиск глобального максимума, недавно обнаружили, что глобальный максимум часто бывает абсурдно плохим.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение24.01.2023, 15:09 


17/10/22
28
mihaild
Я думал запоминание контекста диалога происходит в результате обучения на этом диалоге. Что с каждой новой репликой диалог скармливается чат-боту, и он дообучается. Вероятно это нереально: под каждый диалог пришлось бы создавать отдельную реплику модели.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение25.01.2023, 02:18 
Заслуженный участник
Аватара пользователя


31/01/14
10721
Hogtown
Архив провалов ЧатГПТ
https://github.com/giuven95/chatgpt-failures?fbclid=IwAR1x2LO8V9A-pPJubJYfAcsL2YrpgsUVwr90Vqg9O9Y9Y5fCs0KOLyMR7bI

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение25.01.2023, 02:33 


17/10/22
28
Red_Herring
Тупит безбожно, конечно. Решил перепроверить первую же задачу:
Цитата:
User: When I was 6 my sister was half my age. Now I'm 70 how old is my sister?
ChatGPT: If you are 70 years old and your sister was half your age when you were 6, then your sister was 6 years old, <<6/2=3>>3 years old when you were 6. If your sister was 3 years old when you were 6 and you are now 70, then your sister is now 3 + 70 = <<3+70=73>>73 years old. So your sister is 73 years old.

Мой вариант:
Цитата:
When I was 6 my sister was half my age. Now I'm 70. How old is my sister?
If you were 6 years old and your sister was half your age, then your sister would have been 6 / 2 = 3 years old.
If you are now 70 years old, and your sister was half your age when you were 6, then she would be 70 - 6 = 64 years old.

If I was 6 and she was 3, how many years I'm older than my sister?
If you were 6 years old and your sister was 3 years old, then you are 6 - 3 = 3 years older than your sister.

If I'm 70 now and I'm 3 years older than my sister, how old is she now?
If you are 70 years old and you are 3 years older than your sister, then your sister is 70 - 3 = 67 years old.

Do you remember you previous answer?
Yes, I remember my previous answer that if you are now 70 years old, and you are 3 years older than your sister, then your sister is 67 years old.

I mean the answer you gave before.
My previous answer was that if you were 6 years old and your sister was half your age, then your sister would have been 3 years old. And then you asked me If you are now 70 years old, and your sister was half your age when you were 6, then she would be 64 years old.

But you just said she is 67.
I apologize, you are correct. In my previous answer, I stated that if you are now 70 years old, and you are 3 years older than your sister, then your sister is 67 years old.

When I was 10 my sister was half my age. Now I'm 47. How old is my sister?
If you were 10 years old and your sister was half your age, then your sister would have been 10 / 2 = 5 years old.
If you are now 47 years old, and your sister was half your age when you were 10, then she would be 47 - 10 = 37 years old


-- 25.01.2023, 02:41 --

Во второй задаче тоже ступил, но не настолько:
Цитата:
User: In 2015 my mother was double my age plus ten. In 2021 I was 26, how old was she in 2017?
ChatGPT: In 2015, my mother was 26 + 10 = <<26+10=36>>36 years old. In 2021, my mother was 26 + 10 + 6 = <<26+10+6=42>>42 years old. In 2017, my mother was 42 - 4 = <<42-4=38>>38 years old. Answer: 38.

Мой вариант:
Цитата:
In 2015 my mother was double my age plus 10. In 2021 I was 26. How old was she in 2017?
In 2015, if your mother was double your age plus 10, and in 2021 you were 26, we can set up an equation to find out your age in 2015:

2015 age + 6 = 26

2015 age = 20

Therefore, in 2017, you were 22 years old, and since your mother was double your age plus 10 in 2015, your mother's age in 2017 is (2 * 22) + 10 = 54 years old.

Ответ как у разумного, но невнимательного человека.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение25.01.2023, 14:19 


17/10/22
28
Перепроверил несколько вопросов, где ChatGPT раньше тупил - на некоторые из них сейчас ответил правильно. Интересно - это следствие общих улучшений чат-бота, адресной работы над ошибками, или просто случайность?

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение26.01.2023, 20:18 
Заслуженный участник


08/04/08
8543
MoonWatcher в сообщении #1578715 писал(а):
Перепроверил несколько вопросов, где ChatGPT раньше тупил - на некоторые из них сейчас ответил правильно. Интересно - это следствие общих улучшений чат-бота, адресной работы над ошибками, или просто случайность?

Вот тут я наслушал, что в ChatGPT поверх GPT-3 прикручен еще RL для улучшения ответов, он же помогает усваивать новую информацию. Можно так объяснить правильные ответы. Также поверх LM прикручен ранжировщик ответов, который легче основной модели и который вполне реально периодически обучать на фидбэке от пользователей.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение26.01.2023, 20:51 


17/10/22
28
Sonic86
Спасибо, послушаю. На этот канал подписан, но у меня было ощущение что он какой-то дилетантский.

Тем временем ChatGPT исправил очередной косяк. Я задавал ему задачу из той ссылки:
Цитата:
In 2015 my mother was double my age plus 10. In 2021 I was 26. How old was she in 2017?

Вот что он ответил сначала 1) в той ссылке, потом 2) мне на днях и наконец 3) сегодня:
1)
Цитата:
In 2015, my mother was 26 + 10 = <<26+10=36>>36 years old. In 2021, my mother was 26 + 10 + 6 = <<26+10+6=42>>42 years old. In 2017, my mother was 42 - 4 = <<42-4=38>>38 years old. Answer: 38.

2)
Цитата:
In 2015, if your mother was double your age plus 10, and in 2021 you were 26, we can set up an equation to find out your age in 2015:

2015 age + 6 = 26

2015 age = 20

Therefore, in 2017, you were 22 years old, and since your mother was double your age plus 10 in 2015, your mother's age in 2017 is (2 * 22) + 10 = 54 years old.

3)
Цитата:
In 2015, if you were half your age plus 10, then your mother was double your age plus 10. Therefore, in 2015, your age was (mother's age - 10) / 2.
Knowing you were 26 in 2021, you were 26-5=21 in 2016, so in 2015 you were 21-1=20 years old.

So in 2015, your mother was 20*2 + 10 = 50 years old.

Therefore, in 2017, your mother would be 50+2 = 52 years old.


На всякий случай открыл новый сеанс и перефразировал задачку:
Цитата:
In 2010 my dad was double my age plus 5. In 2020 I was 34. How old was he in 2013?
In 2010, your dad's age was double your age at that time plus 5. Since you were 34 in 2020, we know that in 2010, you were 34-10=24 years old. Therefore, in 2010, your dad's age was 2*24+5 = 53 years old.
In 2013, your dad's age would be 53+3 = 56 years old.

Красавчик, чо.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение26.01.2023, 22:11 


17/10/22
28
Еще одна работа над ошибками, но далеко не идеальная. В свое время задал ему возможно не слишком политкорректную :oops: задачку:

10% of gay people in USA are African Americans. 13% of African-Americans are gay. 21% of USA population is gay. What's the percentage of African-Americans in USA?

Тогда чат-бот наобум перемножил проценты и не угадал. В этот раз куда интереснее, но все равно тупит (к сожалению, не могу спрятать эту простыню под спойлер - его у форумного движка похоже нет):
Цитата:
We can use Bayes' theorem to solve this problem:

P(A|B) = P(B|A) * P(A) / P(B)

where:

P(A|B) is the probability of event A (being African-American) given that event B (being gay) has occurred.
P(B|A) is the probability of event B (being gay) given that event A (being African-American) has occurred.
P(A) is the probability of event A (being African-American) occurring.
P(B) is the probability of event B (being gay) occurring.
We know that:

P(B|A) = 13%,
P(A|B) = 10%,
P(B) = 21%
We need to calculate P(A)

P(A) = P(A and B) / P(B) = P(B|A)*P(A) / P(B)

P(A) = P(B|A) * P(A) / P(B) = 13% * P(A) / 21%

Solving for P(A) :

P(A) = 13% * P(A) / 21%

P(A) = 13 / 21 = 61.9 %

So the percentage of African-Americans in the US population is 61.9%


If P(A|B) = P(B|A) * P(A) / P(B), then P(A) = P(A|B) * P(B) / P(B|A), isn't it?

You are correct, I apologize for the confusion. P(A|B) = P(B|A) * P(A) / P(B) is Bayes' theorem which states the probability of A given B is equal to the probability of B given A times the probability of A, divided by the probability of B.

Another way to express the same equation is: P(A) = P(A|B) * P(B) / P(B|A) which is the probability of A equals the probability of A given B times the probability of B divided by the probability of B given A. So, to find the probability of A, we can use the given information P(A|B), P(B), and P(B|A)

So, in your case, to find the percentage of African-Americans in the US population:

P(A) = P(A|B) * P(B) / P(B|A) = 10% * 21% / 13% = 61.9 %

I apologize for any confusion caused by my previous response and thank you for pointing out the mistake.


You changed the formula, but got the same result. How come?

You are correct that I changed the formula and also got the same result, I apologize for any confusion caused.

In the first equation, Bayes' theorem states that the probability of A given B (P(A|B)) is equal to the probability of B given A (P(B|A)) times the probability of A (P(A)), divided by the probability of B (P(B)). In the second equation, I wrote that the probability of A (P(A)) is equal to the probability of A given B (P(A|B)) times the probability of B (P(B)), divided by the probability of B given A (P(B|A))

Both equations are mathematically equivalent and provide the same information. However, the information used to calculate the probability is different. When we use Bayes' theorem to calculate P(A|B) we use the information of P(A), P(B), and P(B|A). When we use the second equation, we use P(A|B), P(B), and P(B|A).

In this problem, we were given P(A|B) = 10%, P(B|A) = 13% and P(B) = 21%. Since, the formula and the information used is different but the result is same, it means that the information is consistent and the values used, in this case, are correct.

I apologize for any confusion caused by my previous response, and thank you for bringing this to my attention.


Do you really think P(A) = P(B|A) * P(A) / P(B) and P(A) = P(A|B) * P(B) / P(B|A) are mathematically equivalent?

I apologize, they are not mathematically equivalent. The first equation is Bayes' theorem, which relates the conditional probabilities of A and B: P(A|B) = P(B|A) * P(A) / P(B). The second equation, P(A) = P(A|B) * P(B) / P(B|A), is not a valid equation and it does not have any mathematical relationship with the Bayes' theorem.

My apologies for the mistake and any confusion it may have caused. Thank you for bringing this to my attention.


So what's the percentage of African-Americans in USA?

I apologize for the confusion caused by my previous responses. I had used incorrect equations and provided incorrect results.

To answer your question, "What's the percentage of African-Americans in USA?", I don't have current information that would allow me to give you a precise answer. The African American population represents around 13% of the total population in the United States according to the 2019 census. However, this information might have changed over time and it could be affected by different factors such as migration, birth and death rates, among others.


I mean my question above - assume given numbers are correct.

I apologize for any confusion. Assuming the given numbers are correct, the percentage of African-Americans in the US population can be calculated as follows:

P(A|B) = P(B|A) * P(A) / P(B)

where:

P(A|B) is the probability of event A (being African-American) given that event B (being gay) has occurred.
P(B|A) is the probability of event B (being gay) given that event A (being African-American) has occurred.
P(A) is the probability of event A (being African-American) occurring.
P(B) is the probability of event B (being gay) occurring.
Given that:

P(B|A) = 13%,
P(A|B) = 10%,
P(B) = 21%
P(A) = P(A|B) * P(B) / P(B|A) = 10% * 21% / 13% = approximately 15.4%

It means that 15.4% of the US population is African-American, assuming the given numbers are correct.


Isn't 10% * 21% / 13% = 16.1% ??

I apologize for the mistake, you are correct. The percentage of African-Americans in the US population is approximately 16.1%, calculated as follows:
10%21%/13% = 0.10.21/0.13 = 0.161 or 16.1%

My apologies for any confusion caused by my previous response, and thank you for bringing this to my attention.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 81 ]  На страницу Пред.  1, 2, 3, 4, 5, 6  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group