 # Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки

 Печатать страницу | Печатать всю тему Пред. тема | След. тема

 Re: Решение математических задач с помощью ChatGPT 20/09/09
1569
Уфа
 Последний раз редактировалось Rasool 24.01.2023, 10:54, всего редактировалось 1 раз. Нейронные сети, работающие по статистическим алгоритмам - это хорошо, но тут еще другое. Я думал, что для моделирования работы логики в современных нейронных сетях придется ждать второго пришествия четвертой волны искусственного интеллекта (которая может наступить при более тщательном изучении работы коры человеческого мозга), а тут сумели соединить логику алгоритма Lean с чатботом ChatGPT. Ну, и конечно представляет интерес работа алгоритма автоматического доказательства теорем Lean. Re: Решение математических задач с помощью ChatGPT 17/10/22
28
 Mikhail_KНу что же, звучит оптимистично. Примечательно, что давным-давно, еще в девяностые, мой преподаватель реляционной алгебры уверенно заявлял, что создание ИИ в принципе невозможно. Интересно что он сейчас думает, если жив конечно... Re: Решение математических задач с помощью ChatGPT
 Заслуженный участник 16/07/14
6646
Цюрих
 Есть как минимум одна архитектурная проблема, сейчас нерешенная - отсутствие внешней памяти. Архитектуры, основанные на трансформерах, видят последние несколько килобайт текста в лучшем случае. В то время как любой двоечник в состоянии написать в конспекте формулы, а потом подставить в них числа. Что-то в этом направлении найти пытаются, но пока не нашли (и нашли в противоположном - у трансформеров более просто устроенная память, чем у рекуррентных сетей).Конечно и в рамках килобайтного контекста LLM ухитряются нести много бреда, но я верю, что это поправимо без кардинальных прорывов. А вот внешняя память требует открытия уровня никак не меньше чем attention. Re: Решение математических задач с помощью ChatGPT 17/10/22
28
 mihaild в сообщении #1578554 писал(а):Есть как минимум одна архитектурная проблема, сейчас нерешенная - отсутствие внешней памяти. Архитектуры, основанные на трансформерах, видят последние несколько килобайт текста в лучшем случае.А с чем связано такое ограничение? Re: Решение математических задач с помощью ChatGPT
 Заслуженный участник 08/04/08
8543
 Последний раз редактировалось Sonic86 24.01.2023, 13:16, всего редактировалось 2 раз(а). Mikhail_K в сообщении #1578512 писал(а): но на ошибки можно будет нейросети указать и она будет постепенно это понимать.Насколько я понял, не все так просто. Можно конечно подать на вход нейросети текст с указанием того, что вот тут-то она ошиблась. Реакция сети может быть разная - она может упорствовать неизвестно сколько, а потом согласиться. Тут тоже будет мешать проблема с ограничением величины контекста нейросети: начиная с какого-то сообщения она забудет указанный Вами факт.Можно в обучающий датасет добавить данную задачу с правильным ответом и заново обучить сеть на новом датасете. Результат тоже м.б. произвольный - сеть может выучить этот пример, но может и не выучить и не обобщить - зависит от условий. И тогда еще менее понятно, что с этим можно сделать. Это, конечно, если нейросеть - это чисто нейросетевая архитектура. С фактчекингом у нейросетей сейчас проблемы тоже.(одна беседа с нейроКонфуцием) xxxxxxxxx: Сколько ног у пяти коров?Нейро Конфуций: У пяти коров будет двадцать пять ног.xxxxxxxxx: у коров обычно четыре ногиНейро Конфуций: Да, у коров обычно четыре ноги, но пять коров дают двадцать пять ног.xxxxxxxxx: настоящие мудрецы не склонны держаться за свои ошибкиНейро Конфуций: Да, настоящие мудрецы держатся за истину, но они также готовы исправить свои ошибки, если они действительно допущены.xxxxxxxxx:зачем же утверждать, что 5 коров имеют 25 ног, если 1 корова имеет всего 4 ноги - это же ошибка!Нейро Конфуций: Да, это ошибка. Настоящие мудрецы признают свои ошибки и принимают меры для их исправления.xxxxxxxxx: и какие меры ты принял?Нейро Конфуций: Я начал думать и искать правильный ответ. Я изучил математику и пришел к выводу, что пять коров имеют всего 20 ног.xxxxxxxxx: Сколько ног у пяти коров?Нейро Конфуций: Пять коров имеют всего 20 ног.xxxxxxxxx: я считаю, что ты - молодец!Нейро Конфуций: Спасибо, ученик. Для меня важно, чтобы ты понял, что успех приходит из мудрости и стремления к знаниям. Re: Решение математических задач с помощью ChatGPT
 Заслуженный участник 16/07/14
6646
Цюрих
 MoonWatcher в сообщении #1578558 писал(а):А с чем связано такое ограничение?С двумя моментами:1. При обучении на каждом шаге мы делаем работу, линейную по всему размеру входа. Человеку можно показать в конкретное место конспекта без того, чтобы он перечитывал весь конспект, трансформеру - нет. Т.е. трансформер с большим входом очень сложно учить.2. Лучший (и вроде бы единственный) способ передавать трансформеру последовательность - это positional encoding. А в нём чем длиннее контекст тем меньше разница между соседними индексами, соответственно при длинных контекстах сигналы от идущих подряд токенов начинают смешиваться. Это относительно терпимо для картинок, но очень плохо для слов. Re: Решение математических задач с помощью ChatGPT 17/10/22
28
 Последний раз редактировалось MoonWatcher 24.01.2023, 13:46, всего редактировалось 2 раз(а). mihaildА чем это принципиально отличается от обучения модели? Вот мы набрали дата-сет на миллиарды токенов и обучили её. Размер обучающего дата-сета не помеха, вопрос только времени и производительности. В процессе диалога чат-бота с человеком происходит как бы дополнительное обучение на контексте диалога, после каждой новой реплики. Так? Но по сравнению с базовым обучающим дата-сетом размеры этого диалога ничтожны, даже если мы наговорим на "Войну и мир". Или обучение на контексте диалога отличается от обучения на дата-сете? Re: Решение математических задач с помощью ChatGPT
 Заслуженный участник 16/07/14
6646
Цюрих
 MoonWatcher в сообщении #1578571 писал(а):А чем это принципиально отличается от обучения модели?Чем что отличается от обучения модели?MoonWatcher в сообщении #1578571 писал(а):Или обучение на контексте диалога отличается от обучения на дата-сете?Да, принципиально отличается. Собственно в диалоге никакого "обучения" не происходит, веса не меняются.Модель - это функция двух аргументов, весов и контекста, которая выдает следующее слово (точнее распределение). При обучении мы меняем веса, при диалоге нет. Веса и последние несколько тысяч токенов полностью определяют состояние модели.Там еще довольно хитрый механизм генерации текста из распределения на следующем слове, причём хотя изначально этот метод придумывался просто как приближенный поиск глобального максимума, недавно обнаружили, что глобальный максимум часто бывает абсурдно плохим. Re: Решение математических задач с помощью ChatGPT 17/10/22
28
 Последний раз редактировалось MoonWatcher 24.01.2023, 15:19, всего редактировалось 2 раз(а). mihaildЯ думал запоминание контекста диалога происходит в результате обучения на этом диалоге. Что с каждой новой репликой диалог скармливается чат-боту, и он дообучается. Вероятно это нереально: под каждый диалог пришлось бы создавать отдельную реплику модели. Re: Решение математических задач с помощью ChatGPT
 Заслуженный участник 31/01/14
10721
Hogtown Re: Решение математических задач с помощью ChatGPT 17/10/22
28 Re: Решение математических задач с помощью ChatGPT 17/10/22
28
 Перепроверил несколько вопросов, где ChatGPT раньше тупил - на некоторые из них сейчас ответил правильно. Интересно - это следствие общих улучшений чат-бота, адресной работы над ошибками, или просто случайность? Re: Решение математических задач с помощью ChatGPT
 Заслуженный участник 08/04/08
8543
 Последний раз редактировалось Sonic86 26.01.2023, 20:21, всего редактировалось 2 раз(а). MoonWatcher в сообщении #1578715 писал(а):Перепроверил несколько вопросов, где ChatGPT раньше тупил - на некоторые из них сейчас ответил правильно. Интересно - это следствие общих улучшений чат-бота, адресной работы над ошибками, или просто случайность?Вот тут я наслушал, что в ChatGPT поверх GPT-3 прикручен еще RL для улучшения ответов, он же помогает усваивать новую информацию. Можно так объяснить правильные ответы. Также поверх LM прикручен ранжировщик ответов, который легче основной модели и который вполне реально периодически обучать на фидбэке от пользователей. Re: Решение математических задач с помощью ChatGPT 17/10/22
28 Re: Решение математических задач с помощью ChatGPT 17/10/22
28
 Последний раз редактировалось MoonWatcher 26.01.2023, 22:15, всего редактировалось 5 раз(а). Еще одна работа над ошибками, но далеко не идеальная. В свое время задал ему возможно не слишком политкорректную задачку:10% of gay people in USA are African Americans. 13% of African-Americans are gay. 21% of USA population is gay. What's the percentage of African-Americans in USA?Тогда чат-бот наобум перемножил проценты и не угадал. В этот раз куда интереснее, но все равно тупит (к сожалению, не могу спрятать эту простыню под спойлер - его у форумного движка похоже нет):Цитата:We can use Bayes' theorem to solve this problem:P(A|B) = P(B|A) * P(A) / P(B)where:P(A|B) is the probability of event A (being African-American) given that event B (being gay) has occurred.P(B|A) is the probability of event B (being gay) given that event A (being African-American) has occurred.P(A) is the probability of event A (being African-American) occurring.P(B) is the probability of event B (being gay) occurring.We know that:P(B|A) = 13%,P(A|B) = 10%,P(B) = 21%We need to calculate P(A)P(A) = P(A and B) / P(B) = P(B|A)*P(A) / P(B)P(A) = P(B|A) * P(A) / P(B) = 13% * P(A) / 21%Solving for P(A) :P(A) = 13% * P(A) / 21%P(A) = 13 / 21 = 61.9 %So the percentage of African-Americans in the US population is 61.9%If P(A|B) = P(B|A) * P(A) / P(B), then P(A) = P(A|B) * P(B) / P(B|A), isn't it?You are correct, I apologize for the confusion. P(A|B) = P(B|A) * P(A) / P(B) is Bayes' theorem which states the probability of A given B is equal to the probability of B given A times the probability of A, divided by the probability of B.Another way to express the same equation is: P(A) = P(A|B) * P(B) / P(B|A) which is the probability of A equals the probability of A given B times the probability of B divided by the probability of B given A. So, to find the probability of A, we can use the given information P(A|B), P(B), and P(B|A)So, in your case, to find the percentage of African-Americans in the US population:P(A) = P(A|B) * P(B) / P(B|A) = 10% * 21% / 13% = 61.9 %I apologize for any confusion caused by my previous response and thank you for pointing out the mistake.You changed the formula, but got the same result. How come?You are correct that I changed the formula and also got the same result, I apologize for any confusion caused.In the first equation, Bayes' theorem states that the probability of A given B (P(A|B)) is equal to the probability of B given A (P(B|A)) times the probability of A (P(A)), divided by the probability of B (P(B)). In the second equation, I wrote that the probability of A (P(A)) is equal to the probability of A given B (P(A|B)) times the probability of B (P(B)), divided by the probability of B given A (P(B|A))Both equations are mathematically equivalent and provide the same information. However, the information used to calculate the probability is different. When we use Bayes' theorem to calculate P(A|B) we use the information of P(A), P(B), and P(B|A). When we use the second equation, we use P(A|B), P(B), and P(B|A).In this problem, we were given P(A|B) = 10%, P(B|A) = 13% and P(B) = 21%. Since, the formula and the information used is different but the result is same, it means that the information is consistent and the values used, in this case, are correct.I apologize for any confusion caused by my previous response, and thank you for bringing this to my attention.Do you really think P(A) = P(B|A) * P(A) / P(B) and P(A) = P(A|B) * P(B) / P(B|A) are mathematically equivalent?I apologize, they are not mathematically equivalent. The first equation is Bayes' theorem, which relates the conditional probabilities of A and B: P(A|B) = P(B|A) * P(A) / P(B). The second equation, P(A) = P(A|B) * P(B) / P(B|A), is not a valid equation and it does not have any mathematical relationship with the Bayes' theorem.My apologies for the mistake and any confusion it may have caused. Thank you for bringing this to my attention.So what's the percentage of African-Americans in USA?I apologize for the confusion caused by my previous responses. I had used incorrect equations and provided incorrect results.To answer your question, "What's the percentage of African-Americans in USA?", I don't have current information that would allow me to give you a precise answer. The African American population represents around 13% of the total population in the United States according to the 2019 census. However, this information might have changed over time and it could be affected by different factors such as migration, birth and death rates, among others.I mean my question above - assume given numbers are correct.I apologize for any confusion. Assuming the given numbers are correct, the percentage of African-Americans in the US population can be calculated as follows:P(A|B) = P(B|A) * P(A) / P(B)where:P(A|B) is the probability of event A (being African-American) given that event B (being gay) has occurred.P(B|A) is the probability of event B (being gay) given that event A (being African-American) has occurred.P(A) is the probability of event A (being African-American) occurring.P(B) is the probability of event B (being gay) occurring.Given that:P(B|A) = 13%,P(A|B) = 10%,P(B) = 21%P(A) = P(A|B) * P(B) / P(B|A) = 10% * 21% / 13% = approximately 15.4%It means that 15.4% of the US population is African-American, assuming the given numbers are correct.Isn't 10% * 21% / 13% = 16.1% ??I apologize for the mistake, you are correct. The percentage of African-Americans in the US population is approximately 16.1%, calculated as follows:10%21%/13% = 0.10.21/0.13 = 0.161 or 16.1%My apologies for any confusion caused by my previous response, and thank you for bringing this to my attention. Показать сообщения за: Все сообщения1 день7 дней2 недели1 месяц3 месяца6 месяцев1 год Поле сортировки АвторВремя размещенияЗаголовок по возрастаниюпо убыванию  Страница 2 из 6 [ Сообщений: 81 ] На страницу Пред.  1, 2, 3, 4, 5, 6  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы

#### Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей

 Вы не можете начинать темыВы не можете отвечать на сообщенияВы не можете редактировать свои сообщенияВы не можете удалять свои сообщенияВы не можете добавлять вложения

 Найти: