fixfix
2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 16, 17, 18, 19, 20  След.
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение06.04.2025, 16:09 


23/02/12
3449
Anton_Peplov в сообщении #1681276 писал(а):
Combat Zone в сообщении #1681273 писал(а):
По моему опыту, DeepSeek на диво устойчив относительно обучения.
А он вообще обучается на запросах пользователя? Я думаю, что нет. Правда, про DeepSeek не знаю,
Я уже довольно много работаю с DeepSeek. В пределах одной темы он обучается. Но в другой теме он об этом не помнит. Я перекачиваю нужный материал из одной темы в другую для продолжения.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение06.04.2025, 19:36 


12/07/15
3517
г. Чехов
Anton_Peplov в сообщении #1681276 писал(а):
Человек непрерывно обучается на любой поступающей информации. У искусственных нейросетей, вообще говоря, не так. Есть обучение (подбор синаптических весов), а есть использование (обработка запросов при фиксированных синаптических весах). Это разные режимы работы. Вы можете в своих запросах прочесть нейросети полный курс матана, но она будет знать о матане столько же, сколько знала в момент релиза, и ни битом больше.

Объясню, почему LLM не обучаются на ходу. Во-первых, они уже переработали пентабайты данных, а вот эти текущие данные - это мизер, во-вторых, обучение на лету требует дополнительных вычислительных ресурсов, в третьих, качество новых данных неконтролируемо (потенциально опасно снижением интеллекта).
Но я думаю, эти все проблемы решаемы и в будущем конкуренция дойдёт до такой степени, что их будет выгодно решить.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение06.04.2025, 21:37 
Заслуженный участник
Аватара пользователя


31/01/14
11497
Hogtown
Reports of LLMs mastering math have been greatly exaggerated

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение06.04.2025, 22:03 
Аватара пользователя


17/10/22
401
Даже я, простой обыватель, в тот же день как вышли результаты узнал, что Gemini 2.5 Pro в USAMO 2025 набрала 24%. А Маркус не удосужился уточнить свежие результаты хотя бы перед публикацией.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение06.04.2025, 23:03 
Заслуженный участник
Аватара пользователя


20/08/14
8908
vicvolf в сообщении #1681311 писал(а):
В пределах одной темы он обучается.
Нет, не обучается. Просто получает в качестве вводной весь предыдущий тред. Синаптические веса не меняются, сеть не усваивает новую информацию. Об этом ясно сказали выше.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение06.04.2025, 23:11 


05/09/16
12409
Red_Herring в сообщении #1681345 писал(а):
Reports of LLMs mastering math have been greatly exaggerated

Вот кстати очень точно подмечено, что проблема в том, что эти LLM не могут "увидеть" (ну или "понять"), что вывод неверный, решение ошибочно. Они "уверены" (если так можно сказать) что задача решена. Вплоть до того, что при решении уравнения "как-бы" подставляют вычисленный корень в уравнение и получают что он корень, хотя он вовсе не корень. А юзеры верят -- написано же что вот подставляем, смотрите, получился ноль. То есть способности к "рассуждению" LLM не имеют.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение07.04.2025, 04:17 
Аватара пользователя


29/04/13
8885
Богородский
wrest в сообщении #1681352 писал(а):
А юзеры верят -- написано же что вот подставляем, смотрите, получился ноль.

А откуда известно, что они верят? Им что лень проверить? Скопипастить строчку и в калькулятор, в более сложных случаях — в Альфу.

Если людям настолько лень вдруг стало, то это очень плохой знак: несмотря на регулярное враньё LLM, людям всё равно настолько хочется им верить, что даже простейшие вещи не делают.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение07.04.2025, 05:43 
Аватара пользователя


29/04/13
8885
Богородский
wrest в сообщении #1681270 писал(а):
Завожу новый диалог и прошу только вычислить,
Цитата:
вычисли $(0.0617235993853495)^3 + (0.0617235993853495)^2 - 0.0617235993853495 - 1/9$

после долгих рассуждений и вычисьения слагаемых по отдельности, затем их суммирования, получаю ответ

$\[
\boxed{-0.168789786774}
\]
$

Альфа и с этим не согласна. Сравним равное количество знаков:

Код:
-0.168789786774
-0.168789753038

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение07.04.2025, 18:21 


23/02/12
3449
Anton_Peplov в сообщении #1681351 писал(а):
vicvolf в сообщении #1681311 писал(а):
В пределах одной темы он обучается.
Нет, не обучается.
Смотря, что понимать под обучением. Я могу присоединить в теме книги или статьи и ИИ использует их в дальнейшем обсуждении. Это же процесс получения новых знаний, т.е. обучение. Другое дело, что это только в пределах темы. Общая база знаний этого ИИ обновлялась в сентябре 2023 года.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение07.04.2025, 19:07 
Заслуженный участник
Аватара пользователя


16/07/14
9579
Цюрих
vicvolf в сообщении #1681408 писал(а):
Смотря, что понимать под обучением
Изменение весов сети. В контексте LLM (и вообще нейронок) это стандартный термин.
(Правда есть еще one/few-shot learning, который таким обучением не является, но это как морская свинка)

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение08.04.2025, 02:08 
Заслуженный участник


20/04/10
1993
https://dxdy.ru/post1681436.html#p1681436 Судя по всему, ИИ действительно может решать задачи. Как минимум, подбрасывать правильные мысли, если вопрос где-нибудь ранее обсуждался. Интересно, что он способен находить аналогичные проблемы, хотя сформулированы они могут быть не очень похоже. Как-то неуютненько)

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение08.04.2025, 17:45 


23/02/12
3449
lel0lel в сообщении #1681438 писал(а):
ИИ действительно может решать задачи.
Я ранее писал, что Deep Seek, по-моему опыту, решает задачи на уровне научного работника (аспиранта или выше) и недооценивать его нельзя. Однако, также как человек, он может ошибаться, поэтому надо проверять.
mihaild в сообщении #1681412 писал(а):
vicvolf в сообщении #1681408 писал(а):
Смотря, что понимать под обучением
Изменение весов сети. В контексте LLM (и вообще нейронок) это стандартный термин.
Спасибо, почитал. Мне удобнее сравнивать способности ИИ с человеком, в том числе способность к обучению.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение09.04.2025, 03:30 
Заслуженный участник


20/04/10
1993
vicvolf в сообщении #1681507 писал(а):
Я ранее писал, что Deep Seek, по-моему опыту, решает задачи на уровне научного работника (аспиранта или выше)
В моём понимании, научный работник или аспирант занимается чем-то существенно новым, что до сих пор неизвестно (в реальности, это не всегда так). Поэтому, корректнее говорить о способности ИИ к быстрому анализу проблем, которые уже рассматривались ранее, и о способности правильно "понимать" вольное описание проблемы. На данный момент, это может облегчить поиск решения исследователю.
vicvolf в сообщении #1681507 писал(а):
недооценивать его нельзя
Согласен.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение09.04.2025, 10:07 


23/02/12
3449
lel0lel в сообщении #1681540 писал(а):
В моём понимании, научный работник или аспирант занимается чем-то существенно новым, что до сих пор неизвестно (в реальности, это не всегда так).
DeepSeek способен доказать новое утверждение, опираясь на уже известные.

 Профиль  
                  
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение09.04.2025, 10:28 


27/08/16
11556
vicvolf в сообщении #1681507 писал(а):
Я ранее писал, что Deep Seek, по-моему опыту, решает задачи на уровне научного работника (аспиранта или выше) и недооценивать его нельзя. Однако, также как человек, он может ошибаться, поэтому надо проверять.
А вы не пробовали в случае обнаружения ошибки запустить его снова на его же выдачу с просьбой найти ошибки?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 296 ]  На страницу Пред.  1 ... 16, 17, 18, 19, 20  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group