2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 8, 9, 10, 11, 12
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение17.04.2024, 16:06 


15/04/24

79
Это первый Ваш пост
Цитата:
Ну вот, оказывается, ребятам из Гугла пришло в голову обрубить затраты памяти


Это второй
Цитата:
Ребята в прямом соревновании с LLAMA2 на таком же количестве данных и памяти показали, что их моделька валидируется быстрее и точнее.


И в каких-то давних Ваших сообщениях я видел ребят из (транснациональной корпорации N).

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение17.04.2024, 17:31 
Заслуженный участник
Аватара пользователя


16/07/14
8828
Цюрих
MoonWatcher, стоит смотреть на ycombinator. В частности про эти две статьи там есть обсуждение. Общий вывод совпадает с моим первым впечатлением - ну да, сделали, но поводов считать каким-то прорывом пока не видно.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение17.04.2024, 21:07 


15/04/24

79
Рекурсия конечно удлиняет память ИИ, чем жёстко рубить окно памяти, лучше так. Что ИИ стал революционным сомнительно. RNN давно известны.

 Профиль  
                  
 
 Re: Решение математических задач с помощью ChatGPT
Сообщение19.06.2024, 00:36 


20/09/09
1973
Уфа
На arxiv.org появилась такая статья: Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B: A Technical Report. Вот ее абстракт:
Цитата:
This paper introduces the MCT Self-Refine (MCTSr) algorithm, an innovative integration of Large Language Models (LLMs) with Monte Carlo Tree Search (MCTS), designed to enhance performance in complex mathematical reasoning tasks. Addressing the challenges of accuracy and reliability in LLMs, particularly in strategic and mathematical reasoning, MCTSr leverages systematic exploration and heuristic self-refine mechanisms to improve decision-making frameworks within LLMs. The algorithm constructs a Monte Carlo search tree through iterative processes of Selection, self-refine, self-evaluation, and Backpropagation, utilizing an improved Upper Confidence Bound (UCB) formula to optimize the exploration-exploitation balance. Extensive experiments demonstrate MCTSr’s efficacy in solving Olympiad-level mathematical problems, significantly improving success rates across multiple datasets, including GSM8K, GSM Hard, MATH, and Olympiad-level benchmarks, including Math Odyssey, AIME, and Olympiad-Bench. The study advances the application of LLMs in complex reasoning tasks and sets a foundation for future AI integration, enhancing decision-making accuracy and reliability in LLM-driven applications. Codes publicly accessible at github.com/trotsky1997/MathBlackBox

Google-перевод:
Цитата:
В этом документе представлен алгоритм самоуточнения MCT (MCTSr), инновационная интеграция моделей большого языка (LLM) с поиском по дереву Монте-Карло (MCTS), предназначенный для повышения производительности при выполнении сложных математических задач. Решая проблемы точности и надежности в LLM, особенно в стратегических и математических рассуждениях, MCTSr использует систематические исследования и эвристические механизмы самосовершенствования для улучшения структуры принятия решений в LLM. Алгоритм строит дерево поиска Монте-Карло посредством итеративных процессов выбора, самоуточнения, самооценки и обратного распространения ошибки, используя улучшенную формулу верхней доверительной границы (UCB) для оптимизации баланса разведки и эксплуатации. Обширные эксперименты демонстрируют эффективность MCTSr в решении математических задач олимпиадного уровня, значительно повышая показатели успеха в нескольких наборах данных, включая GSM8K, GSM Hard, MATH, а также в тестах олимпиадного уровня, включая Math Odyssey, AIME и Olympiad-Bench. Исследование продвигает применение LLM в сложных логических задачах и закладывает основу для будущей интеграции искусственного интеллекта, повышая точность и надежность принятия решений в приложениях, основанных на LLM.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 169 ]  На страницу Пред.  1 ... 8, 9, 10, 11, 12

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group