Проверка способности ChatGPT решать математические задачи

Larrot · 01.02.2023, 17:01

Цитата:

An airplane flies 190 miles with the wind in the same time it takes to fly 160 miles against the wind. The speed of the wind is 30 miles per hour How fast would the plane fly in still air?

Цитата:

Let's call the speed of the plane in still air "V".

When the plane flies with the wind, it covers 190 miles in the same time it takes to cover 160 miles against the wind, so the effective speed of the plane is (190 + 160) / 2 = 175 miles per hour.

Since the speed of the wind is 30 mph, the plane's speed relative to the ground when it is flying with the wind is 175 - 30 = 145 mph. And when it's flying against the wind, it's 175 + 30 = 205 mph.

So, we can set up two equations to solve for the speed of the plane in still air:

V + 30 = 205
V - 30 = 145

Solving for V:

V = (205 + 145) / 2 = 175 mph

So, the speed of the plane in still air is 175 mph.

Rasool · 04.02.2023, 13:00

Интересно, сейчас уже нейронные сети не начинают делать технических изобретений, которые можно зарегистрировать в реестре изобретений? Когда я учился в институте, нам говорили, что для того, чтобы сделать изобретение, достаточно взять одно авторское свидетельство, наложить на него другое авторское свидетельство, посмотреть на просвет и написать заявку на третье авторское свидетельство.

mustitz · 05.02.2023, 13:03

Ну... AlphaZero и Alpha Go Sedol это не чистый успех нейросетей. Всё-таки по числу рассматриваемых вариантов эти программы на порядки превосходят возможности человека. Сколько игрок просмотрит ходов за секунду? Два-три-пять? Это не считая времени, которое тратится на изучение особеностей позиции, выбор планов, ... Даже с нейросетью программа просмотрит десятки тысяч. Так что моя точка зрения, что человек сильнее в оценке одной позиции, программа уже намного сильнее с учётом количества рассматриваемых вариантов.

Так что я ожидаю следующий шаг больше в формализации всего и вся, например, средствами CoQ. Тут надо смотреть, насколько нейросеть сможет с этим справиться, но всё равно первый шаг должен быть за человеком, ибо надо наработать обучающий набор. Уже сейчас при работе в GPT я чувствую нехватку формальной проверки советов. Иногда нейросеть додумывает аргументы командной строки, которых не существует. Так что я ожидаю такие шаги: (1) формализация вопроса, (2) поиск решения, (3) проверка, (4) доказательство правильности, (5) вывод или уточнение поиска.

Ende · 08.02.2023, 13:09

i	Выделена тема «Ограничения формальных систем, описывающих внешний мир»

druggist · 08.02.2023, 21:45

Larrot в сообщении #1579742 писал(а):

Цитата:

Не понял, это ChatGPT выдал в качестве ответа?

Mikhail_K · 08.02.2023, 21:53

druggist в сообщении #1580838 писал(а):

Не понял, это ChatGPT выдал в качестве ответа?

Ну конечно. Вы к этому "решению" присмотритесь внимательнее.

MoonWatcher · 13.02.2023, 13:03

В MIT интересно придумали - как я понял, там научили модель решать задачи (несколько курсов по математике MIT и один курс Колумбийского университета) посредством предварительного написания программы решения. Для этого они воспользовались Codex, который в свою очередь создан на базе GPT-3.

MoonWatcher · 14.03.2023, 23:50

mihaild в сообщении #1578554 писал(а):

Есть как минимум одна архитектурная проблема, сейчас нерешенная - отсутствие внешней памяти. Архитектуры, основанные на трансформерах, видят последние несколько килобайт текста в лучшем случае. В то время как любой двоечник в состоянии написать в конспекте формулы, а потом подставить в них числа. Что-то в этом направлении найти пытаются, но пока не нашли (и нашли в противоположном - у трансформеров более просто устроенная память, чем у рекуррентных сетей).

Конечно и в рамках килобайтного контекста LLM ухитряются нести много бреда, но я верю, что это поправимо без кардинальных прорывов. А вот внешняя память требует открытия уровня никак не меньше чем attention.

Из сегодняшнего анонса: gpt-4 has a context length of 8,192 tokens. We are also providing limited access to our 32,768–context (about 50 pages of text) version

ozheredov · 15.03.2023, 11:49

Larrot в сообщении #1579742 писал(а):

An airplane flies

В вычисления есессно не вникал, но:

Larrot в сообщении #1579742 писал(а):

Let's call the speed of the plane in still air "V".

Эта штука понимает, как рассуждать (начинать с обозначений).

Larrot в сообщении #1579742 писал(а):

plane's speed relative to the ground

Верно ли: чтобы зацепиться за скорость относительно земли, надо построить некую "картину происходящего" у себя в "башке" (нечто типа воображения, которым, как считается, по определению не может быть наделена машина?)

mihaild · 15.03.2023, 12:27

MoonWatcher в сообщении #1585453 писал(а):

We are also providing limited access to our 32,768–context (about 50 pages of text) version

Это всё еще "несколько килобайт" (50 страниц - 90 килобайт). Еще чуть-чуть можно залить железом, но квадратичная сложность довольно быстро догонит.

MoonWatcher · 15.03.2023, 12:56

mihaild
Я бы сказал несколько десятков килобайт. Вы думаете 32k токенов это потолок?

mihaild · 15.03.2023, 13:01

Я побоюсь делать точные прогнозы, вполне возможно (субъективная вероятность 50%) что в ближайшие пару лет смогут на той же архитектуре сделать в 5 раз больше. Я считаю маловероятным (субъективная вероятность 90%) что в ближайшие 10 лет смогут на той же архитектуре сделать в 100 раз больше.
(self-attention, скорее всего, невозможно считать быстрее чем за квадрат)

MoonWatcher · 15.03.2023, 13:50

mihaild
Спасибо, почитаю.

MoonWatcher · 27.03.2023, 20:26

Снова к вопросу о предельных размерах запроса - с одного Телеграм-канала:

Цитата:

Вы думали, что 260 000 токенов это что-то невозможное для этэншна? А вот и нет, оказывается, если приделать approximate KNN (https://towardsdatascience.com/comprehe ... 94f057d6b6) внутрь механизма внимания и складировать Keys и Values в отдельном буфере, то можно засунуть в GPT целые книги!

Авторы показывают, что такое внимание помогает модели вспоминать сложные теоремы и леммы, которые были описаны десятки страниц назад! А самое крутое — это можно приделать к любому предобученному трансформеру, нужно лишь немного потюнить его на длинных текстах, что не очень сложно, так как градиенты через память не идут.

А вот непосредственно из публикации (ссылка):

Цитата:

Language models typically need to be trained or finetuned in order to acquire new knowledge, which involves updating their weights. We instead envision language models that can simply read and memorize new data at inference time, thus acquiring new knowledge immediately. In this work, we extend language models with the ability to memorize the internal representations of past inputs. We demonstrate that an approximate kNN lookup into a non-differentiable memory of recent (key, value) pairs improves language modeling across various benchmarks and tasks, including generic webtext (C4), math papers (arXiv), books (PG-19), code (Github), as well as formal theorems (Isabelle). We show that the performance steadily improves when we increase the size of memory up to 262K tokens. On benchmarks including code and mathematics, we find that the model is capable of making use of newly defined functions and theorems during test time.

mihaild · 27.03.2023, 21:04

А это уже другая архитектура:) И она не позволяет, глядя на конец документа, понять, что в начале надо было думать как-то иначе, или учиться "выписывать на бумажку" какие-то этапы из начала, чтобы потом к ним вернуться. Посмотрим, конечно, что получится, но я не уверен, что без большого градиента будет что-то интересное. Хотя то, что маленький контекст с памятью обгоняет большой контекст без памяти дает некоторую надежду.
Интересно было бы посмотреть, как ведет себя качество в зависимости от размера контекста при условии $\text{context} + \text{memory} = \text{const}$ .

Научный форум dxdy

Проверка способности ChatGPT решать математические задачи