2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1 ... 23, 24, 25, 26, 27  След.
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 16:33 
Сейчас сделал еще одну попытку, и deepseek выдал откровенную чушь. Как-то все очень не стабильно.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 16:40 
Аватара пользователя
ozheredov в сообщении #1707827 писал(а):
воспроизведение длинного готового паттерна из обучающей базы
В точности той последовательности токенов в обучающей выборке почти наверняка не было. Любая пара почти наверняка была. Где граница между "решением" и "воспроизведением паттерна"?

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 17:01 
mihaild в сообщении #1707831 писал(а):
Где граница между "решением" и "воспроизведением паттерна"?


Я бы придумал (желательно трехзначные и не целые) коэффициенты, при которых уравнение имеет целые решения, и скормил новое уравнение нейронке. Исходя из логики, что $x^3 + y^4 = xy^5$ скорее всего где-то решали (просто Гугол не считает нужным выдавать этот ресурс на первых -дцати страницах), а вот $148x^3 + 42.7y^4 = xy^5$ - нет.

Как теоретически строго отделить честную аппроксимацию от поиска "ближайшего соседа" для столь сложных моделей, у меня идей нет. Но уж коли мы признаём в нейронке человека (а по голосу nnosipov я это чувствую :-) ), то и обученность проверять надо так же, как обученность человека. А именно, на экзамене надо продемонстрировать возможность решать задачи, которые не встречались при обучении

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 17:19 
ozheredov в сообщении #1707836 писал(а):
Я бы придумал (желательно трехзначные и не целые) коэффициенты, при которых уравнение имеет целые решения, и скормил новое уравнение нейронке.
Это я давно уже проделал с deepseek: результат так себе. Вот конкретный пример: решить уравнение $x(y^2-2x^2)+x+y+239=0$ в целых числах. Еще не было случая, чтобы были найдены все решения (не говоря уже о том, чтобы доказать отсутствие других).

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 19:08 
Аватара пользователя
nnosipov в сообщении #1707825 писал(а):
К сожалению, не могу посмотреть то, что на картинках (не прогружаются).
Вот текст ответа (ChatGPT-5 Thinking Mini):

(Оффтоп)

Рассмотрим уравнение
$$
x^4+y^2=xy^2+y.
$$
Перенесём и разложим правую часть:
$$
x^4 = y\big((x-1)y+1\big).
$$
Отсюда замечаем два важных факта:

1) $\gcd\big(y,(x-1)y+1\big)=1$, так как любое общее делитель делит разность $((x-1)y+1)-(x-1)\cdot y=1$.

2) Произведение двух взаимно простых положительных целых чисел равно четвёртой степени $x^4$.

По уникальности разложения на простые множители это возможно тогда и только тогда, когда каждый из множителей сам является четвёртой степенью. Следовательно существуют натуральные $A,B$ такие, что
$$
y=A^4,\qquad (x-1)y+1=B^4,\qquad x=AB.
$$
Подставляя $y=A^4$ и $x=AB$ во второе равенство, получаем
$$
(AB-1)A^4+1=B^4 \eqno(1)
$$
что эквивалентно
$$
B\big(A^5-B^3\big)=A^4-1. \eqno(1')
$$

Теперь решаем уравнение в натуральных $A,B$.

Проверка малых $A$.

$A=1$. Тогда $y=1$. Из $(AB-1)A^4+1=B^4$ получаем $B^4=1$, следовательно $B=1$ и $x=AB=1$. Это даёт решение $(x,y)=(1,1)$.

$A=2$. Тогда $y=2^4=16$. Подстановка даёт
$$
    (2B-1)\cdot 16+1=B^4 \quad\Longrightarrow\quad B^4-32B+15=0.
    $$
Подбором получаем корень $B=3$ (проверка: $3^4-32\cdot3+15=81-96+15=0$), значит $B=3$ и $x=AB=6$. Это даёт решение $(x,y)=(6,16)$.

Остаётся исключить возможность существования решений при $A\ge3$.

Исключение случая $A\ge3$.

Из уравнения (1') правая часть положительна, поэтому
$$
A^5-B^3>0 \quad\Longrightarrow\quad B^3<A^5 \quad\Longrightarrow\quad B< A^{5/3}. \eqno(2)
$$

Покажем сначала, что для $A\ge3$ верно $B>A$. Из
$$
B^4=(AB-1)A^4+1 \ge (A\cdot 1 -1)A^4+1=(A-1)A^4+1=A^5-A^4+1
$$
получаем при $A\ge3$ число $B^4>A^4$, следовательно $B>A$. Итак
$$
B\ge A+1 \qquad\text{для }A\ge3. \eqno(3)
$$

Выразим разность:
$$
A^5-B^3=\frac{A^4-1}{B}.
$$
С учётом $B\ge A+1$ получаем верхнюю оценку
$$
0< A^5-B^3 =\frac{A^4-1}{B} \le \frac{A^4-1}{A+1} < \frac{A^4}{A+1} < A^3.
$$
Итак для $A\ge3$
$$
0< A^5-B^3 < A^3. \eqno(4)
$$
Преобразуя, приходим к неравенству
$$
A^5 - A^3 < B^3 < A^5. \eqno(5)
$$

То есть требуется, чтобы целый куб $B^3$ лежал строго внутри интервала $(A^5-A^3,\;A^5)$.
Покажем, что это невозможно при $A\ge3$.

Положим $t:=A^{5/3}$. Тогда $t^3=A^5$. Обозначим $m=\lfloor t\rfloor$. Так как $B^3<A^5=t^3$, то $B\le m$ и $m$ — наибольший целый, чей куб меньше либо равен $A^5$.
Оценим разность между $A^5$ и предыдущим кубом $m^3$. Заметим, что $m\ge t-1$, поэтому
$$
A^5-m^3 \ge A^5-(t-1)^3 = t^3-(t-1)^3 = 3t^2-3t+1.
$$
Подставляя $t=A^{5/3}$, получаем
$$
A^5-m^3 \ge 3A^{10/3}-3A^{5/3}+1.
$$
Сравним это с $A^3$. Для $A\ge3$ имеем
$$
3A^{10/3}-3A^{5/3}+1 > A^3,
$$
поскольку после деления на $A^3$ левая часть становится
$$
3A^{1/3}-3A^{-4/3}+A^{-3},
$$
а при $A\ge3$ эта величина существенно больше $1$ (в частности $3\cdot 3^{1/3}\approx 4.326>1$, вычитаемые дробные слагаемые малы). Следовательно
$$
A^5-m^3 > A^3.
$$
Это означает, что наибольший целый куб, меньший $A^5$, уже строго меньше $A^5-A^3$. То есть
$$
m^3 < A^5 - A^3.
$$
Отсюда следует, что никакой целый куб не может лежать в интервале $(A^5-A^3,\;A^5)$, что противоречит неравенству (5). Следовательно {\bf для $A\ge3$ решений не существует}.

Вывод.

Единственные допустимые значения $A$$1$ и $2$, которые дают пары
$$
A=1:\quad (x,y)=(1,1);
\qquad
A=2:\quad (x,y)=(6,16).
$$
Проверка:
$$
1^4+1^2=1+1=2,\quad 1\cdot1^2+1=1+1=2;
$$
$$
6^4+16^2=1296+256=1552,\quad 6\cdot256+16=1536+16=1552.
$$

Таким образом все натуральные решения исходного уравнения:
$$
\boxed{(x,y)=(1,1)\ \text{и}\ (x,y)=(6,16).}
$$

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 19:16 
Аватара пользователя
Gemini 2.5 Pro Thinking. Что-то находит, рассуждение имеет вид "где-то доказано что у чего-то [я не уверен, что имеющего какое-то отношение к делу] конечное число решений, значит два найденных решения - единственные".

(Оффтоп)

We want to find all natural number (positive integer) solutions to the equation $x^4+y^2=xy^2+y$.
Rearrange the equation:
We rearrange the terms:
$x^4-y = xy^2-y^2$
$x^4-y = y^2(x-1)$
Analyze the case x = 1:
If $x=1$, the equation becomes $1-y = y^2(0)$, so $1-y=0$, which gives $y=1$.
Thus, $(x, y) = (1, 1)$ is a solution.
Analyze the case x > 1:
We rewrite the equation as:
$x^4 = y^2(x-1)+y$
$x^4 = y(y(x-1)+1)$
Let $A=y$ and $B=y(x-1)+1$. Then $AB=x^4$.
We calculate the greatest common divisor of A and B:
$gcd(A, B) = gcd(y, y(x-1)+1) = gcd(y, 1) = 1$.
Since A and B are coprime and their product is a fourth power ($x^4$), both A and B must be fourth powers themselves.
Let $A=u^4$ and $B=v^4$, where $u, v$ are positive integers and $gcd(u, v)=1$.
Then $y=u^4$ and $x=uv$.
Derive a new Diophantine equation:
We substitute these back into the relationship between A and B:
$B = A(x-1)+1$
$v^4 = u^4(uv-1)+1$
$v^4 = u^5v-u^4+1$
$v^4-u^5v+u^4-1=0$.
We look for positive integer solutions $(u, v)$ to this equation. Since $x>1$, we are looking for solutions other than $(u,v)=(1,1)$. Thus we consider $u\ge 2$.
Analyze the new equation for u ≥ 2:
We analyze the polynomial $P_u(v) = v^4-u^5v+u^4-1$. We look for its positive integer roots.
We analyze the location of the positive roots. Let's evaluate $P_u(v)$ at $v=u^{5/3}$.
$P_u(u^{5/3}) = (u^{5/3})^4-u^5(u^{5/3})+u^4-1 = u^{20/3}-u^{20/3}+u^4-1 = u^4-1$.
Since $u\ge 2$, $P_u(u^{5/3})>0$.
Let's evaluate $P_u(v)$ at $v=u^{5/3}-1$.
$P_u(u^{5/3}-1) = (u^{5/3}-1)^4 - u^5(u^{5/3}-1) + u^4-1$.
Expanding this expression yields:
$P_u(u^{5/3}-1) = -3u^5 + 6u^{10/3} + u^4 - 4u^{5/3}$.
We analyze the sign of this expression. Let $Q(u) = 3u^5 - (6u^{10/3} + u^4 - 4u^{5/3})$.
It can be shown that $Q(u)>0$ for all $u\ge 2$. (This involves analyzing the function $g(u) = Q(u)/3u^5$; $g(u)$ is increasing for $u\ge 2$ and $g(2)>0$).
Thus, $P_u(u^{5/3}-1)<0$ for all $u\ge 2$.
Since $P_u(u^{5/3}-1)<0$ and $P_u(u^{5/3})>0$, the polynomial $P_u(v)$ has a root $v_2$ that lies strictly between $u^{5/3}-1$ and $u^{5/3}$.
$u^{5/3}-1 < v_2 < u^{5/3}$.
Implications for integer solutions:
The interval $(u^{5/3}-1, u^{5/3})$ has length 1, so it contains at most one integer.
Case 1: $u$ is a perfect cube. Let $u=m^3$ ($m\ge 2$).
Then $u^{5/3}=m^5$ is an integer. The root $v_2$ lies strictly between $m^5-1$ and $m^5$. Thus $v_2$ cannot be an integer. There are no solutions in this case.
Case 2: $u$ is not a perfect cube. $u^{5/3}$ is irrational.
The unique integer in the interval is $k=\lfloor u^{5/3} \rfloor$.
If there is an integer solution $v$, it must be $v=k$.
Let's check the first few values of $u$.
If $u=2$. $2^{5/3} \approx 3.1748$. $k=3$.
We check $v=3$: $P_2(3) = 3^4-2^5(3)+2^4-1 = 81-96+15 = 0$.
$(u, v)=(2, 3)$ is a solution. $gcd(2, 3)=1$.
This gives $x=uv=6$, $y=u^4=16$.
If $u=3$. $3^{5/3} \approx 6.24$. $k=6$.
$P_3(6) = 6^4-3^5(6)+3^4-1 = 1296-1458+80 = -82 \ne 0$.
If $u=4$. $4^{5/3} \approx 10.08$. $k=10$.
$P_4(10) = 10^4-4^5(10)+4^4-1 = 10000-10240+255 = 15 \ne 0$.
The Diophantine equation $v^4-u^5v+u^4-1=0$ is known to have only finitely many integer solutions (by Siegel's theorem). The solutions $(1, 1)$ and $(2, 3)$ are the only positive integer solutions.
The solutions to the original equation in natural numbers are $(1, 1)$ and $(6, 16)$.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 19:21 
Mikhail_K
Спасибо. Это похоже на то решение, которое было опубликовано на AOPS: https://artofproblemsolving.com/community/c6h3038659 Надо будет внимательно почитать.

-- Пт окт 31, 2025 23:24:05 --

mihaild
И Вам спасибо. Здесь как-то мутновато, но тоже почитаю.

-- Пт окт 31, 2025 23:25:47 --

mihaild в сообщении #1707859 писал(а):
by Siegel's theorem
Это правда, но теорема Зигеля имеет неконструктивное доказательство и здесь не помогает.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 19:46 
nnosipov в сообщении #1707815 писал(а):
Кажется, DeepSeek научился решать уравнение $x^4+y^2=xy^2+y$ в натуральных числах (зафиксирована одна удачная попытка). Просьба еще раз прогнать эту задачу на других доступных AI.

Вот доказательство от ChatGPT Pro. В середине урезал в связи со сложностями в конвертации LaTeX от chatGPT в dxdy LaTeX . Могу написать конвертер и выложить полное доказательство если интересно.

(Оффтоп)

Цитата:
Решим уравнение в натуральных числах

$$x^4+y^2=xy^2+y.$$


Перенесём всё в одну сторону и сгруппируем:

$$x^4+y^2-xy^2-y=0;\Longleftrightarrow;x^4=(x-1)y^2+y=y\bigl((x-1)y+1\bigr).$$

Отсюда сразу видно, что

$$\gcd\Bigl(y,(x-1)y+1\Bigr)=1,$$

поскольку $((x-1)y+1\equiv1\pmod y).$
А значит, два взаимно простых множителя $(y)$ и $((x-1)y+1)$ дают четвёртую степень $(x^4)$, то есть оба они сами — четвёртые степени:

$$y=t^4,\qquad (x-1)t^4+1=s^4$$

для некоторых натуральных $(s,t).$ Тогда из $(x^4=y\cdot((x-1)y+1)=t^4\cdot s^4)$ получаем

$$x=st\quad\text{(и, кроме того, }\gcd(s,t)=1\text{)}.$$


Подставляя $(x=st,\ y=t^4)$ во второе равенство, получаем ключевое диофантово уравнение

$$(st-1)t^4+1=s^4\quad\Longleftrightarrow\quad s^4-(st-1)t^4=1. \tag{1}$$


...
*** часть доказательства пропущена в связи со сложностями в конвертации LaTeX от chatGPT в dxdy LaTeX
...

Отсюда остаётся единственный чётный случай — $(k=1)$, то есть $(t=2)$.

При $(t=2)$ уравнение $((1))$ даёт

$$(2s-1)\cdot 16+1=s^4\quad\Longleftrightarrow\quad s^4-32s+15=0.$$

Лёгкая проверка показывает, что единственный натуральный корень — $(s=3)$ (для $(s\ge5)$ левая часть уже положительна и строго возрастает).
Тогда

$$(x,y)=(st,t^4)=(3\cdot2,,2^4)=(6,16).$$

## Ответ

Единственные решения в натуральных числах:

$$\boxed{(x,y)=(1,1)\quad\text{и}\quad(x,y)=(6,16).}$$



-- 31.10.2025, 18:48 --

Mikhail_K в сообщении #1707858 писал(а):
Вот текст ответа (ChatGPT-5 Thinking Mini):

Как конвертировали в форумный LaTeX, вручную?

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 19:49 
talash
Там самое интересное пропущено.

-- Сб ноя 01, 2025 00:13:42 --

Mikhail_K в сообщении #1707858 писал(а):
Заметим, что $m\ge t-1$, поэтому
$$
A^5-m^3 \ge A^5-(t-1)^3 = t^3-(t-1)^3 = 3t^2-3t+1.
$$
Вообще-то, из $m\ge t-1$ следует $A^5-m^3 \le A^5-(t-1)^3$. Ошибка. И противоречия дальше я не вижу. Похоже, ChatGPT-5 Thinking Mini не смог решить.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 20:13 
Аватара пользователя
talash в сообщении #1707865 писал(а):
Как конвертировали в форумный LaTeX, вручную?
Написал сначала ему:
Цитата:
Приведи LaTeX-код этого своего ответа
Затем:
Цитата:
Код:
Напиши тот же самый код LaTeX, но вместо \[ ... \] и вместо equation используй $$ ... $$, вместо \( ... \) используй $ ... $, формулы нумеруй с помощью команды \eqno , и разделы не выделяй с помощью \section
Остались какие-то мелочи, которые я поправил вручную.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 20:18 
Кстати, а между $A^5$ и $A^5-A^3$ действительно нельзя втиснуть точный куб? Я не знаю.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 20:26 
Аватара пользователя
nnosipov в сообщении #1707868 писал(а):
Кстати, а между $A^5$ и $A^5-A^3$ действительно нельзя втиснуть точный куб?
$2^5 - 2^3 = 24 < 27 = 3^3 < 32 = 2^5$

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 20:29 
Да, уже понял, много примеров на самом деле.

Почитал текст от Gemini 2.5 Pro Thinking, тоже решения нет. Это как же deepseek-то сподобился? Видимо, флуктуация какая-то.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 21:22 
nnosipov, а текст talash Вы смотрели? Его супер-дупер-нейронка нашла решения, и если да - то все или не только лишь все некоторые?

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение31.10.2025, 21:48 
ozheredov
То, что выше выложено? Там нет самого интересного --- доказательства того, что решения $(1,1)$ и $(6,16)$ составляют все решения. А сами-то эти решения они все находят.

Вот с уравнением $x(y^2-2x^2)+x+y+239=0$ еще можно поэкспериментировать. Сможет кто-нибудь из них найти все решения в целых числах? DeepSeek находит примерно половину всех решений.

 
 
 [ Сообщений: 392 ]  На страницу Пред.  1 ... 23, 24, 25, 26, 27  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group