2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1 ... 18, 19, 20, 21, 22
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение22.05.2025, 16:18 
Аватара пользователя
Gemini 2.5 Pro писал(а):
Задано уравнение:
$$\frac{\partial^2 z}{\partial x^2}+\frac{\partial^2 z}{\partial y^2}=0$$
Здесь $z$ является функцией от $x$ и $y$, то есть $z = z(x,y)$.
Требуется преобразовать это уравнение, принимая $x$ за неизвестную функцию, а $y$ и $z$ за независимые переменные. Таким образом, $x = x(y,z)$.

Обозначим частные производные $z$ по $x$ и $y$ как $z_x = \frac{\partial z}{\partial x}$ и $z_y = \frac{\partial z}{\partial y}$.
Обозначим частные производные $x$ по $y$ и $z$ как $x_y = \frac{\partial x}{\partial y}$ и $x_z = \frac{\partial x}{\partial z}$.

Из дифференциалов $dz = z_x dx + z_y dy$ и $dx = x_y dy + x_z dz$ можно установить следующие соотношения между производными первого порядка:
1. $dz = z_x (x_y dy + x_z dz) + z_y dy = (z_x x_y + z_y) dy + (z_x x_z) dz$.
2. Сравнивая коэффициенты при $dz$ и $dy$, получаем:
* $z_x x_z = 1 \implies z_x = \frac{1}{x_z}$
* $z_x x_y + z_y = 0 \implies z_y = -z_x x_y = -\frac{x_y}{x_z}$

Теперь найдем производные второго порядка:
$\frac{\partial^2 z}{\partial x^2} = \frac{\partial}{\partial x}(z_x)$. При дифференцировании по $x$, переменная $y$ считается постоянной. Используем правило $\frac{\partial}{\partial x}\Big|_y = \frac{1}{x_z} \frac{\partial}{\partial z}\Big|_y$:
$$\frac{\partial^2 z}{\partial x^2} = \frac{1}{x_z} \frac{\partial}{\partial z}\left(\frac{1}{x_z}\right) = \frac{1}{x_z} \left(-\frac{1}{(x_z)^2} \frac{\partial x_z}{\partial z}\right) = -\frac{1}{(x_z)^3} \frac{\partial^2 x}{\partial z^2} = -\frac{x_{zz}}{(x_z)^3}$$

$\frac{\partial^2 z}{\partial y^2} = \frac{\partial}{\partial y}(z_y)$. При дифференцировании по $y$, переменная $x$ считается постоянной. Используем правило $\frac{\partial}{\partial y}\Big|_x = \frac{\partial}{\partial y}\Big|_z - \frac{x_y}{x_z} \frac{\partial}{\partial z}\Big|_y$:
$$\frac{\partial^2 z}{\partial y^2} = \left(\frac{\partial}{\partial y} - \frac{x_y}{x_z}\frac{\partial}{\partial z}\right) \left(-\frac{x_y}{x_z}\right)$$
$$\frac{\partial^2 z}{\partial y^2} = \frac{\partial}{\partial y}\left(-\frac{x_y}{x_z}\right) - \frac{x_y}{x_z} \frac{\partial}{\partial z}\left(-\frac{x_y}{x_z}\right)$$
$$= -\frac{x_{yy}x_z - x_y x_{zy}}{(x_z)^2} - \frac{x_y}{x_z} \left(-\frac{x_{yz}x_z - x_y x_{zz}}{(x_z)^2}\right)$$
$$= \frac{-(x_{yy}x_z - x_y x_{zy})x_z + x_y(x_{yz}x_z - x_y x_{zz})}{(x_z)^3}$$
Предполагая, что смешанные производные равны ($x_{zy} = x_{yz}$), получаем:
$$\frac{\partial^2 z}{\partial y^2} = \frac{-x_{yy}(x_z)^2 + x_y x_{yz}x_z + x_y x_{yz}x_z - (x_y)^2 x_{zz}}{(x_z)^3} = \frac{-x_{yy}(x_z)^2 + 2x_y x_z x_{yz} - (x_y)^2 x_{zz}}{(x_z)^3}$$

Подставляем эти выражения в исходное уравнение $\frac{\partial^2 z}{\partial x^2}+\frac{\partial^2 z}{\partial y^2}=0$:
$$-\frac{x_{zz}}{(x_z)^3} + \frac{-x_{yy}(x_z)^2 + 2x_y x_z x_{yz} - (x_y)^2 x_{zz}}{(x_z)^3} = 0$$
Умножаем на $(x_z)^3$ (при условии $x_z \neq 0$):
$$-x_{zz} - x_{yy}(x_z)^2 + 2x_y x_z x_{yz} - (x_y)^2 x_{zz} = 0$$
Умножаем на $-1$:
$$x_{zz} + x_{yy}(x_z)^2 - 2x_y x_z x_{yz} + (x_y)^2 x_{zz} = 0$$
Группируем члены:
$$(1 + (x_y)^2)x_{zz} - 2x_y x_z x_{yz} + (x_z)^2 x_{yy} = 0$$

Записывая производные в явном виде:
$$\left(1 + \left(\frac{\partial x}{\partial y}\right)^2\right) \frac{\partial^2 x}{\partial z^2} - 2 \frac{\partial x}{\partial y} \frac{\partial x}{\partial z} \frac{\partial^2 x}{\partial y \partial z} + \left(\frac{\partial x}{\partial z}\right)^2 \frac{\partial^2 x}{\partial y^2} = 0$$

Это и есть преобразованное уравнение.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение22.05.2025, 16:42 
mihaild
Круто! Могëт!

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 12:28 
В Калифорнии прошла закрытая встреча 30 ведущих математиков, где они пытались обхитрить ИИ-бота от OpenAI. Их цель — придумать задачи, которые машина не сможет решить.
Цитата:
17-18 мая 2025 года в Беркли прошла тайная встреча: 30 математиков из разных стран собрались проверить интеллект нового бота o4-mini от OpenAI, сообщает Scientific American. Эта облегченная ИИ-модель с усиленной логикой и обучением на человеческих отзывах умеет решать не просто задачи — она размышляет, упрощает, проверяет гипотезы и выводит доказательства.

Задачи участники сочиняли сами. Если бот не справлялся, автор получал $7,5 тыс. Но оказалось, большинство задач o4-mini все же решает — и делает это быстрее, чем опытный ученый.

Математик из университета Вирджинии и судья встречи Кен Оно сам попытался «подловить» ИИ. Он предложил задачу, которую считали открытой в теории чисел. Бот задумался, сначала прочитал литературу, потом решил упрощенную версию, а затем и исходную. Все это заняло около 10 минут. В финале бот написал: «Никакой ссылки на источник не требуется, поскольку загадочное число было вычислено мной».

По словам ученых, это было похоже на работу аспиранта-гения — только в 100 раз быстрее. «Я не ожидал такого уровня рассуждений. Это уже не просто генератор слов. Это научное мышление», — отметил Оно.

За два дня участники все же нашли 10 задач, с которыми бот не справился. Это и были победы людей. Но больше всех поражал масштаб — за год такие ИИ-системы продвинулись невероятно далеко:

o4-mini решает задачи уровня аспирантуры и научных публикаций;

он учится на новых данных и меняет подход по ходу рассуждений;

он «ведет себя» как человек, который мыслит, проверяет и корректирует гипотезу.

Цитата:
Было бы ошибкой считать, что ИИ — это просто программа. Сегодня он уже умнее большинства аспирантов. Завтра — возможно, и профессоров.

Кен Оно, математик из университета Вирджинии

Ученые начали обсуждать «пятый уровень» — вопросы, на которые пока не знает ответ ни один человек. Если и до них доберется ИИ, роль математика изменится. Люди будут формулировать задачи, а решать — машины. Профессор станет наставником для reasoning-ботов, как сейчас работает с аспирантами.

Ранее Наука Mail рассказывала, что компания Google работает над новым ИИ-инструментом, который сможет автоматически разбирать почту и писать ответы в стиле пользователя.

At Secret Math Meeting, Researchers Struggle to Outsmart AI. The world's leading mathematicians were stunned by how adept artificial intelligence is at doing their jobs.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 13:51 
Rasool в сообщении #1690186 писал(а):
тайная встреча

Rasool в сообщении #1690186 писал(а):
это было похоже на работу аспиранта-гения

Rasool в сообщении #1690186 писал(а):
Сегодня он уже умнее большинства аспирантов. Завтра — возможно, и профессоров.

Rasool в сообщении #1690186 писал(а):
At Secret Math Meeting

Rasool в сообщении #1690186 писал(а):
world's leading mathematicians


Вот тут даже не нужно быть математиком, достаточно просто иметь минимальную общую культуру и элементарный литературный вкус, и уже все ясно.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 14:53 
Аватара пользователя
Rasool
Ну и цитировали бы оригинал от Scientific American. Это тоже не Карузо, но всяко лучше того Рабиновича, который Вам напел.

У меня несколько вопросов:
1. World's leading mathematicians - это кто? Как Scientific American определил, что они world's leading?
2. Если meeting был таким secret, с какой стати участники потом откровенничают с журналистами?
3. Если meeting все же не был таким уж secret, то где, скажем примерно, препринт на arXiv со списком решенных и не решенных ИИ задач? Понятно, что они не обязаны его готовить. Но это было бы логичным шагом. Особенно если были решены задачи, "which experts in my field would recognize as an open question in number theory — a good Ph.D.-level problem".

Не хочется подозревать Scientific American в банальном утководстве, но все это выглядит подозрительно. И без списка задач совершенно непроверяемо.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 15:18 
Аватара пользователя
Rasool в сообщении #1690186 писал(а):
В Калифорнии прошла закрытая встреча 30 ведущих математиков, где они пытались обхитрить ИИ-бота от OpenAI
Тридцать разных обормотов
Обхитрить решили бота,
Бот, однако, не дебил,
Обормотов обхитрил.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 15:29 

(Оффтоп)

Так их всех обматерил!

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 15:50 
Аватара пользователя
Sender в сообщении #1690211 писал(а):
Так их всех обматерил!
Это лучше!

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 15:57 
Вообще, это любопытно --- скормить ИИ какую-нибудь задачу из вновь придуманных и посмотреть, что он выдаст. У меня есть возможность так развлекаться только с deepseek. Успехи у него пока не очень. На вот этой задаче topic158347.html он сейчас просто завис. Скормил ему более простую версию --- решить уравнение $x^2+y^2=(yz-1)^3$ в натуральных числах (ее читатели-человеки Amer. Math. Monthly еще решают, решение нигде пока не опубликовано, есть только условие: Problem 12461 // Amer. Math. Monthly. 2024. V. 131. P. 445.) Вот жду, пока напишет решение.

Upd. Ну вот, по прошествии 1014 seconds выдал: есть решение $(11,2,3)$, и оно единственное (потому что мамой клянусь других решений найти не удалось, как ни старался). Такие дела.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 16:06 
Аватара пользователя
nnosipov в сообщении #1690224 писал(а):
Вообще, это любопытно --- скормить ИИ какую-нибудь задачу из вновь придуманных и посмотреть, что он выдаст
Я время от времени спрашиваю модели "чему равна полудуплексная с противником коммуникационная сложность равенства" (с расписыванием определений). Ответы со временем становятся чуть менее бредовыми, но все еще каждый раз выкидывают все интересные стратегии под предлогом "понятно что такой подход не работает" без строгой формулировки, и, тем более, доказательства.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 16:09 
Аватара пользователя
Процитирую здесь, а то так и пропадет в бестолковой теме:

Утундрий в сообщении #1689383 писал(а):
Я просто выражу своё предвзятое мнение: если "он" и не умеет думать, то всем бы так не уметь.

Небольшой пример, без лишних деталей. Словами описываю структуру матрицы и выдвигаю гипотезу о распределении её собственных значений вблизи нуля. Да, важный момент: это всё в режиме "глубокого исследования". Чат уходит в себя. Медленно заполняется шкала прогресса, ниже которой высвечиваются текущие этапы. Вот он насилует Википедию, вот пишет код на питоне, вот ищет внешний ресурс, чтобы этот код выполнить, вот анализирует результаты, и вот он, наконец, разродился отчётом. В отчёте: рекуррентная формула, позволяющая связать последовательность определителей с классическими полиномами, ссылка на их асимптотику при стремлении степени к бесконечности, подтверждение моей гипотезы и вдобавок зачем-то ещё несколько результатов вычислений по той самой программе. Для практически мыслящих, видать. И всё это за пять минут реального времени.
Утундрий в сообщении #1689403 писал(а):
Anton_Peplov в сообщении #1689385 писал(а):
"он" - это кто?
Общедоступный GPT-4o.
Mihaylo в сообщении #1689387 писал(а):
Сравните честно отчёт от человека и отчёт от ИИ. Характеристики: скорость, правильность и т.д.
Ну, по всем пунктам человек в пролёте. По крайней мере, человек типа меня.
Правда, в контексте этой темы "лишние" детали как раз не помешали бы.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 16:17 
Аватара пользователя
Gemini 2.5 Pro писал(а):
Пятое решение уравнения $x^2+xy+41y^2=(yz+1)^3$ в натуральных числах, следующее за приведенными в списке, это:
$$(x,y,z) = (53161, 40, 35)$$

***

### Пояснение
Это сложное диофантово уравнение было предложено на математическом соревновании "Турнир Городов" в 2013 году. Приведенные в условии четыре решения являются частью последовательности, найденной автором задачи.

Следует отметить, что данная задача содержит, по-видимому, опечатку. Четвертое решение $(50189, 40, 34)$ не удовлетворяет простому алгебраическому тождеству, вытекающему из исходного уравнения: $(2x+y)^2 + 163y^2 = 4(yz+1)^3$. Этот факт подтверждается в официальных решениях турнира.

Тем не менее, если следовать списку решений, предоставленному автором задачи, то пятым решением будет именно указанное выше. Оно продолжает последовательность решений с $y=40$.
(разумеется решение из условия правильное, а выданное моделью нет)

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 16:18 
Пример задачи с недавнего экзамена, которую deepseek решил правильно (и даже разными способами): вычислить сумму $$\sum_{a \in \mathbb{Z}_p}\frac{a}{a^2+a-1},$$ где $p \equiv \pm 2 \pmod{5}$ --- простое число. Увы, но далеко не все студенты ее успешно решают. В целом, прогресс довольно большой, пару лет назад такого и близко не было.

-- Пт июн 13, 2025 20:20:47 --

Цитата:
Это сложное диофантово уравнение было предложено на математическом соревновании "Турнир Городов" в 2013 году.
Да-да, конечно :)

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 17:45 
Anton_Peplov в сообщении #1690200 писал(а):
Не хочется подозревать Scientific American в банальном утководстве, но все это выглядит подозрительно. И без списка задач совершенно непроверяемо.


https://mathscholar.org/2025/06/new-ai-stuns-mathematicians-with-its-problem-solving-skill/
В конце этого текста David H Bailey в виде скриншота приводит задачу про числа Тамагавы, поставленную Кеном Оно o4-mini.

Странно вот что. Если за 10 минут ИИ решает такие задачи, то за прошедшие несколько дней ИИ должен решить сотню таких задач... А об этом не слышно ничего.

 
 
 
 Re: Проверка способности ChatGPT решать математические задачи
Сообщение13.06.2025, 19:23 
nnosipov в сообщении #1690224 писал(а):
На вот этой задаче topic158347.html он сейчас просто завис.

Новейший бот тоже не смог.
o3 pro писал(а):
Ошибка в потоке сообщений


Gemeni 2.5 Pro выдал неправильный ответ зачем-то, хотя ниже его проверил и написал, что проверка не прошла.

 
 
 [ Сообщений: 330 ]  На страницу Пред.  1 ... 18, 19, 20, 21, 22


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group