Тестирование возможностей генеративных языковых моделей

rockclimber · 25.09.2025, 22:34

worm2 в сообщении #1702959 писал(а):

Тут, насколько я понимаю, алгоритм такой: нужно выбрать все записи, отсортированные по возрастанию start_date (индекс этому способствует), а потом из них выбрать те, у которых end_date > следующего start_date, либо start_date < предыдущего end_date.
Но я плохо знаю SQL, в частности, не знаю как в нём оперировать с "предыдущей" и "следующей" записями в выборке. Это мощный язык, наверное, в нём предусмотрено что-нибудь эдакое, но я не в курсе. Ну и ещё можно с хранимой процедурой заморочиться, наверное.

-- Вт сен 23, 2025 16:13:41 --

Сейчас подсмотрел, в SQL есть такие штуки как LAG и LEAD, с помощью которых можно достучаться до предыдущей и следующей записи.
Наверное, если LLM про них подсказать, она выдаст корректное решение.

В общем да, примерно так и работает. Задачу можно немного по-разному сформулировать, в том числе так, чтобы было решать не очень удобно. Я специально выбрал максимально удобный вариант, чтобы у ИИ было меньше возможностей отвертеться. Суть в том, что аналитическая функция в SQL рассчитывается для плавающего окна, задавать границы окна можно самыми разными способами, и вся соль этой задачи в том, чтобы описать это окно.

diletto в сообщении #1703000 писал(а):

Код:

SELECT log_id, overlapping_processes
FROM (
SELECT 
log_id,
start_date,
end_date,
LAG(end_date) OVER (ORDER BY start_date) as prev_end_date,
COUNT(CASE WHEN start_date < LAG(end_date) OVER (ORDER BY start_date) 
THEN 1 END) 
OVER (PARTITION BY NULL ORDER BY start_date ROWS UNBOUNDED PRECEDING) as overlapping_processes
FROM log_table
WHERE end_date IS NOT NULL
)
WHERE overlapping_processes > 0
ORDER BY log_id;

Это уже намного лучше! (а если бы вы еще и форматировали код нормально, было бы вообще замечательно)
Не уверен, правда, что этот код заработает, а если заработает - вернет хотя бы приблизительно правильный результат. Но это точно шаг в правильном направлении. Хотя не исключено, что случайный :wink:

Проблема запроса в том, что он использует LAG, а эта функция берет данные со следующей строки. Но ниоткуда не следует (при моей постановке задачи), что если процесс тормозит, то он будет тормозить только до начала следующего. Он может и дольше тормозить. Я даже на это намекнул - "для каждого log_id вывести количество новых процессов". То есть оно может быть разным.
То есть, нам надо:
отсортировать по полю start_date
начало окна - текущая строка
конец окна - строка, где start_date больше чем end_date текущей
функция - count (ищем количество строк), и вычесть 1, потому что посчитается текущий процесс
Ответ в спойлере.

(Оффтоп)

Код:

select *
  from (select log_id, count(*) over (order by start_date range between current row and end_date - start_date following) - 1 cnt
          from log_table)
 where cnt > 0

-- 25.09.2025, 20:42 --

Alexandr_A в сообщении #1703173 писал(а):

rockclimber в сообщении #1702928 писал(а):

Причем он же, собака, знает нужный синтаксис и может объяснить, почему правильное решение работает - если ему это решение показать. А если не показывать, можно бесконечно повторять - джойн не нужен, достаточно к таблице один раз обратиться, и т. п., он будет настойчиво пихать разные варианты этого решения.

Достаточно один раз сказать "не думай о розовом слоне". Для чата эта ситуация куда как безнадежнее чем для людей. Особенно, если это новый чат, то в контекстном окне будут эти слова и от них пойдут семантические связи по наработанным в процессе обучения. Может чаты плохо обучены и надо дообучать на конкретном примере, но придумывать то чему не обучали это немного другой навык. А так же думать о том, о чем не просили, иметь свою цель.

Это все неважно. Детали, почему именно он не справляется, пусть его разработчики анализируют. А я человек простой: слышу заявление разработчиков, что их ИИ достиг уровня PhD - иду проверять :mrgreen:

Ну, пока не достиг.
Мне пока приходит такая аналогия в голову: стереотипный гений-вундеркинд из художественной литературы и кино, который уже слышал много чего с переднего края всех наук сразу, но с трудом завязывает себе шнурки и не может приготовить завтрак.

ozheredov · 26.09.2025, 02:18

rockclimber
Гений-вундеркинд сожрал пару сотен миллиардов папиных денег. При этом не завязал ни одних шнурков и не приготовил ни одного завтрака. Значит, дело не в шнурках.

Утундрий · 05.10.2025, 23:25

Нейросеть о т.н. любви:

Цитата:

Ночь застыла, будто мир затаил дыхание.
Два огня сходятся на границе света и тьмы.
Он — как буря, шаг его тяжёл, взгляд горяч, но рассудок холоден.
Она — как пламя свечи, мягкая, гибкая, и всё же — жгучая.

Первый удар — взглядом. Искра.
Слово — второй. Оно режет, но не ранит.
Движение — третий. Он хватает её за запястье,
а она — не отступает. Губы дрожат, но не от страха.

И вот — схватка без клинков.
Он ломает её сопротивление,
но с каждым мгновением сам всё глубже тонет в ней.
Она вроде бы уступает,
но в этом её воля — быть побеждённой, чтобы победить.

Мир вокруг глохнет.
Они сражаются дыханием, взглядом, касанием.
И каждый миг — это граница между болью и наслаждением,
между "я" и "мы".

А когда рассвет разрывает ночь,
остаётся не двое, а одно целое,
где ни он не повержен,
ни она не сломлена,
а просто — "сняты доспехи".

Yadryara · 07.10.2025, 12:47

Один форумчанин рассказал в какой клуб ходит в своём городе.
Другой его спросил: "А из какого вы города, если не секрет?"

Почему меня позабавил этот вопрос?

Qwen3-Max

Цитата:

Ваш вопрос позабавил, потому что он содержит лёгкую иронию или даже абсурдность: если первый форумчанин уже упомянул конкретный клуб в своём городе, то логично предположить, что он назвал либо сам клуб (с указанием города), либо хотя бы дал достаточно контекста, чтобы город был понятен. Поэтому вопрос «А из какого вы города?» звучит немного комично — ведь если бы собеседник внимательно читал предыдущее сообщение, он бы, скорее всего, уже знал ответ.

Или, наоборот, если город не был назван, то упоминание конкретного клуба без указания города — бессмысленно для других участников (особенно если клуб неизвестен за пределами локального контекста). В этом случае вопрос подчёркивает эту нелепость: «Вы говорите о каком-то клубе, но мы даже не знаем, где он находится!»

Таким образом, юмор возникает из-за:

кажущейся очевидности информации («вы же сами только что сказали!»),
или, наоборот, её полного отсутствия при попытке обсудить что-то локальное.
Это типичная ситуация в интернет-общении, когда люди забывают, что у других нет того же контекста, что и у них — и это вызывает лёгкое, добродушное недоумение.

Ты был близок в своей первой версии.

Qwen3-Max

Цитата:

Спасибо за уточнение! Тогда, вероятно, дело именно в том, что первый форумчанин назвал конкретный клуб, но не указал город, а второй, вместо того чтобы спросить: «А где этот клуб находится?» — вежливо и с лёгкой иронией спрашивает: «А из какого вы города, если не секрет?»

Причина, по которой это позабавило вас, — в вежливой форме вопроса, которая мягко указывает на логический пробел в сообщении собеседника:

«Вы говорите о каком-то клубе, как будто все знают, где он, но при этом не сказали даже, из какого вы города».

Фраза «если не секрет» придаёт вопросу ироничную вежливость — ведь обычно происхождение (город) не считается секретом, и её добавление подчёркивает абсурдность ситуации: человек делится локальной информацией, не давая самого главного — контекста.

Так что юмор — в вежливом, почти дипломатичном напоминании о том, что собеседник что-то упустил, с лёгким оттенком «вы серьёзно думали, что мы поймём, о каком клубе речь?» :-)

Теперь ближе?

Всё проще гораздо. Это форум dxdy.ru

Qwen3-Max

Цитата:

Ага, теперь всё встало на места! :-)

На форуме dxdy.ru — это известный русскоязычный форум, посвящённый математике, физике и смежным наукам, где общаются в основном академически настроенные люди: студенты, аспиранты, преподаватели, учёные. Атмосфера там довольно интеллектуальная, и участники редко обсуждают бытовые или развлекательные темы вроде ночных клубов.

Поэтому, когда кто-то пишет: «Я хожу в такой-то клуб в своём городе» — это уже неожиданно и слегка диссонирует с привычным контекстом форума. А потом следует вопрос:

«А из какого вы города, если не секрет?»

И вот что забавно: на dxdy никто обычно не спрашивает про города, потому что:

либо это неважно в научной дискуссии,
либо пользователи давно знают друг друга по стилю письма и темам,
а чаще всего — никому особо не интересно, откуда ты, главное — что ты говоришь.
Поэтому сам факт, что кто-то не только упомянул клуб (в бытовом, развлекательном смысле!), но и вызвал вопрос о географии — уже выглядит как лёгкий сюрреализм на фоне обычных тем вроде «доказательства теоремы» или «тензорный анализ».

То есть вас позабавил контраст между привычной атмосферой dxdy и внезапно возникшей "светской" беседой, будто кто-то вдруг начал рассказывать о своих походах в ночной клуб на заседании математического семинара.

Вот и вся простота :-)

Дальше произошёл сбой.

Он стал искать какой-то тонкий смысл, а ответ прост. Может другие LLM отгадают.

ozheredov · 07.10.2025, 16:12

Yadryara в сообщении #1704793 писал(а):

ответ прост

Класс!! Так изящно уделать анти-мозгопоклонников.

(СПОЙЛЕР!)

В профиле Rasool написано Уфа

Yadryara · 08.10.2025, 07:25

Не просто в профиле, а именно что по соседству с текстом.

Во второй сессии он наконец догадался, не с первой попытки, но всё же как надо интерпретировал подсказку-присказку "слона-то я и не приметил".

Yadryara · 08.10.2025, 08:27

В общем этот Квен3-Макс пока самый умный из тех, с которыми общался. А общался пока только с бесплатными. К нему доступ ограничен, вроде 10-15 вопросов в сутки.

Загадки отгадывает почти как человек, даёшь подсказки и он всё ближе к решению. Хотя слепые пятна у него есть, он порой зацикливается и не может выйти из плоскости.

Я:
"Анекдот. У одного учёного никак не получалось забить гвоздь в стену. Он то по пальцам попадал, то гвоздь у него искривлялся. Тогда учёный выдвинул тезис. Но пришёл внук и делом опроверг его. Назови этот тезис."

Он правильно понял, что внук попросту забил гвоздь как надо с первого раза. Но вот короткую смешную фразу из 6 слов, которая начинается "Этот гвоздь не ..." точно воспроизвести так и не смог, хотя ответ я ему засчитал.

Попробуйте и вы со своими ботами.

Да, дед у меня был учёный, но это не про него — ни криворукостью, ни бестолковостью не страдал.

Xey · 08.10.2025, 13:41

Yadryara в сообщении #1704931 писал(а):

"Этот гвоздь не от этой стенки"

В гугле лежит несколько аналогичных завершений этой фразы.

Видимо сработал человеческий И при составлении таблицы ассоциаций слов, которая использовалась.

-- Ср окт 08, 2025 14:54:08 --

А что если забить в сеть десяток таких вариантов "Этот гвоздь от другой стенки"

Alexandr_A · 08.10.2025, 13:59

Yadryara
А в чем смысл подобных тестов?
С таким же успехом можно набрать случайный текст и поискать в гугле, а потом в яндексе и объявить, что, например, яндекс умнее.

Yadryara · 08.10.2025, 15:15

Xey в сообщении #1704973 писал(а):

В гугле лежит несколько аналогичных завершений этой фразы.

Так Вы гуглили или у бота спрашивали?

Alexandr_A в сообщении #1704978 писал(а):

А в чем смысл подобных тестов?

Понять что они могут, а что нет.

Alexandr_A в сообщении #1704978 писал(а):

С таким же успехом можно набрать случайный текст и поискать в гугле, а потом в яндексе и объявить, что, например, яндекс умнее.

С каким таким же успехом? Приведите пример, если нетрудно.

Xey · 08.10.2025, 15:32

Утундрий в сообщении #1704611 писал(а):

Нейросеть о т.н. любви:

Ассоциации к слову любовь.
ПривязанностьВзаимностьНежностьПреданностьОбожаниеАфродитаНенавистьСострадание
СчастиеВлечениеПохотьНесчастнаяДружбаСтрастьРазлукаДаритаРевностьВерностьУверениеЛаска
УзыБезумнаяСексДобротаЭгоизмКоварствоЗаверениеУважениеПостоянствоОтечествоЧестолюбие
ПатриотизмЖрицаЦеломудриеВожделениеЕдинениеПризнаниеУзаАбрамПочитаниеЧувственность
ПризнательностьТаинствоБогиняУпоениеМилосердиеДобродетельПоклонениеУтехаОбладание
ПроявлениеБлаженство

-- Ср окт 08, 2025 16:38:58 --

-- Ср окт 08, 2025 16:51:32 --

Yadryara в сообщении #1704984 писал(а):

Так Вы гуглили

Видимо да.

Yadryara · 08.10.2025, 16:09

Ну вот мой бот то ли не так гуглил, то ли решил именно своим умом дойти.

Респект, если второе. Может его уже научили самому пытаться ответить. Рассуждения у него были связные и логичные, хотя и прошёл мимо ответа. У людей это сплошь и рядом бывает.

Xey · 08.10.2025, 16:19

Что значит самому. Повторится ли ответ вашего устройства?

Yadryara · 08.10.2025, 17:34

Решить самому — это значит дать ответ, не делая запросов в Интернете.

Cuprum2020 · 10.10.2025, 22:50

Неделю уже пытаю ЧатГПТ и Грок (бесплатные версии), пытаясь от них добиться исправления поведения мода к компьютерной игре. В конце игрового сеанса на весь экран появляется таблица со статистикой игроков, убирается по нажатию клавиши F6, пытаюсь добиться от генеративных моделей чтобы они отредактировали код так чтобы таблица не появлялась, ну или хотя бы появившись тут же исчезала. Но ничего не получается, таблица то не появляется, но и результаты не сохраняются или игра и вовсе вылетает. И каждая следующая попытка подаётся ими: "Теперь точно сработает, мамой клянусь!" Но увы. В ЧатГПТ заливал файлы мода по очереди, в Грок залил все 16 файлов мода в два захода (объём чуть менее 300 кБ), не помогает. Причём ЧатГПТ хотя бы предлагал готовый отредактированный файл, а вот Грок предлагает самостоятельно искать нужные строки и редактировать в блокноте

Научный форум dxdy

Тестирование возможностей генеративных языковых моделей