AGI и пироги

Ghost_of_past · 29.09.2025, 23:08

Mihaylo в сообщении #1703802 писал(а):

Может теперь стало выгодно программистов держать?

Увы, все куда проще: работодатель считал, что если не удастся сократить персонал отделов DP, то хотя бы удастся снять часть рабочей нагрузки и не нанимать новый персонал, а заодно разгрузить менеджеров, полевой отдел, отделы технической поддержки панелей и пр. подразделения. Но оказалось, что LLM не могут выполнять соответствующие рабочие функции на уровне условных аналитиков из DP.

Я это буквально на себе пережил: я постоянно вынужден разрабатывать анкеты для онлайн-опросов и придумывать статистический/эконометрический инструментарий в зависимости от конкретной нужды клиента, но DP так перегружены, что мне постоянно приходится еще и писать скрипты на R, сложный синтаксис в SPSS и макросы в Excel. В 2024 году у меня еще были надежды, что я смогу спихнуть с себя эти задачи в профессиональной версии какой-нибудь LLM, надо только подобрать алгоритмы написания подробных инструкций для четкого выполнения ими задач. Надо ли передавать Вам мое разочарование, когда выяснилось, что большинство LLM не могут вообще написать нормально длинный код, а способны писать хорошо только крошечные куски, для написания же большого кода нужны огромные по времени создания инструкции с очень высокой степенью детализированностью и с серьезными ошибками LLM на выходе, которые потом приходится искать в свободное время?

Аналогичная ситуация и на моей второй работе в качестве научного сотрудника по социологической демографии. Моя работа, к сожалению, состоит не только в обработке данных и написании статей по собственным темам, но и в написании теоретических обзоров литературы для себя и коллег по лаборатории. Наверное, нет смысла пояснять, сколь это интересное занятие в большинстве своем? :-)

Надо ли рассказывать мое разочарование, когда выяснилось, что буквально ни одна LLM не может написать ни отдельный теоретический обзор литературы на 25-30 страниц, ни аутлайн выжимки обзора литературы для реальных научных статей без слишком примитивного изложения материала, выдумывания источников литературы и, что намного хуже, выдумывания странных выводов и данных как из существующей, так и несуществующей литературы? Единственный раз, когда я смог написать дельный обзор при помощи LLM я описывал ранее:

Ghost_of_past в сообщении #1668637 писал(а):

Могу сказать, что меня в октябре попросила знакомая из-за нехватки времени написать ей литературный обзор, что я ей сделал при помощи GPT-4 - но для этого мне буквально пришлось сперва придумать большой и подробный план обзора, потом попросить под каждый небольшой кусочек найти статьи/книги, потом попросить написать каждый этот маленький кусочек на основе соответствующих статей/книг, а потом я еще сам собирал это руками в более-менее прилично написанный единый текст. То есть по факту даже с такой простой деятельностью, как написание обзора литературы, соответствующая система справиться пока не может, - если мы говорим по факту реальной практической деятельности. Какая уж там полная замена людей...

При этом на всех этапах этого мне приходилось ручками и своей головой вычленять ошибки из работы GPT-4, например, перепроверять найденную литературу и оставлять только реально существующую среди источников. Простите, но о какой серьезной замене человеческого труда тут может идти речь, если они даже с отдельными трудовыми функциями отдельных профессий не справляются? Хорошо, если LLM докрутят, и на них можно будет спихнуть хоть какой-то рутинизированный труд без потери качества. Но пока до этого, если не как пешком до Луны, то как пешком до Антарктиды.

-- 29.09.2025, 23:10 --

Mihaylo в сообщении #1703802 писал(а):

Увлечение - это реальное вложение денег, а не широко раскрытые глаза. Прошу принять уточнение.

Нет, увлечение - это вполне конкретные измеряемые метрики по стандартным вопросам из онлайн-анкет про знание, интерес, готовность к применению, опыт применения за последний 1 год, 6 месяцев, 3 месяца, 1 месяц и т.п. Реальное вложение денег - это не увлечение, а инвестиции. И раздутые инвестиции вполне спокойно являются признаком пузыря.

ozheredov · 30.09.2025, 00:44

Mihaylo в сообщении #1703796 писал(а):

Шестилетняя девочка изучала учебники по гинекологии? Вы в своём уме?!

Нет, не изучала. Да, в своем. Хотя судя по тому, что я рассчитывал на разговор без троллинга с Вами, возможно и не в своем.

Mihaylo · 30.09.2025, 09:39

ozheredov в сообщении #1703811 писал(а):

Хотя судя по тому, что я рассчитывал на разговор без троллинга с Вами, возможно и не в своем.

Вы просто начали сравнивать шестилетнюю девочку и трёхмесячную LLM, которая должна прочитать учебники по геометрии, теоретической механике и гинекологии. Это было шибко неправильное сравнение. Надо повторить сенсомоторный опыт, а не изучить его в теории. Второе сильно сложнее.

-- 30.09.2025, 10:07 --

Ghost_of_past в сообщении #1703804 писал(а):

Хорошо, если LLM докрутят, и на них можно будет спихнуть хоть какой-то рутинизированный труд без потери качества.

Наверное те специалисты, которые распределяют задачи по программированию фрилансерам и всяким индусам, лучше представляют, как надо ставить задачу. Скорее всего, они принимают работы в пяток-десяток итераций, постоянно тестируя. Мне кажется это неизбежно. Но если программист поучаствует в нескольких проектах заказчика, то он притирается и количество итераций сокращается. Не знаю, насколько LLM так могут, какую-то персонализацию там рекламировали, да. Нам срочно нужны эти персонализированные LLM. Но во всяком случае первоначальное ТЗ явно недостаточно полно, и итерации с исправлениями - это по сути дописывание новых требований.

У меня было несколько примеров, когда LLM выдавала код довольно длинный, рабочий, без дальнейших исправлений. Явно помогает какое-то длинное пояснение, инструкции.

Ghost_of_past · 30.09.2025, 11:23

Mihaylo в сообщении #1703837 писал(а):

Явно помогает какое-то длинное пояснение, инструкции.

Иногда помогает. Проблема в том, что написание этой инструкции часто таково по длительности, что код можно за это время написать руками.

Rasool · 08.10.2025, 21:55

Вот результат работы ИИ:

Цитата:

Нарисуй дружбу инфузории и амебы

Вот и готово — дружба под микроскопом! Инфузория-туфелька и амеба объединились в этом научном арт-образе: одна с ресничками, другая с псевдоподиями, и вместе они выглядят как настоящие микроскопические друзья.
Хочешь, я расскажу, как эти организмы реально взаимодействуют в природе?

Напиши четверостишие или два об этой дружбе

В капле воды, где жизнь едва видна,
Инфузория с амёбой — как одна.
Одна плывёт, другая — в форме тени,
Но вместе — чудо дружбы вне времени.

Без слов, без взглядов — только жест простой:
Псевдоподия тянется рукой.
И в мире, где микробы — короли,
Они друг другу свет среди пыли.

А вот что выдал другой ИИ:

ozheredov · 08.10.2025, 22:34

Rasool

"Даже когда жизнь такая,
Как будто не дожила"

Если бы я умел курить - я вышел бы на балкон и долго курил

amon · 08.10.2025, 23:58

Это, видимо, сюда. Мой приятель, давно и успешно наладивший переписку AI (от его имени) с деканатом университета, в котором он работает, (теперь, видимо, там переписываются два AI), скормил последний "Advanced info" нобелевского комитета по химии и физике с вопросом: "Кто это написал?"
Результат получился такой:
Физика
Criterion AI-Likelihood Comment
Style consistency 40 % Some AI-like polish, but normal for edited reports
Structure 10 % Too coherent and well-formatted for typical LLM generation
Content accuracy 5 % Far above AI average; includes verified historical data
Citation realism 5 % All plausible, sequential, and cross-referenced
Overall technical narrative 10 % Reflects expert authorship and internal cross-checking
Estimated likelihood written by AI: ≈ 15 % Strongly human-authored or institutionally written
✅ Final Verdict

This text is almost certainly written by humans, not AI.
Specifically, it matches the style and structure of an official Nobel Prize “Scientific Background” document or a university-level explanatory review — rich in verified chronology, true references, and coherent figures.

Химия
Criterion Score (AI-likelihood 0–100%) Comment
Style consistency 95 % Uniform, un-humanly smooth
Structure and transitions 90 % Template-like
Depth and reasoning 85 % Informational, not analytical
Citation formatting 70 % Numeric only, likely generated
Domain accuracy 60 % Reasonable but possibly compiled
Estimated likelihood written by AI: ≈ 88 % Strong AI signature
✅ Conclusion

The text very likely originates from an AI-generated academic summary, such as one produced by ChatGPT or another LLM trained on scientific literature.
A human author might have:
lightly edited it, added the figures and numbering, or merged it into a longer report.
But the core phrasing, structure, and tone are unmistakably consistent with AI-generated scientific prose.

No comment.

rockclimber · 10.10.2025, 00:27

amon в сообщении #1705066 писал(а):

The text very likely originates from an AI-generated academic summary, such as one produced by ChatGPT or another LLM trained on scientific literature.

Никто не любит химию, даже Нобелевский комитет :-(

ozheredov · 10.10.2025, 00:30

rockclimber в сообщении #1705228 писал(а):

amon в сообщении #1705066 писал(а):

The text very likely originates from an AI-generated academic summary, such as one produced by ChatGPT or another LLM trained on scientific literature.

Никто не любит химию, даже Нобелевский комитет :-(

Почему? Нобелевский комитет тоже наверняка прогнал эту бадягу через аналайзер и понял, что это фуфлогенерация. И тем не менее премию дал. То есть вроде как пошел на уступки. То есть вроде как наоборот, любит

Научный форум dxdy

AGI и пироги