Обновление базы знаний ИИ

vicvolf · 04.11.2025, 11:31

Хотелось бы поднять этот вопрос

vicvolf в сообщении #1708163 писал(а):

wrest в сообщении #1708160 писал(а):

Это сейчас ещё, как я понимаю, ИИ не учится на диалогах с пользователями, если по-шахматному, то не пополняет базу дебютов. Но очевидно, что дальше будет пополнять. И если ИИ с вашей помощью решил задачу, то она окажется у него в базе данных. И даже если не решил, то очень вероятно, что допишут так, что будет решать сам без вас, особенно если эту же задачу задаст кто-то ещё.

Вот здесь мне кажется проблема. Для погружения в общую базу знаний ИИ должен быть уверен в правильности загружаемой информации. Но ИИ не может доверять себе контроль информации. В противном случае любое, кажущееся ему правильным утверждение, он должен заносить в общую базу знаний. В пределах темы вы можете, что-то доказать ИИ, но вне темы он обладает знаниями только общей базы знаний.

Mikhail_K · 04.11.2025, 12:31

vicvolf
ИИ более корректно сравнивать не с одним человеком, а с человечеством.
Может ли один человек доверить себе контроль информации? Наверное нет, он может нагаллюцинировать себе что-нибудь пургаторное и без обратной связи от других людей так и не понять этого (а кто-то и с обратной связью не понимает).
Но может ли человечество доверить себе контроль информации? Наверное может, во всяком случае нам некому больше доверить такой контроль. Разве что тому же ИИ, когда он ещё поумнеет.

Практически проблема решается введением градаций уверенности в тех или иных утверждениях. Такая градация есть и у людей - есть утверждения, которые просто кому-то показались правильными; есть несколько раз проверенные и подтверждённые; а есть составляющие научный консенсус. Думаю, что такая градация в каком-то виде есть и у нынешних версий ИИ; во всяком случае, я видел, как в своих мыслях ChatGPT оценивал достоверность сказанного в какой-то статье, опираясь на количество и качество её цитирований. Отличить публикацию на Пикабу от публикации в Nature ИИ вполне способен. Остаётся и тем утверждениям, которые он сам получает, считает их правильными и хочет занести в базу знаний, присваивать значение степени уверенности в них. И должен быть механизм перепроверки утверждений и пересмотра их степени достоверности, например если в процессе каких-то размышлений из этих утверждений получаются сомнительные выводы или противоречие с другими известными утверждениями.

Когда это будет реализовано и как именно будет устроено в деталях, сказать не берусь, но проблема не кажется принципиально нерешаемой.

mihaild · 04.11.2025, 12:35

Нет никакой "общей базы знаний". И в первую очередь модели учатся на гигантском почти не фильтрованном корпусе текстов со всего интернета. При этом они в первую очередь учат язык и какие-то общие представления. Даже если взять статью о том, что Земля стоит на трёх слонах, а Луна сделана из зеленого сыра - всё равно из неё можно узнать много правдивого о мире, если заранее не знать вообще ничего.

Цитата:

Когда б вы знали, из какого сора
Растут стихи

(хотя, возможно, тут точнее GIGO - garbage in, garbage out)
Потом модели дообучаются на каких-то более качественных данных. И там много способов их генерации. В том числе иногда можно улучшить работу модели на некоторых промптах, имея только эти промпты, без заданного правильного ответа. Естественно если это пустить на самотёк, и учить модель полностью автономно, то она свалится сначала в бредогенерацию, а потом вообще в случайные последовательности токенов. Но если делать аккуратно, то польза есть.

wrest · 04.11.2025, 13:03

vicvolf в сообщении #1708270 писал(а):

Для погружения в общую базу знаний ИИ должен быть уверен в правильности загружаемой информации. Но ИИ не может доверять себе контроль информации.

Некоторые задачи трудно решить, но легко проверить правильность ответа простой подстановкой.
Не только,конечно, при решении уравнений в целых числах.
Сюда же попадают решение каких-то дифференциальные уравнений, вычисление неопределенных интегралов.
Да много чего, наверное, например избавление от иррациональностей. Это давно умеют всякие вольфрамы. Меня например в ВУЗе просто таки брали измором на тему вычисления интегралов. То так, то сяк, то наперекосяк.
В упоминаемой раньше задаче

x(y^2-2x^2)+x+y+239=0

легко найти часть ответа, но трудно показать что решений больше нет. Ну как трудно... муторно, скорее.
Так что база ИИ, как мне кажется, может пополняться из диалогов с пользователями. Более того, она и должна бы оттуда пополняться, особенно если несколько пользователей задали один и тот же вопрос.
Кроме того, нередко бывают случаи когда ты указываешь ИИ на глюк, он это признаёт. Это ведь тоже должно падать в какой-то антиглючный раздел базы, чтобы глюк не повторялся.

-- 04.11.2025, 13:05 --

mihaild в сообщении #1708275 писал(а):

Нет никакой "общей базы знаний". И в первую очередь модели учатся на гигантском почти не фильтрованном корпусе текстов со всего интернета.

Ну так и прекрасно, пусть добавляет часть своих диалогов с пользователем в этот корпус, как-то их предварительно отфильтровав по достоверности.

mihaild · 04.11.2025, 13:11