Чтобы адекватно оценить сообщение

, нейросеть должна уже знать материал, содержащийся в сообщении

. Поэтому LLM не может самостоятельно отобрать те реплики, на которых ее стоит доучивать, ибо они по определению выходят за пределы ее уровня знаний.
Я тоже сначала хотел такое сказать, и, вероятно, это действительно аргумент. Но потом подумал, что он вряд ли совсем уж бесспорный. Начнём с того, что в принципе фильтровать реплики на разумные и неразумные ИИ способен уже сейчас - возможно, иногда ошибаясь, а иногда относя реплики к "серой зоне". Но отбросить очевидную лажу и не учиться на ней ИИ сможет.
Ровно так же ИИ сможет уверенно идентифицировать как разумные некоторые реплики, которые прямо сейчас выходят за рамки его знаний - если в этом тексте всё написано очень ясно, подробно и логично, и хорошо стыкуется с уже имеющимися у ИИ знаниями. Но я думаю, что в принципе можно организовать дообучение так, чтобы ИИ извлёк полезную информацию даже из тех реплик, в корректности которых он сомневается.
Представьте, что вам дали библиотеку из книг по совсем незнакомым вам разделам математики, причём одни книги написаны очевидными фриками, другие - неочевидными фриками, а третьи - серьёзными учёными. При этом у вас нет возможности посмотреть и узнать, кто, собственно, авторы. Если вы до этого времени ничего серьёзного из математики не читали, то наверное, после прочтения всего этого в голове у вас будет каша. Но если вы читали уже много разных математических книг, то наверное сможете извлечь пользу из знакомства с такой библиотекой. Что-то вам удастся понять, что-то - сразу отбросить, в чём-то вы будете не уверены, но будете размышлять над этим, что-то попробуете вывести на бумаге по-своему и может быть что-то получится.
Если что, это моё сообщение совсем не относится к вопросу о дообучении нынешнего ИИ с его текущими возможностями. Сообщение о том, что принципиально можно учиться и на непроверенной информации и становиться только умнее, особенно если какие-то проверенные знания у вас уже есть; а насколько это реально для нынешнего ИИ, я не знаю.