Это для какой архитектуры?
Обычные CNN (свёрточные). В научных работах обычно вместо точности 98,7% указывают обратную величину - ошибка 1,3%. На 10000 примерах 130 ошибок.
Здесь есть сводные данные по различным моделям:
https://ru.wikipedia.org/wiki/MNIST_(база_данных)
Тут нужна рекуррентная сеть.
Да, но я себе такую задачу не ставлю. Так как у меня нет соответствующего датасета.
Я заметил, что математики не правильно используют этот термин. Рекурсивность - это когда функция вызывает сама себя. Рекуррентность - это итерационный вызов в цикле.
Так... Рекуррентность (рекуррентная формула) реализуется с помощью цикла (итерации), либо с помощью рекурсии. Так что разделите понятие итеративности и рекуррентности. В английском языке применяется recursive formula, у нас рекуррентная формула. Так что тут чёрт ногу сломит.
-- 24.11.2025, 18:09 --Я так понимаю эту фразу: машина должна соображать, что, например, какой-нибудь князь Милославский не мог родиться в 7564 году, поэтому семёрку нужно заменить на 1. А кто в каком порядке чертит цифры — это пройденный этап, из него уже извлекли почти всё, что можно.
Допустим у нас есть датасет, где написано "князь Милославский родился в 7564 году". Откуда этот датасет взялся? Ну да, выдрано из энциклопедий, справочников, исторической литературы, летописей, интервью и т.п. Мы можем научить выдирать подобную информацию другую нейросеть и наказывать её за ошибки. Тогда такая нейросеть будет знать, что а-я-яй, какой там 7564-й год! Да, нам не нужна генерация текстов, мы говорили о том, что нейросеть должна как-то отреагировать на этот текст, а не генерировать. Но нейросеть, которая знает особенности генерации
правильных фактов, способна определять ошибки. Она полезна. И в чат-ботах это всё есть: и чтение, и генерация. Правда это не всегда помогает.)
В обработке естественного языка практикуется метод контрастивного обучения без учителя. Это когда берётся предложение и несколько слов заменяются на случайные (можно цифры в датах менять). Если таких замен несколько, то вероятность практически 100%, что предложение станет искажённым, бессмысленным. В этом случае можно взять много различных фактов и из них нагенерировать сколько угодно ложных фактов, и на этом учить нейросеть отличать ложные факты от действительных.
-- 24.11.2025, 18:26 --Не важно, какой алгоритм: синтез частей датасета с неправильными (искажёнными) данными и соответствующими метками (лейблами) - это важная дополнительная информация для понимания природы датасета.