Обоснование. Если бы произвольное вложение
, приближенное нейросетью, давало то же качество - то было бы странно, что находится не оно, а какое-то "полезное".
обоснование должно выглядеть как рассуждения, отталкивающиеся от более простых обоснованных суждений и приводящие к выводу, что именно "полезное" должно находиться, а не какое-то другое.
а ваш вариант - оно такое, потому что работает, - это совсем не обоснование.
с заменой слоев рассуждения не понял
А что именно?
Либо я где-то что-то очень плохо сформулировал, либо вы не понимаете чего-то совсем простого. В любом случае надо с этим разобраться, а не идти дальше.
вы писали
one hot encoding всегда можно сделать из двоичной кодирования заменой последнего слоя, обратное, вообще говоря, требует добавления нового слоя.
я могу точно так же, убрав последний слой one hot encoding и заменив его на двичное кодлирование, переобучить сеть. поэтому я, во-первых, не понял, что означает "обратное, вообще говоря, требует добавления нового слоя", а во-вторых, каким боком это вообще к вопросу о приоритетности выбора one hot encoding для построения качественного классификатора?
Ее нет в том числе потому, что непонятно, как хотя бы сформулировать утверждение "нейросети работают".
нет. тут вопрос проще - почему с one hot encoding качество распознавания (процент ошибок) в общем случае получается меньше, чем с двоичным.
Могу в ответ спросить вас, что значит "нейрон реагирует на несколько признаков"
будем говорить, что нейрон реагирует на один признак, если он активируется, когда на входе нейросети присутствует данный признак (например, уголок) и не активируется в противном случае. в противном случае будем говорить, что нейрон реагирует на несколько признаков.
и чем вообще несколько признаков отличается от одного признака "их конъюнкции".
давайте для простоты вести речь про конволюционные сети - там на каждом уровне нейроны работают с признаками, являющимися "конъюнкцией" признаков, распознающихся предыдущим слоем.