Доброго времени суток, уважаемые товарищи!
В книге Медведева и Потемкина «Нейронные сети» на странице 38 в разделе «2.2.2. Многослойные сети» есть такой абзац:
«Обозначим весовую матрицу, связанную с входами, через
, верхние индексы которой указывают, что источником входов является первый слой (второй индекс) и адресатом является также первый слой (первый индекс). Элементы этого слоя, такие, как смещение
, вход функции активации
и выход слоя
, имеют верхний индекс 1, чтобы обозначить, что они связаны с первым слоем. В дальнейшем для матриц весов входа и выхода слоя будут использованы обозначения IW (Input Weight) и LW (Layer Weight) соответственно»
Далее, на следующей странице (стр. 39) есть рисунок 2.12:
Внимание, вопрос:
Зачем авторам книги понадобилась такая хитрая система обозначений матриц весовых коэффициентов разных слоёв? Ведь вместо двойных верхних индексов и разделения матриц весовых коэффициентов на «IW» и «LW» (тем более, что обозначение матрицы «IW» используется только для первого слоя нейронов, как видно из рисунка), на мой взгляд, можно было бы прекрасно обойтись единым обозначением матриц «IW» (или же «LW» (по вкусу)) с единственным верхним индексом, указывающим номер слоя, к которому относится эта матрица весовых коэффициентов. Тогда вместо исходных обозначений матриц на рисунке (
,
,
), получим следующие обозначения:
,
,
, которые весьма облегчают понимание сути дела.
Согласны ли вы с моим мнением?