2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Вопрос по нейронным сетям
Сообщение04.01.2017, 14:33 
Добрый день! Вопрос новичка, прошу не судить строго.
В процессе изучения базовой модели нейронной сети столкнулся с таким вопросом:
обучение нейронной сети на n-м количестве образцов заключается в настройке весов,настройка заключается в минимизации cost function. Подставляется другой образец - настройка весов начинается с начала и в итоге получаем другой набор настроенных весов.
В итоге получаем матрицу весов - каждая строка - настроенные весы для каждого отдельного образца.
Но как в таком случае использовать нейросеть в прогнозировании?

 
 
 
 Re: Вопрос по нейронным сетям
Сообщение05.01.2017, 21:02 
Cost function нужно минимизировать в среднем для всех образцов в тренировочном множестве, что для нейросети, что для любого другого алгоритма обучения с учителем.
Если получать новый вектор весов на каждый обучающий пример, то действительно, использовать такую нейросеть для новых данных не получится

 
 
 
 Re: Вопрос по нейронным сетям
Сообщение05.01.2017, 21:07 
В режиме обучения, кроме входных образов, сеть использует соответствующие им значения целевой переменной (предполагается, что используется обучение с учителем и рассматривается только одна прогнозируемая переменная - это наиболее национальная постановка задачи).
В случае прогнозирования, входные образы - это наборы наблюдаемых и лагированных (наблюдаемых в предыдущие моменты времени, с заранее заданной временной задержкой) переменных, которые могут включать так же лаги самой прогнозируемой переменной. Значения целевой переменной - это наблюдаемые значения прогнозируемой переменной.
В ходе обучения сеть меняет свои веса таким образом, чтобы минимизировать некоторый функционал качества (cost function), который показывает насколько точно сеть вычисляет значения целевой переменной на основании данных входных образов. Обычно в качестве cost function рассматривается среднеквадратическая ошибка (mse). После того как сеть обучена, её веса фиксируются и больше не меняются.
В режиме моделирования значения целевой переменной уже не требуется, сеть сама вычисляет прогноз этого значения на основании исходных данных входного образа и настроенных при обучении весов. Собственно это и есть прогнозирование. Ошибку полученного прогноза можно оценить на основании значения cost function, достигнутого при обучении.

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group