2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Нейронные сети. Функции активации многослойного персептрона
Сообщение16.09.2009, 09:46 
Аватара пользователя
Доброго времени суток, уважаемые товарищи!
Почти во всех книжках по нейронным сетям хорошо обсуждается модель персептрона(перцептрона). В частности о ней сказано, что ,чтобы персептрон назывался персептроном, у него обязательно должна быть пороговая функция активации (hardlim).
О функции активации "многослойного персептрона" я нашел мало информации.
На сайте http://www.aiportal.ru/articles/neural- ... ptron.html есть такой абзац:
"Свойство 1. Каждый нейрон сети имеет нелинейную функцию активации
Важно подчеркнуть, что такая нелинейная функция должна быть гладкой (т.е. всюду дифференцируемой), в отличие от жесткой пороговой функции, используемой в персептроне Розенблатта. Самой популярной формой функции, удовлетворяющей этому требованию, является сигмоидальная. Примером сигмоидальной функции может служить логистическая функция, задаваемая следующим выражением:"

Внимание, вопрос:
Многослойный персептрон в своих слоях может иметь не обязательно жесткие пороговые функции активации нейронов?

P.S. Дело в том, что я всегда думал обратное. Я считал, что многослойный персептрон, по аналогии с простым персептроном, может иметь в своих слоях ТОЛЬКО пороговые функции активации.

 
 
 
 Re: Нейронные сети. Функции активации многослойного персептрона
Сообщение16.09.2009, 09:52 
Как правило, функции используемые в нейронных сетях обычно гладкие, нелинейные функции, что используется в алгоритме обратного распространения ошибки (можно брать производную от таких функций). Вроде, под перцептроном, понимается именно нейрон с пороговой функцией активации. Но можно использовать и нелинейные, но вот это уже не перцептрон, а просто нейрон с нелинейной функцией активации.

 
 
 
 Re: Нейронные сети. Функции активации многослойного персептрона
Сообщение16.09.2009, 19:56 
Аватара пользователя
Alexey1 в сообщении #243750 писал(а):
Вроде, под перцептроном, понимается именно нейрон с пороговой функцией активации.

Абсолютно согласен. В литературе в изобилии есть тому подтверждение.
Вопрос был такой: может ли многослойный персептрон иметь в своих слоях НЕ пороговую функцию активации?

Но ответ на этот вопрос я сегодня наконец-то нашел сам.
Приведу 2 абзаца из книги "Нечеткая логика и искусственные нейронные сети" Круглова, Дли и Голунова со страницы 83(это по поводу многослойного персептрона):
"Здесь уместно отметить важную роль нелинейности активационной функции, так как, если бы она не обладала данным свойством или не входила в алгоритм работы каждого нейрона, результат функционирования любой $Q$-слойной сети с весовыми матрицами $W^(^q^)$ для каждого слоя $q = 1, ..., Q$ сводился бы к перемножению входного вектора сигнала $X$ на матрицу:
$W_(_\Sigma_) = W^(^1^)...W^(^q^)...W^(^Q^)$.
Фактически такая Q-слойная нейронная сеть эквивалентна сети с одним скрытым слоем и с весовой матрицей единственного слоя $W_(_\Sigma_)$:
$Y=XW_(_\Sigma_)$
"
Таким образом, мы видим, что многослойный персептрон в своих слоях не только может иметь НЕ пороговую функцию активации, но и должен её иметь, иначе смысла в его многослойности нет. Вопрос решен. Всем спасибо за участие!

 
 
 
 Re: Нейронные сети. Функции активации многослойного персептрона
Сообщение24.10.2009, 02:12 
Вы не только не разобрались, но даже не начали. Читать http://ru.wikipedia.org/wiki/Перцептрон

или если что писать мне tac@inbox.lv

(а смысла в его многослойности так или иначе нет ;) )

 
 
 
 Re: Нейронные сети. Функции активации многослойного персептрона
Сообщение24.10.2009, 02:24 
Аватара пользователя
tac в сообщении #254295 писал(а):
Вы не только не разобрались, но даже не начали. Читать http://ru.wikipedia.org/wiki/Перцептрон

Позвольте полюбопытствовать, откуда такое предположение?
Информацию в википедии я перечитывал уже не один раз.
tac в сообщении #254295 писал(а):
или если что писать мне tac@inbox.lv

Большое спасибо за желание помочь мне разобраться в вопросе.
tac в сообщении #254295 писал(а):
(а смысла в его многослойности так или иначе нет )

Зачем же, по вашему, модель многослойного персептрона подробно разбирается в литературе, если смысла в этой модели нет?
Вы много работали с нейронными сетями и достаточно хорошо в них разбираетесь?

 
 
 [ Сообщений: 5 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group