2
grisaniaЦитата:
в ухе человека имеется 30 000 тысяч волосиков, которые возбуждаются на определенные частоты
Кажется, чуть меньше. У W. Keidel, W. Neef (1974-1976) упоминается 3,5 тысяч внутренних и 12 тысяч наружных волосковых сенсорных клеток. А вот иннервирующих их афферентных волокон конечно гораздо больше, те самые 3-4 десятка тысяч. Или вы для обоих ушей числа привели?
Цитата:
Скорей всего нейроны ведут себя как фильтры.
Например, упомянутый вами кортиев орган и сетчатка глаза действительно выполняют фильтрующие функции, можно даже сказать спектральный анализ (похоже на Фурье, но наверняка сложнее
).
Но вот с самими нейронами не все ясно, т.е. аналогия интересная, но я её не понял. При чем тут нейроны?
Можно поподробнее?
Я участвовал на форуме "Форум на Исходниках.RU=>Речевые Технологии", где я пытался реализовать эту идею на задаче распознавания фонем, которая до сих пор не решена удовлетворительно.
В частности, я пытался построить фильтры, которые соответствовали бы 12 бинарным фонемным признакам Якобсона, о которых хорошо написано в популярной книжонке - "Звуки и символы". Автора забыл.
Там есть интересный пример.
-Девочка как твою маму зовут?
-Лита.
-Не понял, наверно, Рита.
-Да, Лита.
-Девочка уже распознает фонемы "р" и "л", но не умеет включать вибрацию своего голоса.
В этой книжке пишется, что для всех языков мира достаточно 12-13 бинарных фонемных признаков. В каждом языке 38-45 фонем. Больше всего у абхазов и бушменов.
Лучше почитать ветки, где я участвовал.
"Фонемное распознавание речи"
http://forum.sources.ru/index.php?showtopic=145994Что слышим? Гармоники или их огибающую
В этой ветке много говорится о кортиев органе.
http://forum.sources.ru/index.php?showtopic=143082&hl=%C3%E0%F0%EC%EE%ED%E8%EA%E8"Охота потягаться в создании системы распознавания речи"
http://forum.sources.ru/index.php?showtopic=9020&st=60"Модель слуховой системы, Как устроено ухо? Как мы слышим?"
http://forum.sources.ru/index.php?showtopic=152406&hl=%C3%E0%F0%EC%EE%ED%E8%EA%E8 Цитата:
моделирование нейронной сетью логических операций - путь ведущий никуда, если ставить себе задачу понимать как человек думает
Исследования ИНС с целью изучения мышления привлекательны тем, что на определенном уровне сложности ИНС может взять да и начать мыслить.
Конечно в действительности такого не происходит, да и наврятли произойдет.
Никогда не произойдет, ибо нет воздействие информации на человека. Человек потребляет ифу из внешнего мира, и если кругом будет тишина, то он сойдет с ума.
Ещё есть проблемы с самими попытками смоделировать реальные мозги. Дело в том, что многое известно о деятельности мозга, очень многое. Можно сказать, что известны почти все используемые в мозге алгоритмы обработки поступающих данных. И про зрение и про слух многое известно. Можно сказать где и когда в мозге обрабатывается такая-то порция данных, и можно даже сказать, что именно с ней происходит. Но все эти известные операции обладают общей для них странностью: они производят своеобразную предварительную подготовку информации (тот же спектральный анализ, или выделение каких-либо признаков), а вот что происходит дальше с подготовленными сигналами -- не совсем понятно. Непонятно, где же сам интеллект-то располагается, где находится сознание, где находится "Я".
Все методы распознавания не активны. Образы складываются у нас в голове как на складе, но перед этим кладовщик их описывает по признакам. Кто тогда выполняет функцию кладовщика выполняет у нас в голове, и кто их оттуда извлекает?
Например, образ фонемы как звукового сигнала активен, он несет энергию и жаждет быть опознанным, т.е. пытается пролезть по всяким фильтрам в голове. Для распознавания применяют классическую коммутативную логику- то бишь теоретико-множественную - все рассортировать по полкам, то бишь по областям пространства признаков. Работу по сортировке по полкам осуществляет какой-то непонятный кладовщик.
Например, пусть у нас каждая фонема - это 3000 временных отсчетов. Тогда мы должны все 3000 –мерное пространство разбить на 41 области или подмножества. Пришел сигнал фонемы, и если он как точка принадлежит определенной области, значит, фонема распознана, т. е. применять теоретико-множественную логику.
Как пишет Архангельский в книге "Путь программиста" человек информацию получает из внешнего мира в виде звуковых и световых волн.
Однако попытка представить мозг как память, где складируются знания - образы объектов, вещей как точки n-мерного пространства, ничего не дает.
Сигнал из внешнего мира моментально вызывает у человека ассоциацию, т.е. энергия сигнала пробивается через кучу фильтров, ища, что она может возбудить.
Объектно-вещное представление мира перенесено на базы данных. Объект или вещь для нас куча признаков и его по этим признакам надо отнести к какому-то изученному классу.
Я думаю, что у человека в мозгу действует логика возбуждения – наборы линейных и (может быть и не линейных) фильтров, которые пропускают сигнал.
Сигнал извне несет энергию, которая на нас воздействует. Например, белый шум все возбуждает, поэтому он не информативен.
Кластерный анализ изучает звуки как мертвый объект. Вы пытаетесь выделить признаки фонем и их классифицировать по кластерам. Так как кластерный анализ происходит в n-мерном пространстве (n-число признаков), то вы разбиваете всё n-мерное пространство на области по числу классов. Теперь у вас есть простейший предикат. Принадлежит сигнал данному кластеру (множеству) или нет. Булева логика - да или нет.
Эта классическая логика и является тормозом распознавания речи и нейронных сетей.
Рассмотрим другую логику. У вас два камертона (1-ый и 2-ой) настроенные на разные частоты. Приходит сигнал, и камертоны возбуждаются. Если возбудился 1-ый камертон, то он принадлежит 1-ому классу, а 2-ой, то 2-ому классу. У вас получилась логика возбуждения. А если оба возбудились, то естественно принять по максимуму энергии. Камертоны тихо звучат, но оба, наверно, это шум. А если ни один не возбудился, то, значит, нет сигнала, но это не верно может это ультразвуковая волна, а она для нас как бы из параллельного мира, т.е. нет прибора- камертона, который ее наблюдает.
В этом и есть коренное отличие логики возбуждения от теоретико-множественной или как я ее называю - объектно-вещной. Объект как бы принадлежит обоим классам.
Человечество уже столкнулось с этим явлением в квантовой механике. Электрон как волна пролезает через две дырки, так как на электрон смотрели как на объект с признаками – 3 координаты, 3 импульса. Хотели, что бы он лез только через одну дырку на экране. Однако электрон оказался не объектом, локализованным в точке, а волной и его надо изучать фильтрами. Квантовая механика учит, что области 3-мерного пространства – фильтры, локализующие электрон в пространстве как камертоны звуковую волну.
Каждый камертон выделяет свою гармонику и является проектором на одномерное пространство – простейший фильтр. Значит, используя логику возбуждения, надо найти такие подпространства, чтобы в каком-то смысле уменьшить какую-то ошибку распознавания. Я знаю точно, что я уменьшаю в каком-то смысле -энергию неправильного распознавания
Попарно сравнивая фонемы как это делает Якобсон, можно искать подпространства, т.е. фильтры, максимально реагирующие на свою фонему.
На эту тему у меня есть научная статья, где подвожу под это математику, скоро выйдет в США. Могу в личку прислать.
Я когда-то философствуя на тему моделирования мышления пришел к, скажем так, функциональной его теории; позже я узнал, что при исследованиях ИИ интенсивно применяют Lisp и другие функциональные языки, что добавило мне энтузиазма.
Я просто пытался моделировать мысли как
-функции. Процесс решения какой-либо задачи соответствовал вычислению функции. Моделью разума была программулька (написанная на самопальном диалекте Lisp'а) в виде рекурсивной функции с аккумулятором. Эта функция генерировала сложные функции (задания), затем вычисляла их (решение заданий) и анализировала результаты (отладочная печать
). В процессе решения заданий вся совокупность промежуточных результатов была достаточно велика и необозрима (я назвал эту фазу подсознательной деятельностью), а вот множество готовых результатов было вполне себе маленьким (момент получения такого решения я называл точкой внимания). В сумме все точки внимания являлись, по-сути, сознательной деятельностью смоделированного разума.
Потом энтузиазм исчез, интерес пропал, но на последок я успел поразмышлять (в первые дни Нового Года
) о соотнесении функциональной модели с каким-нибудь статичным субстратом. Вычисления функций естественным образом воспринимались как распространение данных в какой-нибудь сети (в терминах теории графов можно было бы говорить о поиске кратчайшего пути волновым алгоритмом), но почему-бы не взять за основу НС? Периодический характер вычислений хорошо бы соотносился с мозговыми волнами, возникающих при деятельности реальной нервной ткани, модель позволяла бы объяснить феномен концентрации внимания, позволяла бы даже локализовать сущность "Я" ("Я" находится в тех участках мозгов, куда быстрее всего пришли нужные результаты).
Как я уже говорил, в основе модели была рекурсивная функция, т.е. своеобразный цикл. Поэтому, при сопоставлении функциональной модели с НС появилось ощущение необходимости дополнить сеть цепочками обратной связи (для зацикливания). Вот я до сих пор уверен, что если и пытаться моделировать мышления с помощью ИНС, то надо позаботиться об обратных связях, грубо говоря, нужно как-то связать выходы с входами.
Ужас, в общем.
Пытался выучить Lisp и Prolog, но руки до этого не дошли.