Alexx, я считаю, что вы заблуждаетесь. Не думаю, что мне удастся вас переубедить, но просто зафиксируйте, что я сейчас скажу. Такого рода мнения довольно распространены и характерны для молодых людей, которые осваивают теоретические методы (и весьма очаровываются ими), но реальных практических задач пока не решали. У меня есть коллеги, которые со смехом говорили мне, что когда были "молодые и глупые" (не принимайте на свой счет, пжалста
), то тоже считали, что где есть теорема об оптимальности - то круто и правильно, а где нет никаких теорем и сплошная эвристика - то фигня. Кто всю жизнь будет работать в теории, тот может и до конца жизни так думать, но столкновение с хоть какими реально практическими задачами быстро развеивает эти иллюзии.
Теперь по сути.
Alexx писал(а):
Не зря слово теория я брал в кавычки.
Важен следующий момент. Например, теория вероятностей (и науки, вытекающие из нее) дает нам ОБОСНОВАННЫЕ МЕТОДЫ РЕШЕНИЯ РЯДА ЗАДАЧ (всякие там оценки максимального правдоподобия, байесовские оценки, критерий Неймана-Пирсона, фильтрация Калмана-Бьюси (идет минимизация дисперсии), итд итд итд).
Т.е. мы говорим себе: " Мы будем производить обработку, например, смеси сигнала и некоторого шума по определенному алгоритму (и не по какому-нибудь иному )потому, что Теор-я
Вер-й говорит, что этот алгоритм оптимален в каком-либо из смыслов (происходит,например, минимизация дисперсии).
Любые математические обоснования даются в рамках определенной
математической модели. Любая модель включает в себя ряд предположений и допущений. Применимость этих допущений к реальным задачам и процессам не очевидна. Я приведу цитату из своего поста на mmonline, в котором я писал про подобные вещи какому-то очередному "ниспровергателю основ":
PAV писал(а):
Посмотрите лучше на следующие три цитаты. В.Н.Тутубалин, "Теория вероятностей и случайные процессы", изд-во МГУ, 1992.
Стр 191: "Модели случайных процессов, правдоподобно отражая одни черты какого-то явления, часто являются бессмысленными в других отношениях. Следует это понимать и не напрягать модель выше пределов ее возможностей."
Стр. 193: "Однако модель ... имеет следующее парадоксальное свойство... далее идет объяснение, которое вы вряд ли поймете - PAV ... Ясно, что в практическом отношении такой вывод неразумен. Не следует догматизировать абстракцию точной наблюдаемости значений..."
Стр. 194: "Конечно, как модель физического броуновского движения он ( винеровский процесс, введенный ранее - PAV) условен (позже мы познакомимся с более точной моделью) и действует при не слишком малых разностях ... Принимая эту модель для любых разностей, мы должны быть готовы получить удивительные выводы"
Все понимают, что математика работает с математическими моделями реальных явлений. Они существуют в нашем воображении и наделяются различными абстрактными свойствами (некоторые из них соответствуют свойствам реальных объектов, другие - нет). Чистая математика вообще не выходит за рамки этих моделей, ее задача - исследовать их и только их. Выводы, полученные в этих моделях, также не имеют прямого отношения к реальности и являются лишь логическими следствиями тех свойств, которыми мы сами нашу модель наделили. Другое дело, что мы разрабатываем большинство (не все) модели имея в виду, что они могут оказаться адекватны некоторым реальным процессам. Но опять-таки все понимают, что не все выводы могут быть автоматически перенесены и у любой модели есть некоторые границы применимости. Они определяются экспериментально. Таким образом, про любую модель исследуется, какие стороны реального явления она описывает хорошо, а какие плохо.
Таким образом, вся идеальная точность решений, которая имеет место в моделях, исчезает как только мы переходим к реальным ситуациям. Теория вероятностей в этом смысле, кстати, довольно характерный пример. Посмотрите определение теории вероятностей в математической энциклопедии: "математическая наука, позволяющая по вероятностям одних случайных событий находить вероятности других случайных событий, связанных к.-л. образом с первыми". Т.о. чтобы применять теорию вероятностей к реальным событиям сначала надо задать хоть какие-то вероятности, а откуда вы их возьмете?
Рассмотрим например байесовские оценки. Ну имеете вы точную формулу для пересчета вероятностей гипотез при условии того, что произошло некоторое событие. Но для этого вам нужно знать априорные вероятности этих гипотез, а также вероятности данного события при каждой гипотезе. А откуда вы их возьмете для реального события, кто вам их скажет? Даже само существование вероятности того или иного события есть модель, абстракция, применимость которой к практике не всегда очевидна.
Даже если вы точно рассчитаете вероятность некоторого события, что из того? Какой такой абсолютно точный и надежный вывод можно в принципе из этого сделать?
Или рассмотрим фильтрацию Калмана-Бьюси. Вы исходите из предположения, что наблюдаемые случайные данные удовлетворяют некоторым рекуррентным соотношениям, в которые входят неизвестные постоянные коэффициенты и случайный шум. Шум предполагается гауссовским. В данной модели вы имеете процедуру, которая дает оптимальное в среднеквадратичном смысле решение. Замечательно. Теперь мы имеем
реальные данные. Откуда вы узнаете, что ваше рекуррентное предположение к ним применимо? Откуда вы узнаете, что шум гауссовский? Кстати, для специалистов по статистике (и AI) не является большим секретом, что предположение гауссовости для реальных данных часто не очень верно - хвосты тяжелее, чем нужно. Это приходится учитывать.
Наконец, с чего вы взяли, что лучшее решение будет в среднеквадратичном смысле? Может, если взять модуль, то будет еще лучше, или четвертую степень. А может для данной задачи лучшие результаты даст какой-нибудь совсем другой критерий, который еще даже не рассматривали нигде.
Наконец, известно, что нелинейная фильтрация в теории лучше, чем линейная. Но на практике часто применяется все-таки линейная, потому что она не так чувствительна к неточностям задания исходных данных, а в реальных задачах эти неточности неизбежны.
Alexx писал(а):
Я могу со спокойной совестью применять эти алгоритмы в любых ОТВЕТСТВЕННЫХ областях (например, на АЭС). (Чернобыльская АЭС бабахнула по сути потому, что проектировщики не разобрались со всем множеством решений, которые давала система Диф Ур-й, описывающих систему охлаждения реактора.)
Если бы я предложил использовать в какой-нить ОТВЕТСТВЕННОЙ области нейросетевые алгоритмы (с их непредсказуемостью и неоптимальностью, натяжками), меня бы шайками закидали.
Не можете - по причинам, описанным выше. Сначала нужно проверить, что используемая вами модель достаточно адекватно описывает реальную ситуацию (а полной точности описания ни одна модель не добьется). (См. выше мой пример с линейной-нелинейной фильтрацией: на практике применяется модель, дающая худшие теоретические результаты.)
И проверка эта - по сути нечеткая. Вам нужно провести серию опытов, решить (без каких-либо идеальных критериев), является ли приемлемым расхождение между выводами модели и реальными наблюдаемыми результатами, и наконец решить, достаточно ли этих опытов, чтобы признать модель достаточно приемлемой, чтобы можно было ею пользоваться.
А про Чернобыль - я не верю. Дайте ссылку. Лучше уж тогда приведите пример обрушения аквапарка, где официально причиной названы ошибки проектирования и расчета. Что лишний раз доказывает, что абсолютно надежных систем все равно не бывает, везде есть человеческий фактор. И от применения оптимальных и четких, но неподходящих моделей, вреда может быть не меньше, чем от неоптимальных и эвристических. И вообще - критерии применения тех или иных методов в ОТВЕТСТВЕННЫХ областях достаточно сложны и математическая точность - далеко не самй главный из них.
Alexx писал(а):
Какие это такие задачи можно решать только с помощью "Теории" нейросетей? Не знаю!!!
Любые реально работающие продукты по распознаванию используют нейронные сети. Вообще, поверьте человеку, в этой области работающему: сейчас эвристика (по-вашему - минус) дает лучшие результаты, чем теория.
Рассмотрим задачу распознавания отдельно взятой рукописной цифры. Как ее можно решить без нейронных сетей, без обучения на реальных данных? Никак. (Если захотите, напишу про это чуть поподробнее). А любое обучение на реальных данных всегда привносит нечеткость. Другая компания будет обучать даже такую же сеть на другой выборке - и получит другой распознаватель. AI в принципе работает в области таких задач, где от нечеткости не избавиться, а разумных математических моделей просто нет. И что теперь, совсем эти задачи не решать?