2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Алгоритм Нелдера-Мида.
Сообщение17.04.2008, 14:03 


16/04/08
5
Применяется для поиска локального минимума функций, зависящих от нескольких аргументов (в многомерных задачах). Насколько мне известно, этот метод реализован как библиотечный в программе Mathlab. Кратко его суть: строится начальный симплекс - множество из n+1 допустимых точек аргументов, где n-размерность задачи. Назову этот симплекс гиперпирамидой (треугольник, если на плоскости). Далее точки сортируются в порядке ухудшения значения функции. Наихудшаю точку пробуем заменить на другую, полученную как ее отражение по прямой из нее через центр масс оставшихся лучших точек (грубо говоря, по направлению туда, где ф-ция потенциально улучшается). Если отражение (и его пару под-вариантов на той же прямой) не дают улучшения ф-ции, то весь симплекс пропорционально сжимается к лучшей из точек. Все повторяется до тех пор, пока либо симплекс не вырождается (начинают совпадать точки или стягивается в маленькую область), а разброс значений ф-ции становится несущественным.

Проблема: симплекс в процессе поиска решения "живет" - растягивается, сжимается, перемещается. Из-за ограниченной точности вычислений, ему свойственно вырождаться (начинают совпадать отдельные точки) до того, как будет найдено решение.
У меня проблема стоит особо остро, потому что разрядность аргументов заданна (ограничена).

Если кто сталкивался с методом и проблемами, отзовитесь. Мне будет интересно обсудить подробнее.
Вот ссылочка на вики, где можно получить представление о теме:
http://en.wikipedia.org/wiki/Nelder-Mead_method

Как преодолеть вырождение симплекса? В моем случае оптимизируемая ф-ция аналитически не задана, получается в результате измерений. Имеет 6 аргументов по 5 или 8 бит каждый.

Я попробовал изменить алгоритм: задал нач симплекс как пирамиду с ортогональными боковыми сторонами равной длины, чтобы все вершины были целыми, а потом при его преобразовании делал отражения худшей точки не через центр масс оставшихся, а через середину лучшей стороны, т.о. она всегда отражается строго из целочисленны в целочисленные координаты.
Недостаток оказался следующий: симплекс перестал строго ориентироваться по направлению улучшения фции, т.к. сохранял форму и ортогональность, в результате тоже часто сжимается до нахождения минимума при неудачном расположении относительно градиента фции.

 Профиль  
                  
 
 Re: Алгоритм Нелдера-Мида.
Сообщение17.04.2008, 14:18 
Заслуженный участник
Аватара пользователя


23/08/07
5501
Нов-ск
Astrona писал(а):
Как преодолеть вырождение симплекса?

Правильный тр-к всегда таким останется. Откуда вырождение?

 Профиль  
                  
 
 Re: Алгоритм Нелдера-Мида.
Сообщение17.04.2008, 14:19 
Заслуженный участник
Аватара пользователя


11/04/07
1352
Москва
Astrona писал(а):
У меня проблема стоит особо остро, потому что разрядность аргументов заданна (ограничена)

Что означает это Ваше утверждение?
Если Вы проводите поиск экстремумов, то по какой причине все Ваши переменные и операции с ними не удвоенной точности?

 Профиль  
                  
 
 
Сообщение17.04.2008, 15:32 


16/04/08
5
По первому замечанию: мой треугльник не вырождается, поскольку я запрещаю изменения длин его сторон при отражении любой из точек, но он может весь пропорционально уменьшаться, сходя в одну точку, при том еще не достигнув решения.


По второму замечанию: аргументы дискретные. Можно проводить вычисления с любой точностью, но в ф-цию подставлять все равно придется дискретные значения (округленные).

Как я полагаю, нужно изменить (или улучшить) сам подход. С другой стороны, если кто смотрел пример в вики на ф-ции Розенбрука, то по-моему можно даже доказать (или привести пример, во всяком случае) тупиковой ситуации метода при грубом шаге аргументов.

Добавлено спустя 2 минуты 20 секунд:

Кстати, работаю с прямоугольным треугольником, но не с правильным, поскольку у правильного нельзя задать в целых одну из вершин :(
А он вел бы себя явно лучше прямоугольного.

 Профиль  
                  
 
 
Сообщение17.04.2008, 15:40 
Заслуженный участник
Аватара пользователя


23/08/07
5501
Нов-ск
Astrona писал(а):
Кстати, работаю с прямоугольным треугольником, но не с правильным, поскольку у правильного нельзя задать в целых одну из вершин :(
А он вел бы себя явно лучше прямоугольного.

При чем здесь целые? Если значения функции известны только в конечном числе точек, то перебором найдите с наилучшим значением.

 Профиль  
                  
 
 
Сообщение17.04.2008, 15:43 


16/04/08
5
Нелдера-Мида примеяю как раз потому, что среди других ему требуется меньше всего раз вычислять ф-цию. Колв-о точек всего как минимум 2^(5*6), что неприемлемо много. Я уже писал, что аналитически не задана, а каждое измерение дорого по времени.

 Профиль  
                  
 
 
Сообщение17.04.2008, 15:48 
Заслуженный участник
Аватара пользователя


23/08/07
5501
Нов-ск
Astrona писал(а):
Нелдера-Мида примеяю как раз потому, что среди других ему требуется меньше всего раз вычислять ф-цию. Колв-о точек всего как минимум 2^(5*6), что неприемлемо много. Я уже писал, что аналитически не задана, а каждое измерение дорого по времени.
Точки кем-то заданы или в каких угодно точках можете вычислять? Впрочем, я бросаю это гадание.

 Профиль  
                  
 
 
Сообщение17.04.2008, 16:22 
Заслуженный участник
Аватара пользователя


11/04/07
1352
Москва
Astrona писал(а):
Я уже писал, что аналитически не задана, а каждое измерение дорого по времени.

Из Вашего сообщения следует, что Вы осуществляете поиск экстремума с одновременным измерением функции на Вашей установке, параметры которой изменяются дискретно. После определения новой точки, вычисленной сколь угодно точной, Вы округляете значения до дискретных и проводите измерения. Первый раз встречаюсь с такого рода поиском экстремумов. Есть ли литература по таким работам?

Проверяли ли Вы свое программное обеспечение на аналитической функции, но с дискретными входными параметрами( ошибки в тексте программ)?
Пробовали ли Вы осуществить поиск при одном фиксированном параметре с целью выявления наиболее неустойчивого параметра?
Поиск экстремумов без знания природы параметров и описания процессов влияния параметров очень затруднителен.

 Профиль  
                  
 
 
Сообщение17.04.2008, 16:58 


16/04/08
5
Может не так оперативно, как хотелось бы - обсуждал эту проблему на месте..
Так вот, пространство с 6-ю дискретными аргументами, каждый 5-8 бит, т.е. прямой перебор неприемлем совершенно!
Измерять значение ф-ции можно в любых допустимых значениях аргументов. Измерили, изменили аргументы, измерили.. подумали, снова изменили аргументы и снова измерили и т.д.
Сама ф-ция можно считать непрерывная и сколь угодной точности, но не аргументы.

Да, согласен.. проблемы возникают и от невозможности в данный момент (а может и вдальнейшем) узнать модель (ф-цию).

Именно на аналитической ф-ции Розенбрука проверяю. Она вполне хороший кандидат для остановки алгоритма до окончания оптимизации по причине низкой разрядности аргументов. Хотя разрядности хватает, чтобы "вручную" выбрать точку получше!!!

 Профиль  
                  
 
 
Сообщение30.04.2008, 13:22 


16/04/08
5
Решил оставить оригинальный алгоритм, а с вырождением "бороться" инициализацией симплекса заново.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group