2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 алгоритм RANSAC
Сообщение25.02.2016, 18:50 


11/04/13
125
как работает RANSAC метод? расскажите пожалуйста, как вы поняли? (из википедии толком ничего и не узнала про этот метод, или совсем не понятен алгоритм)

 Профиль  
                  
 
 Re: алгоритм RANSAC
Сообщение26.02.2016, 11:32 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Это метод оценивания параметров модели в условиях, когда часть наблюдений содержит грубые ошибки или включена в выборку ошибочно (кратко именуется "выбросы", англ. outliers; для правильных наблюдений специального русского термина не знаю, иногда транслитерируют английский inlier). Использование их исказит результаты, а для многих методов оценивания (в частности, для популярнейшего МНК) исказит настолько, что невозможно будет понять, что грубая ошибка именно в этих наблюдениях. Это возможно даже при единичных выбросах
В моём личном опыте ситуация, когда экономист, попытавшись установить методами регрессионного анализа, как производительность труда в приборостроении зависит от фондовооружённости (стоимости производственных фондов в расчёте на работающего), получил, что чем больше стоимость фондов, то есть лучше техническое оснащение, тем ниже производительность. В данном случае обнаружился один-единственный выброс, формально подчинённый Минприбору ювелирный завод, на котором выработка на рабочего определялась ценой золота и алмазов, а оборудование достаточно дешёвое - шлифовальный станок и молоточки.
Изображение
а множественные и вовсе затуманивают картину.
Данный алгоритм альтернативен робастному оцениванию, в котором для построения модели используются все наблюдения, но регулируется их влияние.
В Random sample consensus изначально делается предположение, что некоторые наблюдения верны, а некоторые грубо ошибочны, и основная задача - распределить имеющиеся на эти два класса. Используется метод оценивания n-параметрической модели по небольшому (возможно, равному n, или же немного большему, но сильно меньшему общего объёма выборки) числу наблюдений и критерий возможных отклонений, позволяющий отнести наблюдение из числа тех, которые не были использованы для оценивания, к содержащим грубые или же негрубые ошибки. Выбрав несколько наблюдений, позволяющих оценить модель, определяем, насколько данные по всем прочим наблюдениям отличны от предсказанных моделью, и по величине отклонения относим к выбросам или правильным наблюдениям. Перебор всех возможных подвыборок слишком затратен, поэтому довольствуются случайным выбором, повторяемым достаточное число раз. Выборка, дающая наименьшее число выбросов, считается содержащей только правильные наблюдения. Варианты метода учитывают также значения отклонений для не-выбросов или ограничивают случайность выбора, рандомно беря одну точку, а остальные из её окрестности. Когда получена, после достаточного числа испытаний, выборка с наименьшим числом выбросов, можно получить оценку обычными методами оценивания, используя все наблюдения, кроме выбросов.
В представленном выше примере оценивание промежуточных моделей сведётся к проведению прямых через 2 точки, а отнесение прочих, кроме этих двух, наблюдений к выбросах или к не-выбросам, будет основываться на отклонении от этих прямых. Выборки, в которые попадёт первая точка, будут давать большие отклонения для почти всех прочих точек, которые для данной "гипотезы" будут расцениваться, как выбросы. Выборки, в которые первая точка не попадёт, будут давать большие отклонения лишь для этой точки. В результате первая точка будет классифицирована, как выброс, и из дальнейшего оценивания исключена.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 2 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group