2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 метод к-ближайших соседей для оценки плотности вероятности
Сообщение03.06.2013, 11:31 
Аватара пользователя
Помогите понять как работает метод к-ближайших соседей для оценивания плотности вероятности??!!!
Ответ как я вижу в учебнике должен быть как на рисунке. Как получаеются синие линии на картинке??
Изображение

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение03.06.2013, 11:47 
Аватара пользователя
Это-то ерунда: просто их кто-то нарисовал синей ручкой. А вот я слышал про настоящее чудо. Ехал мужик на ишаке, а ишак вдруг заупрямился и встал. Собрался народ, тянут, толкают - всё без толку. Тут подошёл один аксакал и тихо сказал что-то ишаку на ухо. И тот пошёл.
Что он ему сказал?

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение03.06.2013, 13:09 
Аватара пользователя
Здесь читали?
http://gendocs.ru/v209/%D0%BB%D0%B5%D0% ... %B2?page=4

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение03.06.2013, 15:04 
Аватара пользователя
Крайне просто. Для каждой точки x находится отрезок такой, что в нём ровно k раблюдений из выборки (как правило, симметричный относительно точки x). В качестве оценки плотности наблюдения берётся величина, обратная длине отрезка. Поэтому для k=1 получаются разрывы в точках наблюдений (поскольку отрезок схлопывается в точку), а на прочих точках гипербола, зависящая от расстояния до ближайшей точки. Чем больше мы берём k, тем глаже кривая, и уже "ни одного разрыва".

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение04.06.2013, 00:19 
Аватара пользователя
Евгений Машеров в сообщении #732020 писал(а):
Крайне просто. Для каждой точки x находится отрезок такой, что в нём ровно k раблюдений из выборки (как правило, симметричный относительно точки x). В качестве оценки плотности наблюдения берётся величина, обратная длине отрезка. Поэтому для k=1 получаются разрывы в точках наблюдений (поскольку отрезок схлопывается в точку), а на прочих точках гипербола, зависящая от расстояния до ближайшей точки. Чем больше мы берём k, тем глаже кривая, и уже "ни одного разрыва".

Да, все верно, в нашем случае мы берем длинну отрезка в качестве объема.
Необходимо, что бы в отрезке находилось ровно к-наблюдений.У данной точки может быть к-отрезков, надо выбрать отрезок минимальной длинны.
Сейчас пытаюсь этот алгоритм напистать в матлабе,но что-то никак пока

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение04.06.2013, 12:35 
Аватара пользователя
получается,что надо построить график в зависимости от $V$.
Код:
for i = 1 : length(good)
V(i) = ....
end
plot(good,V)

сейчас думаю, как правильно вычислить $V(i)$, так что бы это было минимальное $V(i)$ для $i$-oй точки,содержащий $k$ соседей

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение04.06.2013, 12:48 
Аватара пользователя
Какая-то встроенная сортировка у Вас там есть же? Ну и вот: сортируем $|x-x_i|$, берём k-й снизу.

 
 
 
 Re: метод к-ближайших соседей для оценки плотности вероятности
Сообщение10.06.2013, 21:12 
Аватара пользователя
спасибо!!

 
 
 [ Сообщений: 8 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group