2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 нормализация графика
Сообщение18.06.2014, 10:12 
Аватара пользователя
Всем привет! У меня вопрос. Есть график функции распределения вероятности(метод k nearest neighbor), необходимо нормализировать график таким образом, чтобы площадь под графиком была равна единице.
Не могу найти в инете алгоримт,как это можно сделать. Подскажите, пожалуйста.


Изображение

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 10:54 
Абстрактно-бесполезный совет: численно найти интеграл имеющейся "функции распределения" на всей области определения, после чего все значения функции во всех точках разделить на полученную величину.

Абстрактность связана с тем, что численное интегрирование изображенного на верхней картинке может быть проблемой. Возможно, стоит подумать, как обеспечить нормировку заранее.

P.S. Этот метод в русском языке обычно принято называть "методом ближайших соседей".

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 11:06 
Аватара пользователя
Pphantom в сообщении #876705 писал(а):
Абстрактно-бесполезный совет: численно найти интеграл имеющейся "функции распределения" на всей области определения, после чего все значения функции во всех точках разделить на полученную величину.

Абстрактность связана с тем, что численное интегрирование изображенного на верхней картинке может быть проблемой. Возможно, стоит подумать, как обеспечить нормировку заранее.

P.S. Этот метод в русском языке обычно принято называть "методом ближайших соседей".


да, как раз проблема в том,как бы сделать нормировку заранее, то есть получается сдалать нормировку выборки?

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 11:12 
antoshka1303 в сообщении #876707 писал(а):
да, как раз проблема в том,как бы сделать нормировку заранее, то есть получается сдалать нормировку выборки?
Давайте тогда подробнее: функцию распределения чего Вы получаете и - в деталях - каким образом? Метод ближайших соседей все-таки предназначен для классификации...

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 11:44 
Аватара пользователя
Pphantom в сообщении #876708 писал(а):
antoshka1303 в сообщении #876707 писал(а):
да, как раз проблема в том,как бы сделать нормировку заранее, то есть получается сдалать нормировку выборки?
Давайте тогда подробнее: функцию распределения чего Вы получаете и - в деталях - каким образом? Метод ближайших соседей все-таки предназначен для классификации...

не совсем. У меня есть выборка данных,мне надо понять какое распрелением она является.(точки выборки отмечены на оси ОХ). Я применяю метод ближайших соседей, чтобы получить функцию распреления вероятности.
Я использую книжу Bishop Pattern-Recognition and Machine Learning.
http://www.hua.edu.vn/khoa/fita/wp-cont ... Bishop.pdf В ней указан на стр.125 метод, как при помощи метода ближайших соседей построить график вероятности. Профессор сказал, что график надо нормализировать, так, чтобы интеграл под графиком был равен единице.

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 11:52 
Аватара пользователя
А по оси $0Y$ что?

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 11:57 
Аватара пользователя
Александрович в сообщении #876718 писал(а):
А по оси $0Y$ что?

$p(x\left| {{C_k}} \right.) = \frac{{{K_k}}}{{{N_k}V}}$ У меня график для разных вариантов количества ближайших соседей.

 
 
 
 Re: нормализация графика
Сообщение18.06.2014, 23:08 
Вообще говоря, из того, что написано в этой книге (в частности, в подписи к рис.2.26) следует, что функция, которую Вы строите, не является плотностью вероятности (домноженной на что-то) даже для достаточно больших значений $k$. При этом способ нормировки как-то неочевиден.

Пожалуй, я бы сказал, что в книге убедительно показано, что методом пользоваться нельзя. А если все же очень хочется, то полученные данные стоит сглаживать, причем каким-то примерно таким методом: берем некую точку в распределении и в качестве значения ненормированной плотности в ней используем минимум по некоторой окрестности этой точки. Потом получившуюся более гладкую зависимость уже численно интегрируем.

 
 
 [ Сообщений: 8 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group