2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Матстатистика, длина интервала
Сообщение19.01.2014, 22:53 
Здравствуйте! Что-то не сходятся границы интервалов.

Есть выборка из $n=100$ значений. $x_{min}=404, x_{max}=429$

По формуле Стерджесса $h=\dfrac{x_{max}-x_{min}}{1+3,2\lg 100}=3,378387$

Изображение

что-то как-то криво получилось с последним интервалом. Может ли быть такое?

 
 
 
 Re: Матстатистика, длина интервала
Сообщение19.01.2014, 23:07 
Насколько я понял за пару секунд гугления, формула Стерджесса определяет количество интервалов, на которые разбивается диапазон выборки для построения гистограммы, число натуральное, если нет - берем округление.

 
 
 
 Re: Матстатистика, длина интервала
Сообщение20.01.2014, 14:29 
_Ivana в сообщении #816804 писал(а):
Насколько я понял за пару секунд гугления, формула Стерджесса определяет количество интервалов, на которые разбивается диапазон выборки для построения гистограммы, число натуральное, если нет - берем округление.


Спасибо. То есть здесь написано неверно в методичке?

Изображение

 
 
 
 Re: Матстатистика, длина интервала
Сообщение20.01.2014, 15:18 
Смотря как воспринимать эту формулу :-) . Я бы для красоты добавил в знаменатель округление вверх до ближайшего целого. Ваш знаменатель равен 7.4 - это количество интервалов, на которые разбивается диапазон выборки. Формула дает приблизительное его значение, вы должны по ней взять 8 интервалов и честно разбить диапазон на них. А вы, применяя формулу методички "в лоб", пытаетесь разбить диапазон на нецелое количество интервалов - и получаете прогнозируемый результат: несовпадение границ.

 
 
 
 Re: Матстатистика, длина интервала
Сообщение20.01.2014, 19:09 
_Ivana в сообщении #816960 писал(а):
Смотря как воспринимать эту формулу :-) . Я бы для красоты добавил в знаменатель округление вверх до ближайшего целого. Ваш знаменатель равен 7.4 - это количество интервалов, на которые разбивается диапазон выборки. Формула дает приблизительное его значение, вы должны по ней взять 8 интервалов и честно разбить диапазон на них. А вы, применяя формулу методички "в лоб", пытаетесь разбить диапазон на нецелое количество интервалов - и получаете прогнозируемый результат: несовпадение границ.

Спасибо, а почему 8, а не 7? Округляется же в меньшую сторону не? ну и если взять целую часть от $7,4$, получим 7.

 
 
 
 Re: Матстатистика, длина интервала
Сообщение20.01.2014, 20:29 
Аватара пользователя
Да как хотите, так и берите. Это же приближенная формула. Просто рекомендация. Можете и 6 взять. И 10.

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group