2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Задачка по мат. статистике
Сообщение23.04.2014, 18:02 
Здравствуйте, уважаемые форумчане!

Имеется задачка по мат. статистике такого содержания:

Произведена выборка $90$ деталей из текущей продукции токарного автомата. Проверяемый размер деталей $X$ измерен с точностью до одного миллиметра. Результаты измерений приведены в таблице.

Требуется:

1) Построить статистическое распределение выборки.

По формуле Стерджеса находим длину частичного интервала: $$h = \frac{x_{\max} - x_{\min}}{1+\log_2{n}} = \frac{142.12 - 135.24}{1+\log_2{90}} \approx 0.91$$

Тогда $$x_{\text{нач}} = x_{\min} - \frac{h}{2} = 135.24 - \frac{0.91}{2} \approx 134.78$$

Разбиваем исходные данные на $$1+\log_2{90} \approx 7.49 \approx 8$$ интервалов (вообще, при округлении будет $7$, но $7$ не хватает для того, чтобы вместить все данные :?: ):
$$\begin{tabular}{| c | c | c | c | c | c | c | c | c |}
    \hline
    \text{Интервал} & [134.78;135.69) & [135.69;136.6) & [136.6;137.51) & [137.51;138.42) & [138.42;139.33) & [139.33;140.24) & [140.24;141.15) & [141.15;142.13)  \\ \hline
    \text{Частота} & 2 & 6 & 12 & 12 & 26 & 11 & 9 & 12  \\ \hline
    \text{Частность} & 0.02 & 0.07 & 0.13 & 0.13 & 0.29 & 0.12 & 0.1 & 0.13 \\ \hline
  \end{tabular}$$


Подскажите, пожалуйста, я на правильном пути?

PS. Не знаю почему, но латех обрезал табличку.

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:10 
Аватара пользователя
Ну, можно построить эмпирическую функцию распределения и без группировки. Если не лень. Только многовато будет значений - 90. (Кстати миллиметры - это сотые доли в данных? В чем же они измерены - в дециметрах?) Все зависит от задачи, для чего вы группируете?

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:15 
provincialka
Спасибо за ответ! Но ведь эмпирическая функция распределения - это что-то другое?

Насколько я понимаю, измерено все в сантиметрах, а миллиметры - десятые доли.

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:19 
Аватара пользователя
Хм, а зачем тогда сотые доли?
Limit79 в сообщении #853568 писал(а):
эмпирическая функция распределения - это что-то другое
По сравнению с чем? Что вы понимаете под "распределением"? Можно и так, как у вас, представить. Это эмпирический аналог плотности распределения. Опять повторю: все зависит от задачи. Ну, и от того, что понимается под "распределением" в курсе лекций или методичке :-)

Если вы потом хотите хи-квадрат применять, нужны группы, причем более "крупные", порядка 10 элементов. Если же Колмогорова, то группировка не применяется.

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:19 
provincialka в сообщении #853565 писал(а):
Все зависит от задачи, для чего вы группируете?

Просто написано: "Построить статистическое распределение выборки. ".

Следующие пункты задачи таковы:

2) Выполнить точечные оценки среднего значения $x$ и дисперсии $D (X)$ случайной величины $X$.
3) Построить гистограмму относительных частот, установив статистический (эмпирический закон распределения).
4) На том же чертеже построить кривую нормального распределения с параметрами $a = \overline x $ и $\sigma  = \sqrt {D(x)}$ и проанализировать пользуясь критерием Пирсона на уровне значимости $\alpha = 0,05$ согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки.

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:21 
Аватара пользователя
Ключевое слово здесь "критерий Пирсона", т.е. именно хи-квадрат. Да и "гистограмма"- это именно аналог плотности. Тогда делайте, как делали.

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:28 
provincialka в сообщении #853570 писал(а):
Хм, а зачем тогда сотые доли?

И правда странно, ведь "с точностью до миллиметра".

provincialka
"Построить статистическое распределение выборки" - это построить интервальный (в данном случае) статистический ряд, это та табличка, которую я написал.

Эмпирический закон распределения - это аналог функции распределения.

Это все, насколько я понимаю, может отличаться от правды :-(

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:30 
Аватара пользователя
Limit79 в сообщении #853582 писал(а):
насколько я понимаю, может отличаться от правды
А "правда" - это что такое? Зачем? Решайте, не тушуйтесь. В учебном примере не должно быть ничего заумного.

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 23:23 
provincialka
Попробую :)

А касательно этого:
Limit79 в сообщении #853441 писал(а):
Тогда $$x_{\text{нач}} = x_{\min} - \frac{h}{2} = 135.24 - \frac{0.91}{2} \approx 134.78$$

Разбиваем исходные данные на $$1+\log_2{90} \approx 7.49 \approx 8$$ интервалов (вообще, при округлении будет $7$, но $7$ не хватает для того, чтобы вместить все данные :?: ):

не могли бы, пожалуйста, подсказать?

 
 
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 23:29 
Аватара пользователя
Правило Стерджеса - это не догма, а руководство к действию. Округляйте! И длину интервалов, и их концы. В статистическом языке R есть даже такая команда pretty, она организует "красивые" интервалы.

 
 
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 18:34 
provincialka
Подскажите, пожалуйста, верно ли я понимаю, что:
Limit79 в сообщении #853574 писал(а):
2) Выполнить точечные оценки среднего значения $x$ и дисперсии $D (X)$ случайной величины $X$.


$$\overline{x} = \frac{1}{n} \sum\limits_{i=1}^{n} x_{i}$$
и
$$D(X) = \frac{1}{n-1} \sum\limits_{i=1}^{n} (x_{i}-\overline{x})^2$$
?

 
 
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 20:39 
Аватара пользователя
А в чем вопрос? Ясен пень, именно так. И дисперсия получается несмещенная. (Правда, я не говорю "выполнить оценку", а "найти оценку", ведь оценка в данном случае - число. Но это уже лингвистические изыски)

А вы что ли вручную делаете? В самом простом Excel все это запрограммировано. В том числе и подсчет частот.

 
 
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 21:00 
provincialka
В экселе куча всяких дисперсий, поэтому я считаю двумя способами: в экселе и полу-ручным, пока все сходится :-)

 
 
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 22:24 
provincialka
Я все доделал, вроде получилось все нормально; гипотеза не отвергается.

Спасибо Вам за помощь!

 
 
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 22:28 
Аватара пользователя
Limit79 в сообщении #854153 писал(а):
В экселе куча всяких дисперсий

Ну, некоторые "старые", для совместимости. Основные - "для генеральной совокупности", делится на $n$ и "выборочная", делится на $n-1$. По сути это смешенная и несмещенная оценки.

 
 
 [ Сообщений: 19 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group