2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Задачка по мат. статистике
Сообщение23.04.2014, 18:02 


29/08/11
1759
Здравствуйте, уважаемые форумчане!

Имеется задачка по мат. статистике такого содержания:

Произведена выборка $90$ деталей из текущей продукции токарного автомата. Проверяемый размер деталей $X$ измерен с точностью до одного миллиметра. Результаты измерений приведены в таблице.

Требуется:

1) Построить статистическое распределение выборки.

По формуле Стерджеса находим длину частичного интервала: $$h = \frac{x_{\max} - x_{\min}}{1+\log_2{n}} = \frac{142.12 - 135.24}{1+\log_2{90}} \approx 0.91$$

Тогда $$x_{\text{нач}} = x_{\min} - \frac{h}{2} = 135.24 - \frac{0.91}{2} \approx 134.78$$

Разбиваем исходные данные на $$1+\log_2{90} \approx 7.49 \approx 8$$ интервалов (вообще, при округлении будет $7$, но $7$ не хватает для того, чтобы вместить все данные :?: ):
$$\begin{tabular}{| c | c | c | c | c | c | c | c | c |}
    \hline
    \text{Интервал} & [134.78;135.69) & [135.69;136.6) & [136.6;137.51) & [137.51;138.42) & [138.42;139.33) & [139.33;140.24) & [140.24;141.15) & [141.15;142.13)  \\ \hline
    \text{Частота} & 2 & 6 & 12 & 12 & 26 & 11 & 9 & 12  \\ \hline
    \text{Частность} & 0.02 & 0.07 & 0.13 & 0.13 & 0.29 & 0.12 & 0.1 & 0.13 \\ \hline
  \end{tabular}$$


Подскажите, пожалуйста, я на правильном пути?

PS. Не знаю почему, но латех обрезал табличку.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:10 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Ну, можно построить эмпирическую функцию распределения и без группировки. Если не лень. Только многовато будет значений - 90. (Кстати миллиметры - это сотые доли в данных? В чем же они измерены - в дециметрах?) Все зависит от задачи, для чего вы группируете?

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:15 


29/08/11
1759
provincialka
Спасибо за ответ! Но ведь эмпирическая функция распределения - это что-то другое?

Насколько я понимаю, измерено все в сантиметрах, а миллиметры - десятые доли.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:19 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Хм, а зачем тогда сотые доли?
Limit79 в сообщении #853568 писал(а):
эмпирическая функция распределения - это что-то другое
По сравнению с чем? Что вы понимаете под "распределением"? Можно и так, как у вас, представить. Это эмпирический аналог плотности распределения. Опять повторю: все зависит от задачи. Ну, и от того, что понимается под "распределением" в курсе лекций или методичке :-)

Если вы потом хотите хи-квадрат применять, нужны группы, причем более "крупные", порядка 10 элементов. Если же Колмогорова, то группировка не применяется.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:19 


29/08/11
1759
provincialka в сообщении #853565 писал(а):
Все зависит от задачи, для чего вы группируете?

Просто написано: "Построить статистическое распределение выборки. ".

Следующие пункты задачи таковы:

2) Выполнить точечные оценки среднего значения $x$ и дисперсии $D (X)$ случайной величины $X$.
3) Построить гистограмму относительных частот, установив статистический (эмпирический закон распределения).
4) На том же чертеже построить кривую нормального распределения с параметрами $a = \overline x $ и $\sigma  = \sqrt {D(x)}$ и проанализировать пользуясь критерием Пирсона на уровне значимости $\alpha = 0,05$ согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:21 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Ключевое слово здесь "критерий Пирсона", т.е. именно хи-квадрат. Да и "гистограмма"- это именно аналог плотности. Тогда делайте, как делали.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:28 


29/08/11
1759
provincialka в сообщении #853570 писал(а):
Хм, а зачем тогда сотые доли?

И правда странно, ведь "с точностью до миллиметра".

provincialka
"Построить статистическое распределение выборки" - это построить интервальный (в данном случае) статистический ряд, это та табличка, которую я написал.

Эмпирический закон распределения - это аналог функции распределения.

Это все, насколько я понимаю, может отличаться от правды :-(

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 22:30 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Limit79 в сообщении #853582 писал(а):
насколько я понимаю, может отличаться от правды
А "правда" - это что такое? Зачем? Решайте, не тушуйтесь. В учебном примере не должно быть ничего заумного.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 23:23 


29/08/11
1759
provincialka
Попробую :)

А касательно этого:
Limit79 в сообщении #853441 писал(а):
Тогда $$x_{\text{нач}} = x_{\min} - \frac{h}{2} = 135.24 - \frac{0.91}{2} \approx 134.78$$

Разбиваем исходные данные на $$1+\log_2{90} \approx 7.49 \approx 8$$ интервалов (вообще, при округлении будет $7$, но $7$ не хватает для того, чтобы вместить все данные :?: ):

не могли бы, пожалуйста, подсказать?

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение23.04.2014, 23:29 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Правило Стерджеса - это не догма, а руководство к действию. Округляйте! И длину интервалов, и их концы. В статистическом языке R есть даже такая команда pretty, она организует "красивые" интервалы.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 18:34 


29/08/11
1759
provincialka
Подскажите, пожалуйста, верно ли я понимаю, что:
Limit79 в сообщении #853574 писал(а):
2) Выполнить точечные оценки среднего значения $x$ и дисперсии $D (X)$ случайной величины $X$.


$$\overline{x} = \frac{1}{n} \sum\limits_{i=1}^{n} x_{i}$$
и
$$D(X) = \frac{1}{n-1} \sum\limits_{i=1}^{n} (x_{i}-\overline{x})^2$$
?

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 20:39 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
А в чем вопрос? Ясен пень, именно так. И дисперсия получается несмещенная. (Правда, я не говорю "выполнить оценку", а "найти оценку", ведь оценка в данном случае - число. Но это уже лингвистические изыски)

А вы что ли вручную делаете? В самом простом Excel все это запрограммировано. В том числе и подсчет частот.

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 21:00 


29/08/11
1759
provincialka
В экселе куча всяких дисперсий, поэтому я считаю двумя способами: в экселе и полу-ручным, пока все сходится :-)

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 22:24 


29/08/11
1759
provincialka
Я все доделал, вроде получилось все нормально; гипотеза не отвергается.

Спасибо Вам за помощь!

 Профиль  
                  
 
 Re: Задачка по мат. статистике
Сообщение24.04.2014, 22:28 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Limit79 в сообщении #854153 писал(а):
В экселе куча всяких дисперсий

Ну, некоторые "старые", для совместимости. Основные - "для генеральной совокупности", делится на $n$ и "выборочная", делится на $n-1$. По сути это смешенная и несмещенная оценки.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 19 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group