2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 15:23 


16/01/12
131
Приветствую всех!

Мне необходимо выдвинуть гипотезу о виде модели, аппроксимирующей эмпирическое распределение, обосновав выбор.
и используя критерий Пирсона, на уровне значимости а=0,05, проверить гипотезу о том, что случайная величина X – распределена по нормальному закону.


Как я понял,выдвинуть гипотезу -это сделать обоснованный выбор в пользу определённого теоретического распределения.

Поэтому я построил гистограмму, на которой видно,я что распределение близко к нормальному.

Кроме того,я вычислил статистики.
Изображение
{\alpha _1} = \frac{{\sum\limits_{i = 1}^k {{m_i}{x_i}} }}{n} = \frac{{10050}}{{100}} = 100,5;
{\alpha _2} = \frac{{\sum\limits_{i = 1}^k {{m_i}x_i^2} }}{n} = \frac{{1169100}}{{100}} = 11691
{\alpha _3} = \frac{{\sum\limits_{i = 1}^k {{m_i}x_i^3} }}{n} = \frac{{146846250}}{{100}} = 1468462,5
{\alpha _4} = \frac{{\sum\limits_{i = 1}^k {{m_i}x_i^4} }}{n} = \frac{{3122482500}}{{100}} = 31224825
\overline x  = {\alpha _1} = 100,5
{S^2} = {\alpha _2} - \alpha _1^2 = 11691 - {100,5^2} = 1590,75
S = \sqrt {{S^2}}  \approx 39,88
v = \frac{S}{{\overline x }} \times 100\%  \approx 39,68\%
\widetilde A = \frac{{{\mu _3}}}{{{S^3}}} = \frac{{{\alpha _3} - 3{\alpha _1}{\alpha _2} + 2\alpha _1^3}}{{{S^3}}} = \frac{{1468462,5 - 3 \times 100,5 \times 11691 + 2 \times {{100,5}^3}}}{{{{39,88}^3}}} \approx  - 0,41
\widetilde E = \frac{{{\mu _4}}}{{{S^4}}} - 3 = \frac{{{\alpha _4} - 4{\alpha _3}{\alpha _1} + 6{\alpha _2}\alpha _1^2 - 3\alpha _1^4}}{{{S^4}}} = - 64,54

Как видно эксцесс равен -64,хотя у эксцесса нормального распределения он должен стремится к нулю,а кроме того в свойствах эксцесса указанно что он может принимать значения от (-2;+бесконечности)
Где я ошибся?

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 15:53 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Четвёртый момент пересчитайте.

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 17:07 


16/01/12
131
--mS-- в сообщении #655824 писал(а):
Четвёртый момент пересчитайте.


благодарю вас, эксцесс получился -0,34. Это уже более похоже на истину.

Следующий момент:
теоретическое распределение я принял за нормальное. Его плотность:
$f(x) = \frac{1}{{\sigma \sqrt {2\pi } }}{e^{ - \frac{{{{\left( {x - a} \right)}^2}}}{{2{\sigma ^2}}}}}$

нужно найти с помощью метода статистик параметры a и сигма.
сигма = среднеквадратичное отклонение = 39,88.
а как найти параметр a - это матожидание.?

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 18:36 
Заслуженный участник
Аватара пользователя


23/11/06
4171
"Найти" параметры ни по какой конечной выборке не удастся. Найти можно только оценки для этих параметров.

Любой выборочный момент является несмещённой и состоятельной оценкой для соответствующего истинного момента. Т.е. оценивать первый истинный момент (aka математическое ожидание) в данном случае следует первым выборочным моментом (выборочным средним).

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 18:44 


16/01/12
131
--mS-- в сообщении #655893 писал(а):
"Найти" параметры ни по какой конечной выборке не удастся. Найти можно только оценки для этих параметров.

Любой выборочный момент является несмещённой и состоятельной оценкой для соответствующего истинного момента. Т.е. оценивать первый истинный момент (aka математическое ожидание) в данном случае следует первым выборочным моментом (выборочным средним).


хорошо,а среднеквадратичное отклонение тогда как найти?

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 19:00 
Заслуженный участник
Аватара пользователя


23/11/06
4171
А его и нельзя найти, можно только оценить - например, как Вы и сделали, корнем из выборочной дисперсии.

Вы бросаете монету (кривую-косую) 10 раз. Герб выпадает 6 раз. Как полагаете, можно по этим данным найти вероятность выпадения герба?

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 19:23 


16/01/12
131
--mS-- в сообщении #655901 писал(а):
А его и нельзя найти, можно только оценить - например, как Вы и сделали, корнем из выборочной дисперсии.

Вы бросаете монету (кривую-косую) 10 раз. Герб выпадает 6 раз. Как полагаете, можно по этим данным найти вероятность выпадения герба?


ясно,благодарю за комментарий. насколько я понял в Excel нужно искать плотность вероятности теоретического распределения:
то есть форумла будет следующая
Код:
=НОРМРАСП (x;100,5;39,88;0).

я правильно понял,что x- это середина интервалов моей гистограммы?И вообще что мне лучше (для более точных расчётов) взять- середины интервалов или концы интервалов?

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 20:24 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Vader87 в сообщении #655910 писал(а):
я правильно понял,что x- это середина интервалов моей гистограммы?И вообще что мне лучше (для более точных расчётов) взять- середины интервалов или концы интервалов?


Вообще-то в критерии Пирсона участвуют вероятности попадания в интервалы. Поэтому следует для всех интервалов, кроме крайних, вычислять разности нормальной функции распределения в концах, а для крайних интервалов продлить их границы до плюс/минус бесконечности, т.е. для первого интервала брать просто функцию распределения от его правого конца, для последнего интервала - единица минус функция распределения в его левом конце.

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 20:40 
Аватара пользователя


21/01/09
3923
Дивногорск
Vader87 в сообщении #655910 писал(а):
насколько я понял в Excel нужно искать плотность вероятности теоретического распределения:
то есть форумла будет следующая
Код:
=НОРМРАСП (x;100,5;39,88;0).

я правильно понял,что x- это середина интервалов моей гистограммы?И вообще что мне лучше (для более точных расчётов) взять- середины интервалов или концы интервалов?

Нужно брать концы и разность интегральных функций,
Код:
НОРМРАСП (x;100,5;х;1)

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 21:58 
Заморожен


14/09/10
72
Vader87 в сообщении #655897 писал(а):
среднеквадратичное отклонение тогда как найти?
При вычислении статистики критерия Пирсона следует использовать оценки параметров, найденные методом минимума $\chi^2$ или им асимптотически эквивалентные оценки. Выборочную дисперсию и выборочное среднее, найденные по группированной выборке, использовать нельзя. Метод получения м.о.м.п. приведен в п.2. сообщения Проверка нормальности при помощи критерия типа $\chi^2$. (Это сообщение я набирал в спешке после работы. В нем несколько очевидных опечаток, грамматических ошибок и язык «птичий», но при желании смысл понять можно, ссылки там присутствуют.)
Запрограммировать алгоритм можно на VBA в MS Office Excel, или на любом другом языке, содержащем функцию ошибок или функцию нормального распределения. При спользовании Turbo Pascal (в библиотеке нет функции ошибок) можно воспользоваться http://alglib.sources.ru/... normal.php.

[Если разбиение задается на основе оценок максимального правдоподобия, найденных по исходной (негруппированной) выборке, то, при использовании функции ошибок из указанной выше библиотеки, сходимость хорошая.]

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 22:22 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Andrew Gubarev в сообщении #655965 писал(а):
Выборочную дисперсию и выборочное среднее, найденные по группированной выборке, использовать нельзя.

См. Г.Крамер "Математические методы статистики", пример 2, пункт 30.4. Да и в ситуации, когда проверяемая гипотеза будет принята с такими оценками, она тем более будет принята с оценками по методу минимума хи-квадрат.

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 22:41 
Заморожен


14/09/10
72
В примере 2 п. 30.4 ММС Г. Крамера доказательство асимптотической эквивалентности оценок не приводится. И я сильно сомневаюсь, что оно может быть приведено. Поправки Шеппарда дело не исправляют. Более того, тестируя рекомендации Крамера, путем генерации выборок, получим, что при разумных объемах выборки (100–500) они ложны. Вообще, русское издание 1976 г — это перепечатка издания 1948 г. А основные результаты о критерии $\chi^2$ были получены позже, в 50–70-ые годы. Так что, ссылаться на Крамера — смысла нет.

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение08.12.2012, 23:00 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Всё равно не вижу смысла городить огород, если критерий принимает гипотезу.

 Профиль  
                  
 
 Re: Проверка гипотезы о нормальном законе распределения
Сообщение09.12.2012, 07:50 


16/01/12
131
--mS-- в сообщении #655985 писал(а):
Всё равно не вижу смысла городить огород, если критерий принимает гипотезу.



благодарю всех,я разобрался с данным вопросом
Действительно гипотеза принимается по уровню значимости 0,05. (хотя это было видно уже на гистограмме и по данным асимметрии и эксцесса).


Теперь возник самый последний вопрос - как одновременно изобразить теоретическую кривую и гистограмму на одном графике?

гистограмму нарисовать отдельно могу,график вроде тоже,но вместе какое уродство получается.
Пробовал и стандартными способами (то есть 3 колонки с данными превратить в гистограммы,а потом последнюю превратить в график)и через нестандартную диаграмму график-гистограмма.
Чё-то хрень какая-то получается

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 14 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group