2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 09:59 
Заслуженный участник
Аватара пользователя


11/03/08
9575
Москва
rabbit-a в сообщении #1153966 писал(а):
вот я как раз и спрашиваю, т.е. для того, чтобы выборка была не группирована нужно мне каждое повторяющееся значение считать за отдельное столько раз сколько оно повторяется, так?

(Оффтоп)

Восстановление девственностинегрупированности какое-то. Обмануть женихакритерий, требующий негруппированных данных, так получится, а правильно посчитать - нет


-- 24 сен 2016, 10:04 --

Вы, верно, расширительно трактуете рекомендацию из ГОСТа про критерий Шапиро-Уилка, в которой предлагается при наличии нескольких наблюдений с одинаковыми значениями рассматривать не как одно, а как несколько одинаковых. Но это именно когда у Вас реально измеряли и получили одинаковые цифры. А не сгруппировали, а потом взялись расшивать обратно. Или у Вас вообще измерения с такой грубой шкалой? Или вовсе дискретные? В первом случае проверка нормальности крайне затруднена, а если возможна - то скорее я бы употребил $\chi^2$-критерий, во втором - там точно не нормальное, оно непрерывное распределение.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 11:08 
Аватара пользователя


21/01/09
3923
Дивногорск
Евгений Машеров в сообщении #1154235 писал(а):
А не сгруппировали, а потом взялись расшивать обратно.

Можно и расшить, считая что внутри интервала распределение равномерное. Для небольших интервалов ошибка небольшая.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 11:47 
Заслуженный участник
Аватара пользователя


11/03/08
9575
Москва
Скажем так - это приём из разряда "Если нельзя, но очень хочется, то можно". Способ хоть что-то получить, если невозможно действовать правильно. Но я покамест не убеждён, что негруппированных данных здесь вовсе нет.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 13:09 
Аватара пользователя


21/01/09
3923
Дивногорск
Евгений Машеров в сообщении #1154240 писал(а):
Скажем так - это приём из разряда "Если нельзя, но очень хочется, то можно".

Скорее, если нельзя отыграть обратно, но нужно, то пытаются минимизировать ущерб от этого.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 17:43 
Аватара пользователя


03/06/13
116
Екатеринбург
Именно таки изначально выборка негруппированная: имеется 47 значений, среди них есть повторяющиеся. Если Вам интересен экономический смысл задачи, то $t_i$ - это время заполнения бункера (мин), но в каждом замере посчитаны оно с точностью до минуты, поэтому я считаю что имею дело с дискретной случайной величиной, а не непрерывной. А вот как раз интервалы я вводил условно, например возле 47 брал интервал $(46,5; 47,5)$ исходя из соображений равномерности. Сейчас я пересчитываю еще раз в соответствии с ГОСТом считая повторяющиеся значения каждое по отдельности. Вас видимо ввело в заблуждение когда я написал "для того чтобы выборка была негруппирована" (потому что я никогда раньше не имел дела с методами, требующими негрупированную выборку). То что оно ненормальное, я убедился, хотя пока расчеты по ГОСТу не закончил (но там все равно в 100 раз расходится W и $W_{\text{кр}}$), а вот как Вы поняли что оно непрерывное?!

Александрович, давайте я постараюсь сначала разобраться с видом распределения, а уж потом, если хотите посчитаю по $\chi^2$-критерию.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение26.09.2016, 05:42 
Заслуженный участник
Аватара пользователя


23/11/06
4171
rabbit-a в сообщении #1154313 писал(а):
а вот как Вы поняли что оно непрерывное?!

Кто "оно"? Нормальное? Нормальное непрерывно по определению.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 11:47 
Аватара пользователя


03/06/13
116
Екатеринбург
А Вы все-таки считаете, несмотря на вычисления, что у меня нормальное распределение?

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 12:13 
Заслуженный участник
Аватара пользователя


23/11/06
4171
rabbit-a в сообщении #1155101 писал(а):
А Вы все-таки считаете, несмотря на вычисления, что у меня нормальное распределение?

Нет, я считаю, что Вы просто неправильно поняли фразу.
Евгений Машеров в сообщении #1154235 писал(а):
во втором - там точно не нормальное, оно непрерывное распределение.


К тому же, вычислений в теме никаких нет. Если не считать вот этой фразы, которую я до сих пор не понимаю:
rabbit-a в сообщении #1153932 писал(а):
но $\beta_2=3,008>3$ а согласно ГОСТу должно быть меньше трех, так что мне теперь нельзя пользоваться критерием Шапира-Уилка, а нужно что ли критерием Эппса-Палли?? Или все равно можно Шапиро-Уилка?

Для нормального распределения $\beta_2=3$ (формула (4) в ГОСТе). Если Вы получили выборочное значение "кривизны", то это обозначено в ГОСТе как $b_2$. И ни слова в описании критерия Шапиро - Уилка про эти величины нет. Где конкретно в ГОСТЕ написано, что что-то "должно быть меньше трёх"?

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 13:00 
Аватара пользователя


03/06/13
116
Екатеринбург
1.А как правильно понять фразу:
Евгений Машеров в сообщении #1154235 писал(а):

"во втором - там точно не нормальное, оно непрерывное распределение."?? Может быть Вы сможете пояснить смысл этой фразы?
2.
8.1.2 В настоящем стандарте представлены два многосторонних критерия: Шапиро-Уилка и Эппса-Палли. Критерий Шапиро-Уилка выбирают, когда на основе исходных данных можно выбрать альтернативную гипотезу следующего вида: примерно симметричное распределение с убывающей кривизной (то есть $|\sqrt {\beta_1}|<1/2$ и $\beta_2<3$) или асимметричное распределение ($|\sqrt{\beta_1}>1/2}$), в противном случае выбирают критерий Эппса-Палли.

Мы с Вами читаем разные тексты? Вы не знакомы с греческим алфавитом?

Я уже трижды в теме спрашивал как показать вычисления сделанные в excel - ответа не получил ни одного, как Вы хотите увидеть вычисления, если здесь нет возможности их выложить (или я не знаю как это сделать и мне пока никто не объяснил как это сделать)??
А вот согласно критерию Шапиро-Уилка у меня получилось $W_{\text{кр}}=0,946$ все тот же документ
Евгений Машеров в сообщении #1153588 писал(а):

Для метода Шапиро-Уилка нужны негруппированные данные.
http://docs.cntd.ru/document/1200029041

таблица 11, $n=47$ 4-ая строчка с конца , 3-й стобец (уровень значимости 0,05).
статистика $W=2,0081$ поэтому гипотезу о нормальном распределении отклонять не нужно и, значит, Евгений Машеров все-таки ошибся и распределение нормальное.

цитата: " Поскольку это значение менее значения W, то нулевая гипотеза о нормальном распределении не отклоняется при уровне значимости $\alpha=0,05$" - самое последнее предложение в пункте 8.2 все этот же документ
Евгений Машеров в сообщении #1153588 писал(а):

Для метода Шапиро-Уилка нужны негруппированные данные.
http://docs.cntd.ru/document/1200029041














 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:18 
Заслуженный участник
Аватара пользователя


18/01/13
12044
Казань
rabbit-a в сообщении #1155118 писал(а):
1.А как правильно понять фразу:
"во втором - там точно не нормальное, оно непрерывное распределение."??

Нормальное распределение является непрерывным. Если некое распределение -- не непрерывно, то оно и не нормально.

Дискретное распределение нормальным быть не может.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:19 


20/03/14
12041
 !  rabbit-a
Замечание за погрешности цитирования:
1. Пользуйтесь кнопками "Цитата" или "Вставка", последней для выборочного цитирования выделенного фрагмента.
2. Избегайте избыточного цитирования.
3. Оформляйте внимательнее, в результате Вы приписываете собеседнику свои слова и разобраться вообще невозможно.

rabbit-a в сообщении #1155118 писал(а):
Я уже трижды в теме спрашивал как показать вычисления сделанные в excel - ответа не получил ни одного, как Вы хотите увидеть вычисления, если здесь нет возможности их выложить (или я не знаю как это сделать и мне пока никто не объяснил как это сделать)??
Потому что не надо задавать технические вопросы в теме. Есть вопросы по оформлению - задайте модераторам в ЛС.
Вычисления в Excel можно, если они хорошо оформлены, отскринить и выложить картинкой.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:26 
Аватара пользователя


21/01/09
3923
Дивногорск
provincialka в сообщении #1155142 писал(а):
Нормальное распределение является непрерывным. Если некое распределение -- не непрерывно, то оно и не нормально.

Но ведь нормально-распределённая св может иметь дискретное представление.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:29 
Заслуженный участник
Аватара пользователя


18/01/13
12044
Казань
Александрович
Я только "переводила" высказывание Евгений Машеров. Все претензии к нему!

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 16:11 
Заслуженный участник
Аватара пользователя


11/03/08
9575
Москва
Перевожу сам. Приведены частости целочисленных значений. Тут может быть два варианта. Либо измеряемая величина целочисленная, и тогда говорить о нормальном распределении вообще бессмысленно. Оно непрерывно. Либо величина непрерывная, может иметь и нормальное распределение, но её очень грубо дискретизовали, так что коллизии, совпадения значений стали не редким исключением, а нормальным явлением. В этом случае статистические тесты применять можно, но учитывая эту дискретизацию. В частности, тест Шапиро-Уилка использует порядковые статистики, и на таких данных работать вряд ли будет. Есть приём, позволяющий применять такие тесты, когда есть совпадающие значения (считать их разными), но потерянную при грубой дискретизации информацию это не восстанавливает, и приём допустим, когда таких повторений мало, а если их много - это не исследование, а имитация его. Если их много - лучше воспользоваться критерием, изначально основанным на группировке данных, тем же хи-квадратом.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 16:50 
Заслуженный участник
Аватара пользователя


23/11/06
4171
rabbit-a в сообщении #1155118 писал(а):
8.1.2 В настоящем стандарте представлены два многосторонних критерия: Шапиро-Уилка и Эппса-Палли. Критерий Шапиро-Уилка выбирают, когда на основе исходных данных можно выбрать альтернативную гипотезу следующего вида: примерно симметричное распределение с убывающей кривизной (то есть $|\sqrt {\beta_1}|<1/2$ и $\beta_2<3$) или асимметричное распределение ($|\sqrt{\beta_1}|>1/2$), в противном случае выбирают критерий Эппса-Палли.

Мы с Вами читаем разные тексты? Вы не знакомы с греческим алфавитом?


Речь идёт о том, какое распределение представляется альтернативой проверяемой гипотезе нормальности. Числа $\beta_1$ и $\beta_2$ (греческие буковки) - это теоретические характеристики предполагаемого альтернативного распределения. Вычисленные по выборке значения $b_1$ и $b_2$ (латинские, а не греческие) есть их оценки, причём не очень точные в силу грубости округления выборки и её малочисленности. Поэтому обращать внимание на то, что $3,008>3$, нет никакого смысла. Да и запрета тут никакого нет. Наверняка критерий просто будет иметь плохую мощность, если альтернативное распределение не обладает описанными свойствами. То есть будет часто принимать ненормальное распределение за нормальное. Но у Вас-то, если верить Вашим словам, гипотеза нормальности отвергается!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 52 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group