2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 09:59 
Заслуженный участник
Аватара пользователя


11/03/08
10031
Москва
rabbit-a в сообщении #1153966 писал(а):
вот я как раз и спрашиваю, т.е. для того, чтобы выборка была не группирована нужно мне каждое повторяющееся значение считать за отдельное столько раз сколько оно повторяется, так?

(Оффтоп)

Восстановление девственностинегрупированности какое-то. Обмануть женихакритерий, требующий негруппированных данных, так получится, а правильно посчитать - нет


-- 24 сен 2016, 10:04 --

Вы, верно, расширительно трактуете рекомендацию из ГОСТа про критерий Шапиро-Уилка, в которой предлагается при наличии нескольких наблюдений с одинаковыми значениями рассматривать не как одно, а как несколько одинаковых. Но это именно когда у Вас реально измеряли и получили одинаковые цифры. А не сгруппировали, а потом взялись расшивать обратно. Или у Вас вообще измерения с такой грубой шкалой? Или вовсе дискретные? В первом случае проверка нормальности крайне затруднена, а если возможна - то скорее я бы употребил $\chi^2$-критерий, во втором - там точно не нормальное, оно непрерывное распределение.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 11:08 
Аватара пользователя


21/01/09
3929
Дивногорск
Евгений Машеров в сообщении #1154235 писал(а):
А не сгруппировали, а потом взялись расшивать обратно.

Можно и расшить, считая что внутри интервала распределение равномерное. Для небольших интервалов ошибка небольшая.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 11:47 
Заслуженный участник
Аватара пользователя


11/03/08
10031
Москва
Скажем так - это приём из разряда "Если нельзя, но очень хочется, то можно". Способ хоть что-то получить, если невозможно действовать правильно. Но я покамест не убеждён, что негруппированных данных здесь вовсе нет.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 13:09 
Аватара пользователя


21/01/09
3929
Дивногорск
Евгений Машеров в сообщении #1154240 писал(а):
Скажем так - это приём из разряда "Если нельзя, но очень хочется, то можно".

Скорее, если нельзя отыграть обратно, но нужно, то пытаются минимизировать ущерб от этого.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение24.09.2016, 17:43 
Аватара пользователя


03/06/13
116
Екатеринбург
Именно таки изначально выборка негруппированная: имеется 47 значений, среди них есть повторяющиеся. Если Вам интересен экономический смысл задачи, то $t_i$ - это время заполнения бункера (мин), но в каждом замере посчитаны оно с точностью до минуты, поэтому я считаю что имею дело с дискретной случайной величиной, а не непрерывной. А вот как раз интервалы я вводил условно, например возле 47 брал интервал $(46,5; 47,5)$ исходя из соображений равномерности. Сейчас я пересчитываю еще раз в соответствии с ГОСТом считая повторяющиеся значения каждое по отдельности. Вас видимо ввело в заблуждение когда я написал "для того чтобы выборка была негруппирована" (потому что я никогда раньше не имел дела с методами, требующими негрупированную выборку). То что оно ненормальное, я убедился, хотя пока расчеты по ГОСТу не закончил (но там все равно в 100 раз расходится W и $W_{\text{кр}}$), а вот как Вы поняли что оно непрерывное?!

Александрович, давайте я постараюсь сначала разобраться с видом распределения, а уж потом, если хотите посчитаю по $\chi^2$-критерию.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение26.09.2016, 05:42 
Заслуженный участник
Аватара пользователя


23/11/06
4171
rabbit-a в сообщении #1154313 писал(а):
а вот как Вы поняли что оно непрерывное?!

Кто "оно"? Нормальное? Нормальное непрерывно по определению.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 11:47 
Аватара пользователя


03/06/13
116
Екатеринбург
А Вы все-таки считаете, несмотря на вычисления, что у меня нормальное распределение?

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 12:13 
Заслуженный участник
Аватара пользователя


23/11/06
4171
rabbit-a в сообщении #1155101 писал(а):
А Вы все-таки считаете, несмотря на вычисления, что у меня нормальное распределение?

Нет, я считаю, что Вы просто неправильно поняли фразу.
Евгений Машеров в сообщении #1154235 писал(а):
во втором - там точно не нормальное, оно непрерывное распределение.


К тому же, вычислений в теме никаких нет. Если не считать вот этой фразы, которую я до сих пор не понимаю:
rabbit-a в сообщении #1153932 писал(а):
но $\beta_2=3,008>3$ а согласно ГОСТу должно быть меньше трех, так что мне теперь нельзя пользоваться критерием Шапира-Уилка, а нужно что ли критерием Эппса-Палли?? Или все равно можно Шапиро-Уилка?

Для нормального распределения $\beta_2=3$ (формула (4) в ГОСТе). Если Вы получили выборочное значение "кривизны", то это обозначено в ГОСТе как $b_2$. И ни слова в описании критерия Шапиро - Уилка про эти величины нет. Где конкретно в ГОСТЕ написано, что что-то "должно быть меньше трёх"?

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 13:00 
Аватара пользователя


03/06/13
116
Екатеринбург
1.А как правильно понять фразу:
Евгений Машеров в сообщении #1154235 писал(а):

"во втором - там точно не нормальное, оно непрерывное распределение."?? Может быть Вы сможете пояснить смысл этой фразы?
2.
8.1.2 В настоящем стандарте представлены два многосторонних критерия: Шапиро-Уилка и Эппса-Палли. Критерий Шапиро-Уилка выбирают, когда на основе исходных данных можно выбрать альтернативную гипотезу следующего вида: примерно симметричное распределение с убывающей кривизной (то есть $|\sqrt {\beta_1}|<1/2$ и $\beta_2<3$) или асимметричное распределение ($|\sqrt{\beta_1}>1/2}$), в противном случае выбирают критерий Эппса-Палли.

Мы с Вами читаем разные тексты? Вы не знакомы с греческим алфавитом?

Я уже трижды в теме спрашивал как показать вычисления сделанные в excel - ответа не получил ни одного, как Вы хотите увидеть вычисления, если здесь нет возможности их выложить (или я не знаю как это сделать и мне пока никто не объяснил как это сделать)??
А вот согласно критерию Шапиро-Уилка у меня получилось $W_{\text{кр}}=0,946$ все тот же документ
Евгений Машеров в сообщении #1153588 писал(а):

Для метода Шапиро-Уилка нужны негруппированные данные.
http://docs.cntd.ru/document/1200029041

таблица 11, $n=47$ 4-ая строчка с конца , 3-й стобец (уровень значимости 0,05).
статистика $W=2,0081$ поэтому гипотезу о нормальном распределении отклонять не нужно и, значит, Евгений Машеров все-таки ошибся и распределение нормальное.

цитата: " Поскольку это значение менее значения W, то нулевая гипотеза о нормальном распределении не отклоняется при уровне значимости $\alpha=0,05$" - самое последнее предложение в пункте 8.2 все этот же документ
Евгений Машеров в сообщении #1153588 писал(а):

Для метода Шапиро-Уилка нужны негруппированные данные.
http://docs.cntd.ru/document/1200029041














 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:18 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
rabbit-a в сообщении #1155118 писал(а):
1.А как правильно понять фразу:
"во втором - там точно не нормальное, оно непрерывное распределение."??

Нормальное распределение является непрерывным. Если некое распределение -- не непрерывно, то оно и не нормально.

Дискретное распределение нормальным быть не может.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:19 


20/03/14
12041
 !  rabbit-a
Замечание за погрешности цитирования:
1. Пользуйтесь кнопками "Цитата" или "Вставка", последней для выборочного цитирования выделенного фрагмента.
2. Избегайте избыточного цитирования.
3. Оформляйте внимательнее, в результате Вы приписываете собеседнику свои слова и разобраться вообще невозможно.

rabbit-a в сообщении #1155118 писал(а):
Я уже трижды в теме спрашивал как показать вычисления сделанные в excel - ответа не получил ни одного, как Вы хотите увидеть вычисления, если здесь нет возможности их выложить (или я не знаю как это сделать и мне пока никто не объяснил как это сделать)??
Потому что не надо задавать технические вопросы в теме. Есть вопросы по оформлению - задайте модераторам в ЛС.
Вычисления в Excel можно, если они хорошо оформлены, отскринить и выложить картинкой.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:26 
Аватара пользователя


21/01/09
3929
Дивногорск
provincialka в сообщении #1155142 писал(а):
Нормальное распределение является непрерывным. Если некое распределение -- не непрерывно, то оно и не нормально.

Но ведь нормально-распределённая св может иметь дискретное представление.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 14:29 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Александрович
Я только "переводила" высказывание Евгений Машеров. Все претензии к нему!

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 16:11 
Заслуженный участник
Аватара пользователя


11/03/08
10031
Москва
Перевожу сам. Приведены частости целочисленных значений. Тут может быть два варианта. Либо измеряемая величина целочисленная, и тогда говорить о нормальном распределении вообще бессмысленно. Оно непрерывно. Либо величина непрерывная, может иметь и нормальное распределение, но её очень грубо дискретизовали, так что коллизии, совпадения значений стали не редким исключением, а нормальным явлением. В этом случае статистические тесты применять можно, но учитывая эту дискретизацию. В частности, тест Шапиро-Уилка использует порядковые статистики, и на таких данных работать вряд ли будет. Есть приём, позволяющий применять такие тесты, когда есть совпадающие значения (считать их разными), но потерянную при грубой дискретизации информацию это не восстанавливает, и приём допустим, когда таких повторений мало, а если их много - это не исследование, а имитация его. Если их много - лучше воспользоваться критерием, изначально основанным на группировке данных, тем же хи-квадратом.

 Профиль  
                  
 
 Re: [МС] Проверка гипотезы о нормальном распределении
Сообщение27.09.2016, 16:50 
Заслуженный участник
Аватара пользователя


23/11/06
4171
rabbit-a в сообщении #1155118 писал(а):
8.1.2 В настоящем стандарте представлены два многосторонних критерия: Шапиро-Уилка и Эппса-Палли. Критерий Шапиро-Уилка выбирают, когда на основе исходных данных можно выбрать альтернативную гипотезу следующего вида: примерно симметричное распределение с убывающей кривизной (то есть $|\sqrt {\beta_1}|<1/2$ и $\beta_2<3$) или асимметричное распределение ($|\sqrt{\beta_1}|>1/2$), в противном случае выбирают критерий Эппса-Палли.

Мы с Вами читаем разные тексты? Вы не знакомы с греческим алфавитом?


Речь идёт о том, какое распределение представляется альтернативой проверяемой гипотезе нормальности. Числа $\beta_1$ и $\beta_2$ (греческие буковки) - это теоретические характеристики предполагаемого альтернативного распределения. Вычисленные по выборке значения $b_1$ и $b_2$ (латинские, а не греческие) есть их оценки, причём не очень точные в силу грубости округления выборки и её малочисленности. Поэтому обращать внимание на то, что $3,008>3$, нет никакого смысла. Да и запрета тут никакого нет. Наверняка критерий просто будет иметь плохую мощность, если альтернативное распределение не обладает описанными свойствами. То есть будет часто принимать ненормальное распределение за нормальное. Но у Вас-то, если верить Вашим словам, гипотеза нормальности отвергается!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 52 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group