2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Как доказать, что распределение не является нормальным?
Сообщение19.09.2024, 20:18 


19/09/24
5
Есть 6 групп пациентов: В 1, 2, 3, 5, 6 группах примерно 2-4 пациента. В 4-й группе - 17 пациентов. Как доказать, что распределение не является нормальным?
Похоже, критерий хи квадрат не подходит, потому что в большинстве групп количество пациентов меньше 5.
Слышал, что в таком случае нужно использовать точный критерий Фишера (потому что он - аналог хи квадрат, только для маленьких выборок)
Очень буду признателен, если Вы распишете решение. В статистике разбираюсь плохо.

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение19.09.2024, 20:26 
Заслуженный участник
Аватара пользователя


01/09/13
4684
fk0935 в сообщении #1655351 писал(а):
распределение не является нормальным?

a как должно было бы выглядеть нормальное распределение?

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение20.09.2024, 11:37 


19/09/24
5
Geen
Я так понимаю, что оно должно выглядеть примерно так:
по вертикальной оси количество лет
по горизонтальной оси количество пациентов
и на графике - обычная кривая нормального распределения с пиком по горизонтальной оси где-то на 3-х пациентах

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение20.09.2024, 11:47 
Заслуженный участник
Аватара пользователя


11/03/08
10004
Москва
Можно уточнить постановку задачи? А то создаётся впечатление, что вопрос не о виде распределения, а об исследовании группированных данных. Для начала - группировка по какому признаку?

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение22.09.2024, 16:30 


19/09/24
5
Евгений Машеров
Это группы пациентов по годам. По сути, есть 6 лет - и за каждый год посчитана частота пациентов с данным заболеванием

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение23.09.2024, 08:44 
Заслуженный участник
Аватара пользователя


11/03/08
10004
Москва
Не претендуя быть телепатом Вольфом Мессингом, предположу, что о нормальности в смысле нормального (гауссова) распределения речь не идёт, а вопрос состоит в том, является ли 4 год аномальным, или выброс до 17 пациентов носит чисто случайный характер. Вы попытались применить тест хи-квадрат, но обычное требование иметь не менее 5 наблюдений в ячейке (а есть авторы, требующие и 10) не выполняется для Ваших данных. Важность его требования вызвана тем, что хи-квадрат это квадрат нормально распределённой величины, а распределение в ячейках мультиномиальное, но при достаточно большом числе может быть приближено нормальным.
В этом случае можно попробовать использовать G-тест
$G=2 \sum_i O_i \ln(O_i/E_i)$
где O - наблюдаемые (observed) значения
и E - ожидаемые (expected) значения в ячейках.
https://en.wikipedia.org/wiki/G-test
Статистика теста асимптотически распределена так же, как хи-квадрат.

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение23.09.2024, 22:57 


19/09/24
5
Евгений Машеров
Большое спасибо! Это, пожалуй, лучший совет, за всё время, что я хожу по форумам с этой проблемой. Не могли бы Вы ответить ещё на эти вопросы:
1. В 1 группе у меня 4 пациента, во 2й - 2, в 3й - 4, в 4й - 17, в 5й - 4, в 6й - 2. В сумме получается 33. Если 33 разделить на 6 групп, получится 5,5. Итак, первый вопрос: Можно ли в данном случае в качестве ожидаемых значений для G-теста взять значение 5,5? Прямо это число для каждого из шести годов. Тогда получится равномерное распределение. И сумма ожидаемых значений будет равна сумме наблюдаемых (33), что является условием для применения G-теста. Смущает меня здесь - не целое число. Можно ли такие брать?
Или, может быть, я вообще неправильно взял ожидаемые значения? Тогда откуда их взять, тоже непонятно.
2. Второй вопрос: Как посчитать число степеней свободы для G-теста? Формула, используемая для хи-квадрат, не подходит, поскольку здесь у меня только 1 столбец. По формуле: df = (столбцы-1)*(строки-1) = 0. Получается 0. А этого не может быть.
3. Третий вопрос: Подходит ли таблица критических значений хи-квадрат и для G-теста? Возможно Вы это и хотели сказать фразой "Статистика теста асимптотически распределена так же, как хи-квадрат". Просто я её плохо понял.
Если нет, то как интерпретировать результаты G-теста?

У меня при ожидаемых значениях 5,5 G-тест оказался равен 22,63212172. Осталось найти число степеней свободы, и интерпретировать результат для p=0,05, например.
Буду ждать с нетерпением Вашего ответа!

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение24.09.2024, 08:39 
Заслуженный участник
Аватара пользователя


11/03/08
10004
Москва
1. Дробное матожидание вполне возможно.
2. Это Вы с формулой для использования хи-квадрат применительно к таблицам затруднились. Где задача оценить связь двух качественных переменных. Одна соответствует строкам, вторая столбцам. Поэтому перемножается число строк и число столбцов (с поправкой на то, что не все данные независимы, поэтому единички вычитаются). В Вашем случае есть 6 ячеек, но одна степень свободы убегает, поскольку ожидаемое число наблюдений считается по наблюдаемым, $\sum_i O_i=\sum_i E_i$. Слегка вульгаризуя - каждая ячейка это пакет с информацией, но один пакет Вы вскрыли, чтобы оценить матожидание в нулевой гипотезе, осталось $6-1=5$ степеней свободы.
3. Распределения у них нетождественные, но при росте выборки стремятся к одному. То есть можно попробовать хи-квадрат, как критерий (двойка перед суммой как раз, чтобы были "в одном размере").

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение24.09.2024, 14:10 


19/09/24
5
Евгений Машеров
СПАСИБО ВАМ БОЛЬШОЕ! Вы не представляете, как Вы мне помогли!!!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 9 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group