2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Как доказать, что распределение не является нормальным?
Сообщение19.09.2024, 20:18 


19/09/24
5
Есть 6 групп пациентов: В 1, 2, 3, 5, 6 группах примерно 2-4 пациента. В 4-й группе - 17 пациентов. Как доказать, что распределение не является нормальным?
Похоже, критерий хи квадрат не подходит, потому что в большинстве групп количество пациентов меньше 5.
Слышал, что в таком случае нужно использовать точный критерий Фишера (потому что он - аналог хи квадрат, только для маленьких выборок)
Очень буду признателен, если Вы распишете решение. В статистике разбираюсь плохо.

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение19.09.2024, 20:26 
Заслуженный участник
Аватара пользователя


01/09/13
4656
fk0935 в сообщении #1655351 писал(а):
распределение не является нормальным?

a как должно было бы выглядеть нормальное распределение?

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение20.09.2024, 11:37 


19/09/24
5
Geen
Я так понимаю, что оно должно выглядеть примерно так:
по вертикальной оси количество лет
по горизонтальной оси количество пациентов
и на графике - обычная кривая нормального распределения с пиком по горизонтальной оси где-то на 3-х пациентах

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение20.09.2024, 11:47 
Заслуженный участник
Аватара пользователя


11/03/08
9874
Москва
Можно уточнить постановку задачи? А то создаётся впечатление, что вопрос не о виде распределения, а об исследовании группированных данных. Для начала - группировка по какому признаку?

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение22.09.2024, 16:30 


19/09/24
5
Евгений Машеров
Это группы пациентов по годам. По сути, есть 6 лет - и за каждый год посчитана частота пациентов с данным заболеванием

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение23.09.2024, 08:44 
Заслуженный участник
Аватара пользователя


11/03/08
9874
Москва
Не претендуя быть телепатом Вольфом Мессингом, предположу, что о нормальности в смысле нормального (гауссова) распределения речь не идёт, а вопрос состоит в том, является ли 4 год аномальным, или выброс до 17 пациентов носит чисто случайный характер. Вы попытались применить тест хи-квадрат, но обычное требование иметь не менее 5 наблюдений в ячейке (а есть авторы, требующие и 10) не выполняется для Ваших данных. Важность его требования вызвана тем, что хи-квадрат это квадрат нормально распределённой величины, а распределение в ячейках мультиномиальное, но при достаточно большом числе может быть приближено нормальным.
В этом случае можно попробовать использовать G-тест
$G=2 \sum_i O_i \ln(O_i/E_i)$
где O - наблюдаемые (observed) значения
и E - ожидаемые (expected) значения в ячейках.
https://en.wikipedia.org/wiki/G-test
Статистика теста асимптотически распределена так же, как хи-квадрат.

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение23.09.2024, 22:57 


19/09/24
5
Евгений Машеров
Большое спасибо! Это, пожалуй, лучший совет, за всё время, что я хожу по форумам с этой проблемой. Не могли бы Вы ответить ещё на эти вопросы:
1. В 1 группе у меня 4 пациента, во 2й - 2, в 3й - 4, в 4й - 17, в 5й - 4, в 6й - 2. В сумме получается 33. Если 33 разделить на 6 групп, получится 5,5. Итак, первый вопрос: Можно ли в данном случае в качестве ожидаемых значений для G-теста взять значение 5,5? Прямо это число для каждого из шести годов. Тогда получится равномерное распределение. И сумма ожидаемых значений будет равна сумме наблюдаемых (33), что является условием для применения G-теста. Смущает меня здесь - не целое число. Можно ли такие брать?
Или, может быть, я вообще неправильно взял ожидаемые значения? Тогда откуда их взять, тоже непонятно.
2. Второй вопрос: Как посчитать число степеней свободы для G-теста? Формула, используемая для хи-квадрат, не подходит, поскольку здесь у меня только 1 столбец. По формуле: df = (столбцы-1)*(строки-1) = 0. Получается 0. А этого не может быть.
3. Третий вопрос: Подходит ли таблица критических значений хи-квадрат и для G-теста? Возможно Вы это и хотели сказать фразой "Статистика теста асимптотически распределена так же, как хи-квадрат". Просто я её плохо понял.
Если нет, то как интерпретировать результаты G-теста?

У меня при ожидаемых значениях 5,5 G-тест оказался равен 22,63212172. Осталось найти число степеней свободы, и интерпретировать результат для p=0,05, например.
Буду ждать с нетерпением Вашего ответа!

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение24.09.2024, 08:39 
Заслуженный участник
Аватара пользователя


11/03/08
9874
Москва
1. Дробное матожидание вполне возможно.
2. Это Вы с формулой для использования хи-квадрат применительно к таблицам затруднились. Где задача оценить связь двух качественных переменных. Одна соответствует строкам, вторая столбцам. Поэтому перемножается число строк и число столбцов (с поправкой на то, что не все данные независимы, поэтому единички вычитаются). В Вашем случае есть 6 ячеек, но одна степень свободы убегает, поскольку ожидаемое число наблюдений считается по наблюдаемым, $\sum_i O_i=\sum_i E_i$. Слегка вульгаризуя - каждая ячейка это пакет с информацией, но один пакет Вы вскрыли, чтобы оценить матожидание в нулевой гипотезе, осталось $6-1=5$ степеней свободы.
3. Распределения у них нетождественные, но при росте выборки стремятся к одному. То есть можно попробовать хи-квадрат, как критерий (двойка перед суммой как раз, чтобы были "в одном размере").

 Профиль  
                  
 
 Re: Как доказать, что распределение не является нормальным?
Сообщение24.09.2024, 14:10 


19/09/24
5
Евгений Машеров
СПАСИБО ВАМ БОЛЬШОЕ! Вы не представляете, как Вы мне помогли!!!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 9 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: DariaRychenkova


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group