2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 16:59 
Аватара пользователя
Добрый день,

у меня есть экспериментальные частоты: (1) 490 (2) 1425 (3) 1966 (4) 1374 (5) 773 (6) 1620 (7) 393 (8) 942 (9) 385 (10) 594 (11) 862 с общим числом испытаний 10824, средним 243.78 и стандартным отклонением 146.62. В Excel были расчитаны теоретические частоты для равномерного и нормального распределения. хи2-тест показал, что экспериментальное распределение в обоих случаях не соответствует теоретическому. Какое здесь может быть распределение и как расчитать теоретические частоты?

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 18:56 
Аватара пользователя
Вы бы хоть гистограмму построили и выложили здесь, а то, получается, хотите помощи, но весь каторжный рутинный труд переложили на помогающего.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 19:13 
Аватара пользователя
Вот картинка:
https://drive.google.com/file/d/0B08REaASOrMBSG5TVE9SNHFjcUE/view?usp=sharing
Линия - это теоретическое нормальное распределение. Я так думаю, что это может быть логнормальное распределение, но никак не могу разобраться, как расчитать теоретические частоты.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 19:14 
Аватара пользователя
Похоже на смесь распределений. Желательно знать природу порождения данных.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 19:23 
Аватара пользователя
Это наблюдения за птицами (птица-высота). Данные были проранжированны и рассчитана сумма птиц в каждом интервале высот. Данные в самом верхнем столбце имеют точность существенно ниже, чем все остальные данные (в несколько раз выше ошибка определения высоты) - их при необходимости можно отбросить.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 19:37 
Аватара пользователя
Птицы одного вида?

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 19:48 
Аватара пользователя
Да, но не думаю, что это поможет рассчитать теоретические частоты.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 20:06 
Аватара пользователя
Я бы об"единил соседние интервалы и проверил гипотезу на принадлежность к ограниченному нормальному распределению.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 20:23 
Аватара пользователя
Сложил соседние ранги и вот что получилось:
https://drive.google.com/file/d/0B08REaASOrMBNXZRWTRVUklGMHc/view?usp=sharing
хи2-тест выдал значение 2E-278, т.е. это опять не нормальное распределение.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 20:24 
Аватара пользователя
alenov в сообщении #943789 писал(а):
Вот картинка:
https://drive.google.com/file/d/0B08REaASOrMBSG5TVE9SNHFjcUE/view?usp=sharing
Линия - это теоретическое нормальное распределение. Я так думаю, что это может быть логнормальное распределение, но никак не могу разобраться, как расчитать теоретические частоты.

Возьмите логарифм от высоты и работайте как с нормальным распределением.

alenov в сообщении #943865 писал(а):
Сложил соседние ранги и вот что получилось:
https://drive.google.com/file/d/0B08REaASOrMBNXZRWTRVUklGMHc/view?usp=sharing
хи2-тест выдал значение 2E-278, т.е. это опять не нормальное распределение.

Стало похоже на ограниченное нормальное распределение. Им и приближайте.
Также можно проверить на распределение Вейбулла.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение10.12.2014, 22:07 
Аватара пользователя
Я бы посоветовал очень внимательно проанализировать, не есть ли данная гистограмма суммой трёх различных нормальных распределений, объясняемых тремя различными причинами. Я бы постеснялся такое советовать, если бы не это:
alenov в сообщении #943822 писал(а):
Да, но не думаю, что это поможет рассчитать теоретические частоты.

Из своего опыта орнитологических исследований я знаю, например, что высота подлёта врановых к ночёвке может существенно варьироваться в зависимости от погодных условий и рельефа местности. А суммарные гистограммы всех наблюдений обязательно дали бы разнопиковую картинку.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение11.12.2014, 15:27 
Аватара пользователя
Александрович и grizzly большое спасибо за обсуждение! Получилось доказать с помощью хи2-теста, что это логнормальное распределение. Загвоздка была в том, что в Excel, в отличие от формулы нормального распределения, в формулу логнормального распределения нужно вводить среднее логарифмов и стандартное отклонение логарифмов. Нигде это не написано. Нашел только на одном англоязычном форуме.

Уважаемый grizzly, это не вороны, а тропические птицы урубу. Они похожи на ворон, но я не знаю ничего про особенности их жизнедеятельности. Задача была в том, чтобы подобрать теоретическое распределение, которое описывает их наилучшим образом. Вроде бы логнормальное распределение полностью подошло.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение11.12.2014, 16:09 
Аватара пользователя
Вы это пропустили?
Александрович в сообщении #943869 писал(а):
alenov в сообщении #943789 писал(а):
Я так думаю, что это может быть логнормальное распределение, но никак не могу разобраться, как расчитать теоретические частоты.

Возьмите логарифм от высоты и работайте как с нормальным распределением.


alenov в сообщении #944314 писал(а):
Получилось доказать с помощью хи2-теста, что это логнормальное распределение. Задача была в том, чтобы подобрать теоретическое распределение, которое описывает их наилучшим образом. Вроде бы логнормальное распределение полностью подошло.

Интересно посмотреть на график.
Проверил, логнормальное хорошо ложится.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение14.12.2014, 15:34 
Аватара пользователя
Сначала я просто посчитал все логирифмы, в том числе логарифмы уже рассчитанных стандартного отклонения и медианы, поэтому и не получалось. Надо сначала посчитать логарифмы, а потом стандартное отклонение и медиану. Если не знаешь, то не очевидно. Постфактум конечно понимаешь, что глупая ошибка.
Вот что получилось:https://drive.google.com/file/d/0B08REaASOrMBY0VaYlo2LWtUcUE/view?usp=sharing

-- 14.12.2014, 17:22 --

Пока "заказчик" удовлетворился полученными картинками. Но зато прислал мне другие данные по распределению тех же птиц во времени:
https://drive.google.com/file/d/0B6TJ2VnOYaa1TWxlajZJSEU1ZU0/view?usp=sharing
Это данные о количестве наблюдений птиц каждые 15 минут по месяцам за год. Данные пронормированы на 12 часовой день. У меня пока вообще нет идей, что здесь можно делать. Вроде бы видны 2 максимума утром и вечером и минимум в полдень, но распределения по месяцам очень разные. Вопрос состоит в том, что здесь вообще можно сделать? Ищутся какие-то статистические процедуры, которые помогли бы выявить общие закономерности.

 
 
 
 Re: Теоретическое распределение для хи2-теста
Сообщение14.12.2014, 16:36 
Аватара пользователя
Попробуйте усреднить. Должна проявиться более информативная картинка.

 
 
 [ Сообщений: 15 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group