2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Выборка с округлёнными значениями
Сообщение29.08.2013, 07:33 
Аватара пользователя
Извлекли выборку из ГС с нормальным распределением объёмом $276$. Значения элементов огруглены до целых значений. Ско у ГС такое, что получается всего $3-6$ интервалов и элементов в крайних интервалах мало. Каким образом в этом случае найти выборочные среднее и ско и проверить сложную гипотезу о распределении?

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение29.08.2013, 08:29 
Аватара пользователя
Ну, проверку гипотез, скажем, по $\chi^2$ вполне можно проводить, если границы интервалов - целые числа. Тогда эффект округления поглотится нарезкой по интервалам.
Любопытнее ответить на вопрос об оценке параметров. Думаю, что вполне практично будет рассматривать округление как некую группировку по интервалам ширины 1 и пользоваться формулами для группированных данных (центры интервалов - целые значения). Целесообразно вводить поправку Шеппарда на группировку.
http://edu.tltsu.ru/er/book_view.php?bo ... e_id=11104

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение30.08.2013, 12:18 
Аватара пользователя
Евгений Машеров в сообщении #758639 писал(а):
Ну, проверку гипотез, скажем, по $\chi^2$ вполне можно проводить, если границы интервалов - целые числа. Тогда эффект округления поглотится нарезкой по интервалам.

Для критерия Пирсона чрезвычайно мало интервалов. Случайная величина принимает целые значения $40, 41, 42$. Границы интервалов выбирались $39.5; 40.5; 41.5; 42.5$. Выборок по $276$ набралось $10$ штук. Я их отцентровал по модальному интервалу и объединил в одну.
Получившиеся экспериментальное распределение сравнивал с нормальным и Вейбулла. Параметры гипотетических распределений находил из условия минимума суммы пирсоновских расстояний. Обе гипотезы не подтвердились см. рисунок. Какое распределение ещё можно проверить?
Изображение

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение30.08.2013, 21:18 
Аватара пользователя
Симметричная и с большим эксцессом? Стьюдент?

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение31.08.2013, 02:29 
Аватара пользователя
Для Стьюдента слишком много данных (около 3000), а во-вторых эксцесс у него наоборот меньше чем у нормального.

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение31.08.2013, 08:02 
Аватара пользователя
А при чём тут количество данных ("около 3000 штук") к распределению?
И по эксцессу - значений Вы не привели, а по графику - острый пик в моде как раз типичен для "тяжёлых хвостов".

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение31.08.2013, 08:09 
Аватара пользователя
Евгений Машеров в сообщении #759176 писал(а):
А при чём тут количество данных ("около 3000 штук") к распределению?

Число степеней свободы в распределении Стъюдента.

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение31.08.2013, 08:25 
Аватара пользователя
Так это один из возможных механизмов генерации распределения Стьюдента. Не исчерпывающий все мыслимые.
И - так чему эксцесс равен.
Ну и "метавопрос" - что нужно, аппроксимировать данные, или понять механизм их генерации?

 
 
 
 Re: Выборка с округлёнными значениями
Сообщение31.08.2013, 08:35 
Аватара пользователя
Евгений Машеров в сообщении #759185 писал(а):
И - так чему эксцесс равен.

Тут дисперсию то посчитать невозможно, а вы об эксцессе. Попробую посчитать, точнее сравнить его с эксцессом для нормального распределения.
Евгений Машеров в сообщении #759185 писал(а):
Ну и "метавопрос" - что нужно, аппроксимировать данные, или понять механизм их генерации?

Нужно определить критическое значение для выброса.

 
 
 [ Сообщений: 9 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group