2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2, 3  След.
 
 распределение асимметрии и эксцесса
Сообщение07.02.2013, 14:32 
Такой вопрос: каким распределениям подчиняются выборочные асимметрия и эксцесс, если выборка объема $n$ взята из нормального распределения? И как определить закон распределения выборочного момента, если выборка взята из известного распределения (в том числе из многомерного)?

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение08.02.2013, 11:34 
Аватара пользователя
Посмотрите Кендалла и Стьюарта, "Теория распределений", гл. 12, п. 18. Там изложен общий принцип и выведено для асимметрии, а в упражнении 12.10 для эксцесса.
(Специального названия для этих распределений нет, там выводятся их моменты и используются для аппроксимации)

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение10.02.2013, 20:42 
Спасибо за подсказку! Действительно, чем искать точные распределения, можно использовать приближения кривыми Пирсона. Попробовал Монте-Карлой - для асимметрии получилось шикарно. А вот для эксцесса (упражнение 12.10) плохо. Моделировал так:
1. генерирую 10 000 выборок объема $n$, считаю по каждой выборке статистику $y_n= \left[ \frac{m_4}{m_2^2} \frac{(n-1) (n+1)}{(n-3) (n-2)}-\frac{3 (n-1)^2}{(n-3) (n-2)}\right] \times \sqrt{\frac{(n-3) (n-2) (n-1)}{24 n (n+1)}}$, получаю выборку $Y_n$ посчитанных статистик.
2. По выборке $Y_n$ считаю первые четыре момента, сравниваю их с разложениями в ряд, приведенными в упражнении 12.10. Получается, что при $n<20$ приведенные разложения второго и третьего моментов сильно занижают значения (если верить этим разложениям, то асимметрия распределения выборочного эксцесса при $n<24$ должна быть вообще отрицательной). С четвертым моментом все совсем плохо - его разложение почему-то убывает при увеличении объема выборки, причем начинается с каких-то нереальных значений (при $n=10$ приведенное разложение в ряд дает значение 846.228).
Или я не так статистику считаю, или еще чего, но почему-то не сходится.

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение11.02.2013, 10:45 
Аватара пользователя
А у Вас там $m_4$ и $m_2$ это моменты или выборочные семиинварианты?

-- 11 фев 2013, 10:46 --

См. ibid. 12.10

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение11.02.2013, 11:36 
Евгений Машеров в сообщении #682423 писал(а):
А у Вас там $m_4$ и $m_2$ это моменты или выборочные семиинварианты?
Это выборочные моменты $$m_1'=\frac{1}{n}\sum \limits_{i-1}^n x_i$$ $$m_2=\frac{1}{n}\sum \limits_{i-1}^n (x_i-m_1')^2$$ $$m_4=\frac{1}{n}\sum \limits_{i-1}^n (x_i-m_1')^4$$

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение12.02.2013, 09:07 
Аватара пользователя
Не могу первоисточник найти (Biometrika, 1930, 239, E.S. Pearson, A further development of test for normality). Вернее, есть в Сети, но за деньги. Возможно, у кого-то есть доступ, проверить, нет ли опечатки у Кендалла и Стьюарта.
Но, скорее всего, ситуация грустнее. Выражения асимптотические и, похоже, близкими к реальности они становятся при очень больших n.

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение12.02.2013, 10:04 
вот статья http://download79.files.attachmail.ru/7E4DBB6168044CE794408D7806185CFF/da5d4717f7e40305896c2f7b90c747ca/Pearson1930.pdf
буду смотреть

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение12.02.2013, 11:42 
Аватара пользователя
Не скачивается...

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение12.02.2013, 12:00 
попробуем так
http://files.mail.ru/91A578C002234E4C934BDA4B6627D9E2

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение12.02.2013, 20:52 
Аватара пользователя
Спасибо. Почитаю.

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение13.02.2013, 13:48 
Аватара пользователя
Такое впечатление, что формула "изрядно асимптотическая", и при n<50, а автор статьи начинает табулировать с 50, её употреблять не стоит.

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение13.02.2013, 14:23 
Да, попробовал эту формулу для тех значений, что у Пиросона (50,75,100,150) - где-то близко. Еще попробовал формулы для $\beta_2$ (уравнения 20-23). Если я правильно понял эти уравнения, то там нужно по выборкам объема $n$ считать $\beta_2=\frac{m_4}{m_2^2}$, потом по получившейся выборке $\beta_2$-статистик считать $B_1(\beta_2)=\frac{m_3^2(\beta_2)}{m_2^3(\beta_2)}$ и $B_2(\beta_2)=\frac{m_4(\beta_2)}{m_2^2(\beta_2)}$, правда там в уравнениях присутствует величина $x$, которую я в этих уравнениях не понимаю, ведь зависимость $\beta_2$ и $x$ задается уравнением 12. Так вот, более менее похоже получается только для среднего и для $B_1(\beta_2)$, а для $\sigma$ и $B_2(\beta_2)$ мало похоже.

Вопрос такой - а можно ли увеличить точность оценки распределения при малых $n$ увеличив ряд разложения? Учитывать не только слагаемые порядка $n^{-3}$, но и дальше, предположим до $n^{-6}$.

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение13.02.2013, 14:30 
Аватара пользователя
Я боюсь, что при малых n бессмысленным становится само использование асимметрии и эксцесса. Одно большое отклонение радикально меняет значения моментов высших порядков, а при малых n нечем его наличие/отсутствие компенсировать. А увеличение числа членов в разложении - похоже, что там будут драматически расти коэффициенты ряда при высоких степенях n.

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение13.02.2013, 21:45 
Но для сотенных выборок использовать метод моментов уже неинтересно - можно задействовать более серьезные критерии, например тот же критерий согласия Пирсона.
Попробовал аппроксимировать моменты распределения $\beta_2$ в диапазоне $n=10..100$. Получил примерно так $$m_2=0.00556-\frac{79802.7}{n^5}+\frac{19648.4}{n^4}-\frac{1287.17}{n^3}-\frac{38.851}{n^2}+\frac{22.7856}{n}$$ $$m_3=0.0237-\frac{640252.}{n^5}+\frac{220391.}{n^4}-\frac{29289.2}{n^3}+\frac{1724.74}{n^2}-\frac{2.81362}{n}$$ $$m_4=0.594-\frac{2.84117\times 10^6}{n^5}+\frac{1.13\times 10^6}{n^4}-\frac{170903.}{n^3}+\frac{11620.}{n^2}-\frac{122.154}{n}$$
Аппроксимации моментов вроде бы устойчивые, при разных объемах выборки распределения будут соответствовать разным кривым Пирсона. Но вот когда пытаюсь для какого-нибудь объема выборки смоделировать эксцесс и сравнить его распределение с кривой Пирсона (соответствующего типа), то какая-то чушь получается. Моменты по выборке смоделированных $\beta_2$ (а их насчитываю 100 000 штук) близки расчетным, а плотности распределений совсем разные. Вопрос - а может так получится, что распределение вообще не аппроксимируется кривой Пирсона?

 
 
 
 Re: распределение асимметрии и эксцесса
Сообщение14.02.2013, 08:02 
Аватара пользователя
А почему бы не быть распределениям, плохо аппроксимирующимся распределениями Пирсона? Это всё же довольно узкий класс.
Возможно, более продуктивный путь - найти нелинейное преобразование, приводящее распределение к "более нормальному" (подобно z-преобразованию Фишера для коэффициента корреляции).
А возможно, для малой выборки вообще не получится оценить нормальность.
То, что считать моменты высшего порядка для малых выборок есть всего лишь упражнение на выносливость, я полагаю достаточно уверенно.

 
 
 [ Сообщений: 31 ]  На страницу 1, 2, 3  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group