2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8  След.
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение04.09.2019, 22:06 


11/07/16
825
Andrey_Kireew Спасибо. Дело в том, что такая команда не документирована: в справке упоминаются только распределения beta, chisquare, fratio, gamma, normald, studentst (см. снимок ). Если команда не документирована, то ее работа не предсказуема.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение04.09.2019, 22:21 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Ну, это от версии зависит.

Цитата:
Discrete Distributions


Discrete distributions have nonzero probability only at discrete points. Discrete distributions are defined by their probability function rather than by their probability density function in order to avoid singularities.

Bernoulli
Binomial
DiscreteUniform
EmpiricalDistribution
Geometric
Hypergeometric
NegativeBinomial
Poisson
ProbabilityTable
Continuous Distributions

Continuous distributions are defined along the real line by their probability density function.

Beta
Cauchy
ChiSquare
Erlang
Error
Exponential
FRatio
Gamma
Gumbel
InverseGaussian
Laplace
Logistic
LogNormal
Maxwell
Moyal
NonCentralBeta
NonCentralChiSquare
NonCentralFRatio
NonCentralStudentT
Normal
Pareto
Power
Rayleigh
StudentT
Triangular
Uniform
VonMises
Weibull

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение04.09.2019, 22:23 


11/07/16
825
Евгений Машеров
Вы привели распределения из пакета Statistics, который отсутствует в Мэйпле 6.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 02:04 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1413636 писал(а):
Как генерируются величины с распределением Лапласа?

Для принятых ТС условных обозначениях: $x_i=\beta+\frac{1}{\alpha}\ln\frac{r_i}{r_{i+1}}$.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 03:46 


07/10/15

2400
Александрович в сообщении #1413685 писал(а):
Для принятых ТС условных обозначениях: $x_i=\beta+\frac{1}{\alpha}\ln\frac{r_i}{r_{i+1}}$


По этой формуле сгенерировал выборки в matlab. 1000 выборок по 1000 наблюдений в каждой. Разброс $\beta$, оцененного по медиане получается опять явно больше, чем по среднему. А вот разброс $\alpha$, оцененного по С такой же как и по Std, только в случае с Mad распределение получается островершинное, а с Std туповершинное.

-- 05.09.2019, 04:54 --

Пользуясь случаем, не могу не задать главного и основополагающего вопроса.
Уважаемые участники, какую гистограмму на ваш взгляд лучше использовать, равноинтервальную или равнонаполненную?

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 04:20 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Равнонаполненную - это с одинаковыми теоретическими вероятностями или с одинаковой частотой? В ситуации неизвестных параметров интервалы с одинаковыми вероятностями сделать невозможно, только примерно: центральные узкие, дальше от центра - более широкие. Оценивать сначала параметры а потом брать по оцененному распределению интервалы - значит получить интервалы со случайными концами и предельное распределение статистики хи-квадрат вообще непонятно какое. То же самое, если брать интервалы с одинаковым числом элементов выборки в каждом: границы интервалов начинают зависеть от выборки и предельное распределение статистики критерия хи-квадрат портится непредсказуемо. Что рекомендует в этом случае практическая статистика, я не знаю.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 04:33 


07/10/15

2400
--mS-- в сообщении #1413688 писал(а):
если брать интервалы с одинаковым числом элементов выборки в каждом: границы интервалов начинают зависеть от выборки и предельное распределение статистики критерия хи-квадрат портится непредсказуемо

т.е. Вы намекаете, что Хи-квадрат к равно наполненной гистограмме вообще непригодна?
где вообще такое сказано, что границы интервалов не должны зависеть от распределения? ведь их положение до определённой степени произвольно и при равно интервальной группировке

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 08:54 


11/07/16
825
Andrey_Kireew Вернусь к первоначальному вопросу.
Цитата:
В простейшем случае, для проверки нуль-гипотезы можно использовать критерий Хи-квадрат Пирсона, что требует оценки параметров теоретического распределения. Известно, что лучшие результаты достигаются при непосредственной минимизации критерия Хи-квадрат, но это слишком сложно и для такого простого критерия, на мой взгляд, неоправданно.

Новейшие версии Математики и Мэйпла имеют средства (глобальные оптимизаторы) для численного нахождения значений параметров, минимизирующих значение критерия хи-квадрат.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 08:57 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
--mS-- в сообщении #1413688 писал(а):
Что рекомендует в этом случае практическая статистика, я не знаю.


"Практическая статистика" рекомендует нарезать равными кусками, а потом ячейки, в которых менее 5 наблюдений (или даже 10) объединять с соседними. Но это что-то из разряда "допустимый уровень халтуры". А поскольку сейчас можно и точное распределение считать, не аппроксимацию через $\chi^2$, ценность этого совета падает, а нарушения предположений остаются.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 12:26 


20/03/14
12041
 i  Markiyan Hirnyk
Пожалуйста, пользуйтесь кнопкой "Вставка" при выборочном цитировании сообщений, дабы не приходилось долго искать, кто и где это сказал.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 13:36 


07/10/15

2400
И тем не менее, мой вопрос остался без ответа. Что мешает использовать Хи квадрат при равнонаполненной группировке?
Кстати, проблема нулевых/очень малых частот в этом случае решается сама собой. Ну, а объединение соседних ячеек - это ни что иное, как переход к неравномерным интервалам.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 14:47 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Andrey_Kireew в сообщении #1413690 писал(а):
где вообще такое сказано, что границы интервалов не должны зависеть от распределения?

Границы интервалов не должны зависеть от выборки, а не от распределения. Где это сказано? В любой теореме про предельное поведение статистики любого критерия хи-квадрат. Хоть теореме Пирсона, хоть теореме Фишера: в условиях каждой из них интервалы группировки заранее фиксированы, а вся случайность из выборки сидит в частотах $\nu_j$, а также (для параметрической гипотезы) в подходящих оценках неизвестных параметров. Если границы интервалов начинают зависеть от выборки, утверждения этих теорем перестают быть верными. Насколько перестают - не в курсе, но верю Евгений Машеров про допустимый уровень халтуры.

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 16:40 


07/10/15

2400
--mS-- в сообщении #1413736 писал(а):
Хоть теореме Пирсона, хоть теореме Фишера: в условиях каждой из них интервалы группировки заранее фиксированы, а вся случайность из выборки сидит в частотах

Странно всё это. Какой смысл Вы вкладываете в понятие заранее фиксированные? заданные априори? Если и так, то на практике обычно границы интервалов определяются выборкой: берутся минимальное и максимальное значения, и полученный интервал делится на заданное равное число частей.Или так делать тоже нельзя? Вы намекаете, что нужно диапазон теоретического закона (скажем в пределах $\pm$3$\sigma$) делить на равное число интервалов, а потом уже смотреть, сколько выборочных наблюдений попадёт в эти "карманы"?

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение05.09.2019, 18:35 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Не хотел бы, чтобы мои слова сочли за некую апологию халтуры. Это скорее печаль по поводу того, что если действовать совсем без халтуры - получится итальянская забастовка. И пытаясь сделать хоть что нибудь - что-нибудь да нарушишь.
А по поводу степеней свободы для хи-квадрат
https://projecteuclid.org/euclid.aoms/1177728726

 Профиль  
                  
 
 Re: Хи-квадрат для распределения Лапласа
Сообщение06.09.2019, 04:44 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Andrey_Kireew в сообщении #1413749 писал(а):
Странно всё это. Какой смысл Вы вкладываете в понятие заранее фиксированные? заданные априори? Если и так, то на практике обычно границы интервалов определяются выборкой: берутся минимальное и максимальное значения, и полученный интервал делится на заданное равное число частей.Или так делать тоже нельзя?

Не вижу нужды повторять одно и то же по 10 раз. Фиксированные - значит, не зависящие от выборки. Исходя из стандартных утверждений, так делать тоже нельзя. Однако у Кендалла и Стюарта в книге "Статистические выводы и связи" в параграфах 30.20 - 30.23 написано про критерий хи-квадрат для проверки простой гипотезы, что в 50-е гг. несколькими человеками доказано, будто использование неких регулярных функций от выборки для определения границ интервалов не портит предельное распределение статистики критерия. Однако нет ничего более опасного, чем использовать утверждение, известное лишь в таком переложении типа "Мойша напел". Про критерий для проверки параметрической гипотезы там ничего столь же подробного не написано, но следует верить, что это тоже так и давно установлено. Поэтому рекомендация "от минимума до максимума на равновеликие интервалы, а потом объединить малочисленные" скорее всего будет работать. Об этом уже давно писал Евгений Машеров.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 110 ]  На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: eugensk


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group