2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2, 3, 4, 5  След.
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 22:47 
Аватара пользователя
--mS-- в сообщении #711294 писал(а):
Посмотрите, в выборке есть явные пики на "круглых" значениях. Они всё сильно портят. Вместо них, скорее всего, есть как-то размазанные реальные времена. Кто-то просто очень любил круглые цифры.


Что значит "круглые" значения?

--mS-- в сообщении #711294 писал(а):
Но даже и с такой выборкой согласие с эрланговским распределением не такое уж и плохое.


Как же оно не такое уж и плохое, когда статистика критерия у меня получилась 62 с копейками, а критическое значение 7,8 с копейками (при уровне значимости 0,05 и числе степеней свободы 3)?

--mS-- в сообщении #711294 писал(а):
Если разбивать ось точками $0, 1.5, 3.5, 6.5, 8.5, 11.5, 16.5, 21.5, 28.5, 38.5, +\infty$ - 10 интервалов, то (с неокругленными оценками) вероятности в них попасть 0.0415813, 0.0965569, 0.161913, 0.102285, 0.134794, 0.170374, 0.112561, 0.0575685, 0.0309779 и 0.0913876, статистика критерия получается 16.370, реально достигнутый уровень значимости (p-value) $1-\chi^2_{7}(16.37)=0.02194$. В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


А критическое значение какое? Ведь принятие/не принятие гипотезы зависит от того, что больше: критическое значение или статистика критерия.
И мне интересно как Вы находили p-value (технически) ? Я просто раньше с ним не работал.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 22:51 
Аватара пользователя
Слушайте, ну Вы сами-то на свою выборку посмотреть не хотите? 0, 5, 10, 15, 20, 25, 30, 35 и т.д.

Я говорю не про Вашу статистику, а про свою. Чему она получилась равна - написано. Как вычислялась - написано. Как вычислять p-value - написано. Давайте будем читать сообщения?

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 23:04 
Аватара пользователя
--mS-- в сообщении #711301 писал(а):
Слушайте, ну Вы сами-то на свою выборку посмотреть не хотите? 0, 5, 10, 15, 20, 25, 30, 35 и т.д.


Понятно.

--mS-- в сообщении #711294 писал(а):
Вместо них, скорее всего, есть как-то размазанные реальные времена. Кто-то просто очень любил круглые цифры.


Вполне возможно, что диспетчера округляли времена прибытия поездов.

--mS-- в сообщении #711301 писал(а):
Как вычислять p-value - написано.


Я имел в виду цифру 7 в нижнем индексе $\chi^2$, я не понял откуда она появилась.

И по прежнему я не понимаю как Вы получили критическое значение критерия. В таблице $\chi^2$, которая есть у меня просто нет такого уровня значимости.

--mS-- в сообщении #711294 писал(а):
В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


Возможно ли, что при том разбиении выборки, которое Вы предложили, можно будет попробовать принять гипотезу об Эрланговском распределении или это совсем абсурд?

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 23:45 
Аватара пользователя
T(h)rasher в сообщении #711306 писал(а):
Я имел в виду цифру 7 в нижнем индексе $\chi^2$, я не понял откуда она появилась.

Другое дело. $7=10-1-2$ (10 интервалов минус один и минус два оцененных параметра).

T(h)rasher в сообщении #711306 писал(а):
И по прежнему я не понимаю как Вы получили критическое значение критерия. В таблице $\chi^2$, которая есть у меня просто нет такого уровня значимости.

У меня нет никакого критического значения. Почитайте, что выше объяснял _hum_ про p-value. Excel-то у Вас есть? Функция ХИ2РАСП(16.37;7).

Остальное - см. выше. Вам никто не скажет, можно принять или нельзя. Вдруг Вы намерены ракету запускать, опираясь на это решение. Кому охота за свои слова еще и ракетой по кумполу? Освойте критерий, придумайте, как навести порядок в выборке, и сделаете выводы.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 00:42 
Аватара пользователя
T(h)rasher в сообщении #711225 писал(а):

Теперь бы причесать её, то есть взять интервалы по 4, 5, 6, 7 минут. Вполне могут подойти и гамма-распределение, и Эрланга, и Вейбулла, и ограниченное нормальное. По поводу последнего интервала. Я бы взял ф.р. ограниченную справа значением 30 мин (то что больше, вполне может быть и выбросами). Пусть получили вероятность попадания в интервал от 0 до 30 - 0,9. Тогда для нахождения частоты в $i-$том интервале применяем формулу: $n_i=N\frac{p_i}{0.9}$.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 12:06 
Аватара пользователя
--mS-- в сообщении #711324 писал(а):
У меня нет никакого критического значения. Почитайте, что выше объяснял _hum_ про p-value. Excel-то у Вас есть? Функция ХИ2РАСП(16.37;7). Остальное - см. выше. Вам никто не скажет, можно принять или нельзя. Вдруг Вы намерены ракету запускать, опираясь на это решение. Кому охота за свои слова еще и ракетой по кумполу? Освойте критерий, придумайте, как навести порядок в выборке, и сделаете выводы.


С Excel'ем разобрался. Функция ХИ2РАСП(16.37;7) как раз считает p-value, но она не имеет никакого отношения к критическому значению критерия.

Критическое значение критерия нашел с помощью функции ХИ2ОБР(вероятность; число степеней свободы). Оно получилось чуть-чуть меньше статистики критерия (16.36998), как раз, чтобы "принять при очень большом желании".

--mS-- в сообщении #711294 писал(а):
В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


Объясните пожалуйста как можно говорить о принятии/не принятии гипотезы или ее противоречивости/не противоречивости выборке, зная только статистику критерия и p-value и не зная критического значения критерия.


Александрович в сообщении #711336 писал(а):
Тогда для нахождения частоты в $i$ - том интервале применяем формулу: $n_i=N\frac{p_i}{0.9}$.


Это получается теоретическая частота?

Александрович в сообщении #711336 писал(а):
Вполне могут подойти и гамма-распределение, и Эрланга, и Вейбулла, и ограниченное нормальное.


Возможно подойдет гамма-распределение, в случае с Эрлангом нужно округлять параметр $k$, я не уверен, что в этом случае удастся принять гипотезу об Эрланговском распределении даже изменив интервалы. В случае с Вейбуллом придется заново рассчитывать $k$ и $\lambda$, я не вполне понимаю как это сделать.

--mS-- в сообщении #711294 писал(а):
Если разбивать ось точками $0, 1.5, 3.5, 6.5, 8.5, 11.5, 16.5, 21.5, 28.5, 38.5, \infty$ - 10 интервалов, то (с неокругленными оценками) вероятности в них попасть 0.0415813, 0.0965569, 0.161913, 0.102285, 0.134794, 0.170374, 0.112561, 0.0575685, 0.0309779 и 0.0913876, статистика критерия получается 16.370, реально достигнутый уровень значимости (p-value) $1-\chi^2_{7}(16.37)=0.02194$. В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


Эти вероятности Вы рассчитывали для гамма-распределения? У меня другие значения получаются. Для примера первый интервал:
http://www.wolframalpha.com/input/?i=in ... 1469%29+dx

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 13:43 
Аватара пользователя
С Эрлангом все равно не получается..Вероятность первого интервала получилась 0.0142083; теоретическая частота по формуле $n_i'=N p_i=4.6034892 (N=324)$. В этот интервал попало 19 значений. В результате значение первой дроби в сумме статистики критерия получается 45.02226772. А у меня кртическое значение 16.36998.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 14:30 
Аватара пользователя
T(h)rasher в сообщении #711472 писал(а):
Объясните пожалуйста как можно говорить о принятии/не принятии гипотезы или ее противоречивости/не противоречивости выборке, зная только статистику критерия и p-value и не зная критического значения критерия.

Вы вот это прочитали? Что-то непонятно?
_hum_ в сообщении #710732 писал(а):
T(h)rasher в сообщении #710722 писал(а):
Что значит p-value?

Это реально достигаемый уровень значимости. То есть, грубо говоря, он показывает крайний уровень значимости при котором (если бы вы его выбрали изначально), гипотеза все еще принималась. Обычно в программных пакетах он в тестах считается...


(Оффтоп)

Предположим, p-value равно $0,00001$. Это значит, что гипотеза будет приниматься к критическим уровнем $0,00001$ или меньше, и отвергаться с любыми уровнями больше этого. Будете принимать гипотезу в таких условиях? Что такое уровень критерия, Вы, наверное, знаете: это вероятность отвергнуть верную основную гипотезу. Критерии с уровнем $0,00001$ или меньше - это абсолютно "беспринципные" критерии. Они практически всегда принимают основную гипотезу.

T(h)rasher в сообщении #711472 писал(а):
Эти вероятности Вы рассчитывали для гамма-распределения? У меня другие значения получаются.

Ничего удивительного в ситуации, когда окружающим Вашу выборку приходится получать, измеряя столбики гистограммы. Погрешность линейки.

Ещё раз повторю: я считаю, что все вопросы разъяснены, моё участие в теме далее излишне. Будьте осторожны с советами Александрович'а. А то насчитаете. Лучше книжки читайте.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 14:34 
Аватара пользователя
--mS-- в сообщении #711542 писал(а):
Будьте осторожны с советами Александрович'а. А то насчитаете.

Со всеми, огульно? Или есть конкретные возражения?

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 14:38 
Аватара пользователя
--mS-- в сообщении #711542 писал(а):
Вы вот это прочитали? Что-то непонятно?


Теперь дошло наконец-то.. Не внимательно прочитал сообщение _hum_'а.

--mS-- в сообщении #711542 писал(а):
Ничего удивительного в ситуации, когда окружающим Вашу выборку приходится получать, измеряя столбики гистограммы. Погрешность линейки.


Эм, понятно..Надо было сразу сюда частоты выложить.

В любом случае, огромное всем спасибо за советы. Сейчас пересчитаю поточнее гипотезу для гамма-распределения. Думаю, что остановлюсь на нем в итоге. С большой натяжкой, но все же.

Статистика критерия получилась равной 16,98218848 при $1-\chi^2_7 (16,98218848)=0,017511396$ и числе степенй свободы 7. Критическое значение получилось таким же как и статистика критерия.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 15:34 
Аватара пользователя
Гипотеза о принадлежности выборки к распределению Вейбулла с параметром формы 1,58 и масштаба 15,9 не отвергается. Разбивал на 8 интервалов шириной 5 минут. Статистика критерия 5.79, p-level = 0.33.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 15:47 
Аватара пользователя
Александрович в сообщении #711578 писал(а):
Гипотеза о принадлежности выборки к распределению Вейбулла с параметром формы 1,58 и масштаба 15,9 не отвергается. Разбивал на 8 интервалов шириной 5 минут. Статистика критерия 5.79, p-level = 0.33.


Не понимаю как найти эти параметры с помощью метода моментов. Может быть, есть какой-то более простой способ?
Меня несколько смутил тот факт, что у меня критическое значение критерия $\chi^2$ для распределения Вейбулла получилось точно таким же как и статистика критерия, найденная Вами (критическое значение нашел с помощью функции ХИ2ОБР).

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 16:10 
Аватара пользователя
Проверил гамма-распределение, получилось ещё ближе. Статистика критерия 2.74, p-level = 0.78. Параметр формы 2,21 и масштаба 6,62.

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 16:22 
Аватара пользователя
Александрович в сообщении #711597 писал(а):
Проверил гамма-распределение, получилось ещё ближе. Статистика критерия 2.74, p-level = 0.78. Параметр формы 2,21 и масштаба 6,62.


А сколько интервалов Вы брали?

 
 
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 16:26 
Аватара пользователя
Столько же, 8.

 
 
 [ Сообщений: 61 ]  На страницу Пред.  1, 2, 3, 4, 5  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group