2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5  След.
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 22:47 
Аватара пользователя


16/04/11
31
--mS-- в сообщении #711294 писал(а):
Посмотрите, в выборке есть явные пики на "круглых" значениях. Они всё сильно портят. Вместо них, скорее всего, есть как-то размазанные реальные времена. Кто-то просто очень любил круглые цифры.


Что значит "круглые" значения?

--mS-- в сообщении #711294 писал(а):
Но даже и с такой выборкой согласие с эрланговским распределением не такое уж и плохое.


Как же оно не такое уж и плохое, когда статистика критерия у меня получилась 62 с копейками, а критическое значение 7,8 с копейками (при уровне значимости 0,05 и числе степеней свободы 3)?

--mS-- в сообщении #711294 писал(а):
Если разбивать ось точками $0, 1.5, 3.5, 6.5, 8.5, 11.5, 16.5, 21.5, 28.5, 38.5, +\infty$ - 10 интервалов, то (с неокругленными оценками) вероятности в них попасть 0.0415813, 0.0965569, 0.161913, 0.102285, 0.134794, 0.170374, 0.112561, 0.0575685, 0.0309779 и 0.0913876, статистика критерия получается 16.370, реально достигнутый уровень значимости (p-value) $1-\chi^2_{7}(16.37)=0.02194$. В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


А критическое значение какое? Ведь принятие/не принятие гипотезы зависит от того, что больше: критическое значение или статистика критерия.
И мне интересно как Вы находили p-value (технически) ? Я просто раньше с ним не работал.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 22:51 
Заслуженный участник
Аватара пользователя


23/11/06
4152
Слушайте, ну Вы сами-то на свою выборку посмотреть не хотите? 0, 5, 10, 15, 20, 25, 30, 35 и т.д.

Я говорю не про Вашу статистику, а про свою. Чему она получилась равна - написано. Как вычислялась - написано. Как вычислять p-value - написано. Давайте будем читать сообщения?

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 23:04 
Аватара пользователя


16/04/11
31
--mS-- в сообщении #711301 писал(а):
Слушайте, ну Вы сами-то на свою выборку посмотреть не хотите? 0, 5, 10, 15, 20, 25, 30, 35 и т.д.


Понятно.

--mS-- в сообщении #711294 писал(а):
Вместо них, скорее всего, есть как-то размазанные реальные времена. Кто-то просто очень любил круглые цифры.


Вполне возможно, что диспетчера округляли времена прибытия поездов.

--mS-- в сообщении #711301 писал(а):
Как вычислять p-value - написано.


Я имел в виду цифру 7 в нижнем индексе $\chi^2$, я не понял откуда она появилась.

И по прежнему я не понимаю как Вы получили критическое значение критерия. В таблице $\chi^2$, которая есть у меня просто нет такого уровня значимости.

--mS-- в сообщении #711294 писал(а):
В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


Возможно ли, что при том разбиении выборки, которое Вы предложили, можно будет попробовать принять гипотезу об Эрланговском распределении или это совсем абсурд?

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение16.04.2013, 23:45 
Заслуженный участник
Аватара пользователя


23/11/06
4152
T(h)rasher в сообщении #711306 писал(а):
Я имел в виду цифру 7 в нижнем индексе $\chi^2$, я не понял откуда она появилась.

Другое дело. $7=10-1-2$ (10 интервалов минус один и минус два оцененных параметра).

T(h)rasher в сообщении #711306 писал(а):
И по прежнему я не понимаю как Вы получили критическое значение критерия. В таблице $\chi^2$, которая есть у меня просто нет такого уровня значимости.

У меня нет никакого критического значения. Почитайте, что выше объяснял _hum_ про p-value. Excel-то у Вас есть? Функция ХИ2РАСП(16.37;7).

Остальное - см. выше. Вам никто не скажет, можно принять или нельзя. Вдруг Вы намерены ракету запускать, опираясь на это решение. Кому охота за свои слова еще и ракетой по кумполу? Освойте критерий, придумайте, как навести порядок в выборке, и сделаете выводы.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 00:42 
Аватара пользователя


21/01/09
3452
Дивногорск
T(h)rasher в сообщении #711225 писал(а):

Теперь бы причесать её, то есть взять интервалы по 4, 5, 6, 7 минут. Вполне могут подойти и гамма-распределение, и Эрланга, и Вейбулла, и ограниченное нормальное. По поводу последнего интервала. Я бы взял ф.р. ограниченную справа значением 30 мин (то что больше, вполне может быть и выбросами). Пусть получили вероятность попадания в интервал от 0 до 30 - 0,9. Тогда для нахождения частоты в $i-$том интервале применяем формулу: $n_i=N\frac{p_i}{0.9}$.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 12:06 
Аватара пользователя


16/04/11
31
--mS-- в сообщении #711324 писал(а):
У меня нет никакого критического значения. Почитайте, что выше объяснял _hum_ про p-value. Excel-то у Вас есть? Функция ХИ2РАСП(16.37;7). Остальное - см. выше. Вам никто не скажет, можно принять или нельзя. Вдруг Вы намерены ракету запускать, опираясь на это решение. Кому охота за свои слова еще и ракетой по кумполу? Освойте критерий, придумайте, как навести порядок в выборке, и сделаете выводы.


С Excel'ем разобрался. Функция ХИ2РАСП(16.37;7) как раз считает p-value, но она не имеет никакого отношения к критическому значению критерия.

Критическое значение критерия нашел с помощью функции ХИ2ОБР(вероятность; число степеней свободы). Оно получилось чуть-чуть меньше статистики критерия (16.36998), как раз, чтобы "принять при очень большом желании".

--mS-- в сообщении #711294 писал(а):
В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


Объясните пожалуйста как можно говорить о принятии/не принятии гипотезы или ее противоречивости/не противоречивости выборке, зная только статистику критерия и p-value и не зная критического значения критерия.


Александрович в сообщении #711336 писал(а):
Тогда для нахождения частоты в $i$ - том интервале применяем формулу: $n_i=N\frac{p_i}{0.9}$.


Это получается теоретическая частота?

Александрович в сообщении #711336 писал(а):
Вполне могут подойти и гамма-распределение, и Эрланга, и Вейбулла, и ограниченное нормальное.


Возможно подойдет гамма-распределение, в случае с Эрлангом нужно округлять параметр $k$, я не уверен, что в этом случае удастся принять гипотезу об Эрланговском распределении даже изменив интервалы. В случае с Вейбуллом придется заново рассчитывать $k$ и $\lambda$, я не вполне понимаю как это сделать.

--mS-- в сообщении #711294 писал(а):
Если разбивать ось точками $0, 1.5, 3.5, 6.5, 8.5, 11.5, 16.5, 21.5, 28.5, 38.5, \infty$ - 10 интервалов, то (с неокругленными оценками) вероятности в них попасть 0.0415813, 0.0965569, 0.161913, 0.102285, 0.134794, 0.170374, 0.112561, 0.0575685, 0.0309779 и 0.0913876, статистика критерия получается 16.370, реально достигнутый уровень значимости (p-value) $1-\chi^2_{7}(16.37)=0.02194$. В принципе при столь корявой выборке вполне сносное значение, чтобы (с очень большой осторожностью) не считать гипотезу о гамма-распределении совсем абсурдной. При очень большом желании можно и принять.


Эти вероятности Вы рассчитывали для гамма-распределения? У меня другие значения получаются. Для примера первый интервал:
http://www.wolframalpha.com/input/?i=in ... 1469%29+dx

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 13:43 
Аватара пользователя


16/04/11
31
С Эрлангом все равно не получается..Вероятность первого интервала получилась 0.0142083; теоретическая частота по формуле $n_i'=N p_i=4.6034892 (N=324)$. В этот интервал попало 19 значений. В результате значение первой дроби в сумме статистики критерия получается 45.02226772. А у меня кртическое значение 16.36998.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 14:30 
Заслуженный участник
Аватара пользователя


23/11/06
4152
T(h)rasher в сообщении #711472 писал(а):
Объясните пожалуйста как можно говорить о принятии/не принятии гипотезы или ее противоречивости/не противоречивости выборке, зная только статистику критерия и p-value и не зная критического значения критерия.

Вы вот это прочитали? Что-то непонятно?
_hum_ в сообщении #710732 писал(а):
T(h)rasher в сообщении #710722 писал(а):
Что значит p-value?

Это реально достигаемый уровень значимости. То есть, грубо говоря, он показывает крайний уровень значимости при котором (если бы вы его выбрали изначально), гипотеза все еще принималась. Обычно в программных пакетах он в тестах считается...


(Оффтоп)

Предположим, p-value равно $0,00001$. Это значит, что гипотеза будет приниматься к критическим уровнем $0,00001$ или меньше, и отвергаться с любыми уровнями больше этого. Будете принимать гипотезу в таких условиях? Что такое уровень критерия, Вы, наверное, знаете: это вероятность отвергнуть верную основную гипотезу. Критерии с уровнем $0,00001$ или меньше - это абсолютно "беспринципные" критерии. Они практически всегда принимают основную гипотезу.

T(h)rasher в сообщении #711472 писал(а):
Эти вероятности Вы рассчитывали для гамма-распределения? У меня другие значения получаются.

Ничего удивительного в ситуации, когда окружающим Вашу выборку приходится получать, измеряя столбики гистограммы. Погрешность линейки.

Ещё раз повторю: я считаю, что все вопросы разъяснены, моё участие в теме далее излишне. Будьте осторожны с советами Александрович'а. А то насчитаете. Лучше книжки читайте.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 14:34 
Аватара пользователя


21/01/09
3452
Дивногорск
--mS-- в сообщении #711542 писал(а):
Будьте осторожны с советами Александрович'а. А то насчитаете.

Со всеми, огульно? Или есть конкретные возражения?

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 14:38 
Аватара пользователя


16/04/11
31
--mS-- в сообщении #711542 писал(а):
Вы вот это прочитали? Что-то непонятно?


Теперь дошло наконец-то.. Не внимательно прочитал сообщение _hum_'а.

--mS-- в сообщении #711542 писал(а):
Ничего удивительного в ситуации, когда окружающим Вашу выборку приходится получать, измеряя столбики гистограммы. Погрешность линейки.


Эм, понятно..Надо было сразу сюда частоты выложить.

В любом случае, огромное всем спасибо за советы. Сейчас пересчитаю поточнее гипотезу для гамма-распределения. Думаю, что остановлюсь на нем в итоге. С большой натяжкой, но все же.

Статистика критерия получилась равной 16,98218848 при $1-\chi^2_7 (16,98218848)=0,017511396$ и числе степенй свободы 7. Критическое значение получилось таким же как и статистика критерия.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 15:34 
Аватара пользователя


21/01/09
3452
Дивногорск
Гипотеза о принадлежности выборки к распределению Вейбулла с параметром формы 1,58 и масштаба 15,9 не отвергается. Разбивал на 8 интервалов шириной 5 минут. Статистика критерия 5.79, p-level = 0.33.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 15:47 
Аватара пользователя


16/04/11
31
Александрович в сообщении #711578 писал(а):
Гипотеза о принадлежности выборки к распределению Вейбулла с параметром формы 1,58 и масштаба 15,9 не отвергается. Разбивал на 8 интервалов шириной 5 минут. Статистика критерия 5.79, p-level = 0.33.


Не понимаю как найти эти параметры с помощью метода моментов. Может быть, есть какой-то более простой способ?
Меня несколько смутил тот факт, что у меня критическое значение критерия $\chi^2$ для распределения Вейбулла получилось точно таким же как и статистика критерия, найденная Вами (критическое значение нашел с помощью функции ХИ2ОБР).

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 16:10 
Аватара пользователя


21/01/09
3452
Дивногорск
Проверил гамма-распределение, получилось ещё ближе. Статистика критерия 2.74, p-level = 0.78. Параметр формы 2,21 и масштаба 6,62.

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 16:22 
Аватара пользователя


16/04/11
31
Александрович в сообщении #711597 писал(а):
Проверил гамма-распределение, получилось ещё ближе. Статистика критерия 2.74, p-level = 0.78. Параметр формы 2,21 и масштаба 6,62.


А сколько интервалов Вы брали?

 Профиль  
                  
 
 Re: Гипотеза об эрланговском распределении.
Сообщение17.04.2013, 16:26 
Аватара пользователя


21/01/09
3452
Дивногорск
Столько же, 8.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 61 ]  На страницу Пред.  1, 2, 3, 4, 5  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group