Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 Проверка выборки на биномиальность
Подскажите, пожалуйста, как проверить выборку на соответствие биномиальному распределению?
или точнее задача состоит в том, что бы проверить, является ряд из нулей и единиц случайным или нет, при достаточной длине ряда.
На мой взгляд критерии которые проверяют похожесть функций распределения в данном случае не имеют смысла. Например, последовательность 11111111111111111111111111111000000000000000000000000000, и любая другая состоящая из N единиц и N нулей явно удовлетворит этим критериям, а это имеет мало смыла. Нужны критерии, которые учитывают порядок в последовательности.

 Re: Проверка выборки на биномиальность
Аватара пользователя
Выборка из какого множества? Биномиальное распределение, опять же, на каком? На множестве {1,0}? Хм...

 Re: Проверка выборки на биномиальность
Понял. перепутал биномиальное распределение с Бернулли.
В общем задача:
проверить, является ряд из нулей и единиц случайным или нет, при достаточной длине ряда. и с какой доверительной вероятностью?

Спасибо.

Перенесено из «Математика (Общие вопросы)» в «Помогите решить/разобраться (М)»/ GAA

 Re: Проверка выборки на биномиальность
http://en.wikipedia.org/wiki/Wald%E2%80 ... _runs_test

http://www.lssu.edu/faculty/jroese/reci ... fowitz.htm

уровень доверия выявляется, например, через prob-value

 Re: Проверка выборки на биномиальность
Я думаю нужно использовать все вот эти тесты:
http://ru.wikipedia.org/wiki/%D0%A2%D0% ... 0%B5%D0%B9

что скажете?

 Re: Проверка выборки на биномиальность
Можно использовать метод "Андрей-Николаича" Колмогорова (кажется называется "критерий Колмогорова"), он, по-моему, первый и ввел критерий случайности для выборки. В общих чертах: чем сложнее описание выборки, тем более она случайна. Параметр этот точно выражается численно и для случайных выборок колеблется в малых пределах около 0.8. Ваша приведенная в примере последовательность, очевидно, не случайна.

Поищите в интернете. Навскидку точнее не могу, к сожалению сказать.

 Re: Проверка выборки на биномиальность
Можно тупо жать выборку любым архиватором (да хоть zip'ом, хоть rar'ом -- неважно) и смотреть на степень сжатия. :)

 Re: Проверка выборки на биномиальность
Viktor_2 в сообщении #405832 писал(а):
http://en.wikipedia.org/wiki/Wald%E2%80%93Wolfowitz_runs_test

http://www.lssu.edu/faculty/jroese/reci ... fowitz.htm

уровень доверия выявляется, например, через prob-value


Да, это именно то что нужно.
Может ли кто подсказать, где можно найти вывод этого критерия?
Или хотя бы кто подскажет, как можно например: посчитать вероятность того, что в последовательности из 20 нулей и единиц, будет 7 серий (одна серия - это в подряд стоящие нули или единицы).

 Re: Проверка выборки на биномиальность
Shtirlic в сообщении #406655 писал(а):
Или хотя бы кто подскажет, как можно например: посчитать вероятность того, что в последовательности из 20 нулей и единиц, будет 7 серий (одна серия - это в подряд стоящие нули или единицы).
Зависит от вероятности появления события "на позиции $a_i$ выпала единица" и "на позиции $a_i$ выпал ноль", это раз. Если эти события равновероятны и независимы, то это элементарная теория вероятности и бросание монеты, если события зависимы или вероятности не равны, то укажите начальные условия.

Иначе решить тут ничего нельзя :-) И никакой критерий Вам не поможет.

 Re: Проверка выборки на биномиальность
Shtirlic в сообщении #406655 писал(а):
Viktor_2 в сообщении #405832 писал(а):
http://en.wikipedia.org/wiki/Wald%E2%80%93Wolfowitz_runs_test

http://www.lssu.edu/faculty/jroese/reci ... fowitz.htm

уровень доверия выявляется, например, через prob-value


Да, это именно то что нужно.
Может ли кто подсказать, где можно найти вывод этого критерия?
(...)

Предполагаю, что здесь: Wald, A. and Wolfowitz, J. (1940), "On a test whether two samples are from the same population" Ann. Math Statist. 11, 147-162

 Re: Проверка выборки на биномиальность
Lazy в сообщении #406677 писал(а):
Shtirlic в сообщении #406655 писал(а):
Или хотя бы кто подскажет, как можно например: посчитать вероятность того, что в последовательности из 20 нулей и единиц, будет 7 серий (одна серия - это в подряд стоящие нули или единицы).
Зависит от вероятности появления события "на позиции $a_i$ выпала единица" и "на позиции $a_i$ выпал ноль", это раз. Если эти события равновероятны и независимы, то это элементарная теория вероятности и бросание монеты, если события зависимы или вероятности не равны, то укажите начальные условия.

Иначе решить тут ничего нельзя :-) И никакой критерий Вам не поможет.


Этот критерий подразумевает вероятность 50%/50%.
Разобрался как посчитать вероятность. И это задача не на бросание монетки, а на бросание точки на отрезок (в дискретном случае), на формулу классической вероятности. По край не мере я не представляю как можно решить эту задачу исходя из принципа бросания монетки.

Viktor_2
Большое спасибо, на днях посмотрю.

 [ Сообщений: 11 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group