2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Тестирование ГСЧ (diehard и т.п.)
Сообщение27.02.2007, 18:28 
Аватара пользователя


18/02/06
61
Moscow
Люди!
Где-нибудь вообще в природе существуют исходники тестов Кнута для генераторов случайных чисел, НЕ НА ФОРТРАНЕ????

 Профиль  
                  
 
 
Сообщение27.02.2007, 21:09 
Модератор
Аватара пользователя


11/01/06
5710
Про "батарею Кнута" не знаю, а вот "Diehard Battery of Tests of Randomness" от Марсаглия доступна тут: http://www.stat.fsu.edu/pub/diehard/

 Профиль  
                  
 
 
Сообщение28.02.2007, 13:16 
Аватара пользователя


18/02/06
61
Moscow
Хм... Это я уж и сама нашла :roll:

 Профиль  
                  
 
 DIEHARD
Сообщение08.10.2007, 11:23 
Аватара пользователя


18/09/07
28
ННГУ
Вопрос к тем, кто использовал "DIEHARD test battery" для тестирования генераторов случайных чисел:
как интерпретировать результаты теста (p-values)?

 Профиль  
                  
 
 
Сообщение09.10.2007, 19:32 


10/11/06
64
Я не знаю, что такое "DIEHARD test battery", но p-value - это вот что.

У вас есть вероятностная гипотеза - так называемая нуль-гипотеза.
Вы выбираете вероятностный уровень значимости $\alpha$ - это вероятность того, что вы отвергнете гипотезу, хотя она верна. Например, $\alpha = 0.01$.

Вероятностный тест вам выдает это самое \mbox{p-value}.
Если \alpha < \mbox{p-value}, то гипотеза отвергается, иначе гипотеза принимается.

В русской литературе, по моим наблюдениям, \mbox{p-value} не любят (Если я не прав, кто-нибудь дайте ссылку), но иногда его называют степенью согласия данных с гипотезой

 Профиль  
                  
 
 
Сообщение12.10.2007, 15:45 
Аватара пользователя


18/09/07
28
ННГУ
Мне тоже так казалось. Но в этих тестах какая-то другая интерпретация. В доках написано:
Цитата:
Most of the tests in DIEHARD return a p-value, which should be uniform on [0,1) if the input file contains truly independent random bits. Those p-values are obtained by p=F(X), where F is the assumed distribution of the sample random variable X---often normal. But that assumed F is just an asymptotic approximation, for which the fit will be worst in the tails. Thus you should not be surprised with occasional p-values near 0 or 1, such as .0012 or .9983. When a bit stream really FAILS BIG, you will get p's of 0 or 1 to six or more places. By all means, do not, as a Statistician might, think that a p < .025 or p> .975 means that the RNG has "failed the test at the .05 level". Such p's happen among the hundreds that DIEHARD produces, even with good RNG's. So keep in mind that " p happens".

Причем тест детерминированной последовательности (скажем, последовательности единиц) дает p-value=1, т.е. если бы это было степенью согласия с гипотезой, то тест можно считать пройденным.

Фраза же о необходимости равномерности p-значений наталкивает на мысль, что их нужно проверять на равномерность, каким-нибудь Колмогоровым-Смирновым или Пирсоном....

В общем я потерялся :(

 Профиль  
                  
 
 
Сообщение17.10.2007, 18:08 
Модератор
Аватара пользователя


11/01/06
5710
Вот такой ответ дал Ruptor:
Цитата:
Все тесты на случайность ограничены особым параметром - вероятностью, с которой тест "завалит" идеально случайные данные или другими словами хороший генератор. Ограничение на p до не более шести девяток или шести нулей - это значит вероятность один на миллион, что тест по ошибке отличит поток от случайного. Запустите этот тест миллион раз в автомате на совершенно случайных данных и они завалят любой такой тест на случайность. В некоторых случаях даже p=0.9 или p=0.1 - это заваленный тест. Всё зависит от условий их использования и от того насколько регулярно такие значения p видаются. Попробуйте, например, запустить DIEHARD на 10 миллионов самых первых байтов от RC4 для 10 миллионов ключей, потом вторых байтов, третьих - отклонение в p будет регулярное. Регулярное отклонение в p к 0 или к 1 - это и есть заваленный тест.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group