2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Случайные числа и основные статистические характеристики
Сообщение21.08.2014, 17:35 
Задача
Воспользовавшись алгоритмом смешанного генератора, сформировать последовательность $50$ чисел, имеющих равномерное распределение на интервале $(0, 1)$, и проверить основные статистические характеристики полученных последовательностей.

Исходные данные:

$a_0=1200$
$\mu=14900$
$m=700$

Решение
Алгоритм смешанного генератора имеет следующий вид:
$$x_{i+1}=(a_0 x_i+\mu)\bmod m$$
где множитель $a_0$ , приращение $\mu$ и модуль $m$, а также получаемые числа $x_1 , x_2 , …$ – целые числа.

Положим $x_0=123$. Тогда

$x_1=(1200\cdot123+14900)\bmod 700=100$

По целым числам последовательности $(x_i)$ можно построить последовательность $(x_i/m)$ рациональных чисел из единичного интервала.

${x_0/m}  =123/700=0.176$
${x_1/m}  =100/700=0.143$

Воспользовавшись программой Mathcad, сформируем последовательности $(x_i)$ и $(x_i/m)$ (Таблица 1).

Таблица 1.
Изображение


Из текста задачи: "проверить основные статистические характеристики полученных последовательностей".
1. "основные" - это какие?
2. Какой вид должны иметь формулы, в которые я подставлю значения из Таблицы 1?
3. Проверка, насколько я понимаю, подразумевает сравнение. С чем мне сравнивать то, что у меня получилось?

(Оффтоп)

Шелухин О. И., Моделирование информационных систем: https://yadi.sk/d/7ntcOYKFaB3v6
Глава 3. Моделирование случайных чисел - стр. 62


Ниже написал немного мыслей, которые могут быть очень неправильными.

Математическое ожидание - одна из основных статистических характеристик.
В данном случае математическое ожидание это среднее арифметическое.
$$M[X]= \frac{\sum^{49}_{i=0}\frac {x_i}{700}}{50}=0.349$$
В учебнике (см. оффтоп) на стр. 67 написано, что "среднее значение чисел не должно существенно отличаться от $\frac{1}{2}$"
У меня существенно отличается?

Я очень запутался :-(

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение21.08.2014, 17:50 
Mikle1990 в сообщении #898141 писал(а):
У меня существенно отличается?
Это говорит о том, что константы для генератора очень неудачные. Одно из условий хорошести констант - взаимная простота.

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение21.08.2014, 17:56 
venco в сообщении #898150 писал(а):
Mikle1990 в сообщении #898141 писал(а):
У меня существенно отличается?
Это говорит о том, что константы для генератора очень неудачные. Одно из условий хорошести констант - взаимная простота.

Я это подозревал, но смирился с данным фактом, т.к. эти условия даны в методическом материале, который предоставил мне мой ВУЗ :facepalm:

Как не крути, мне нужно эту задачу решить :-(

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение23.08.2014, 04:55 
Вроде бы решил :-)

В конце задачи у меня написано:
"Из полученных данных можно сделать вывод о том, что ранее полученное множество случайных чисел не имеет равномерного распределения на интервале $[0, 1) $.

Результаты проверки показывают, что параметры $a_0$ , $\mu$ и $m$, которые даны в условии задачи, подобраны неправильно, а это, соответственно, не позволяет получить последовательность случайных чисел, имеющую равномерное распределение на указанном интервале".

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 18:55 
Заново открываю тему.

Давайте по порядку.

Математическое ожидание равномерно распределённой случайной величины $X$ находится посредине интервала $[0, 1) $:
$$M(X)=\frac{a+b}{2}=\frac{0+1}{2}=0.5$$
Дисперсия $D$ и среднее квадратическое отклонение $\sigma$ равны:
$$D(X)=\frac{(b-a)^{2}}{12}=\frac{1}{12} \approx 0.083$$
$$\sigma(X) =\sqrt {D(X)} \approx 0.289$$
Теперь посмотрим, что у меня получается для последовательности $(x_i/700)$ (см. прошлые сообщения).
$$M= \bar{x} = \frac{\sum^{49}_{i=0}\frac {x_i}{700}}{50}\approx0.349$$
$$D=\frac{{\sum^{49}_{i=0}{(\frac {x_i}{700})}^{2}}-\frac{(\sum^{49}_{i=0}{\frac {x_i}{700})^{2}}}{50}}{49}\approx 0.06$$
$$\sigma(X) =\sqrt {0.06} \approx 0.245$$

Сравним

$0.349\not \approx0.500$ , $0.060\approx0.083$ , $0.245\approx0.289$
$M\not \approx M(X)$ , $D \approx D(X)$ , $\sigma \approx \sigma(X)$

И теперь я задам совсем неожиданный вопрос.
Как определить примерно равны ($\approx$) два числа или примерно не равны ($\not \approx$) ?

Вот, например, я написал $0.245\approx0.289$. Эти два числа отличаются на $0.044$. И какой мне знак между ними ставить?

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 19:01 
Аватара пользователя
Mikle1990 в сообщении #899867 писал(а):
Как определить примерно равны ($\approx$) два числа или примерно не равны ($\not \approx$) ?
Не орите вы так ;-) Никак не определить. Всё зависит от задачи.

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 19:14 
Mikle1990 в сообщении #899867 писал(а):
Вот, например, я написал $0.245\approx0.289$.

Вы лучше напишите, что $0.349\approx0.500$. На сколько сигм расхождение (как их ни считай)?...

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 19:20 
Аватара пользователя
В том-то и дело. Ну сказано в задаче, что среднее не должно «сильно отличаться» от одной второй. И куда тут приткнёшь сигмы?

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 20:13 
У меня вот есть книженция Джулиан Бакнелл «Фундаментальные алгоритмы и структуры данных в Delphi», изд. DiaSoft и Питер, 2006 (перевод, как можно догадаться), и там есть глава 6 «Рандомизированные алгоритмы», и в ней конкретно описываются несколько критериев «случайности» ГПСЧ. Где не фигурирует никакое наивное примерное равенство матожиданий или дисперсий.

Уверен, эти критерии появились впервые не в уме Джулиана Бакнелла, а разработаны раньше и известны и описаны в литературе шире. Предлагаю ТС подумать над этим и над предложением авторов его методички проверить «основные статистические характеристики» генератора, если они не указали в ней, что они под этим понимают, и если не в своём тексте, так хотя бы на что-нибудь сославшись.

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 20:50 
В методичке в списке литературы первая книга - Шелухин О.И. Моделирование информационных систем

На стр.67 написано следующее.
Цитата:
Если проверяется равномерность распределения на интервале $[0;1)$, то случайные числа должны иметь следующие свойства:
    1. среднее значение чисел не должно существенно отличаться от $1/2$;
    2. среднее значение квадратов чисел не должно существенно отличаться от $1/3$;
    3. дисперсия чисел не должна существенно отличаться от $1/12$;
    4. ...

Так как же узнать, что кроется за словами "существенно отличаться"? :-(

(Оффтоп)

Из-за кривых условий задачи, последовательность, полученная при применении смешанного генератора, распределена неравномерно. Это можно увидеть на графике.
Изображение

Но хочу подчеркнуть, что это не имеет прямого отношения к тому вопросу, который я сейчас поднял.

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 20:55 
arseniiv в сообщении #899896 писал(а):
Уверен, эти критерии появились впервые не в уме Джулиана Бакнелла, а разработаны раньше и известны и описаны в литературе шире.

Но в данном конкретном случае ничего этого не нужно. Всё напрочь вырубается элементарной прикидкой вероятности такого отклонения выборочного среднего.

-- Пн авг 25, 2014 22:04:41 --

Mikle1990 в сообщении #899911 писал(а):
Так как же узнать, что кроется за словами "существенно отличаться"? :-(

По цитате -- никак. Какая-то совершенно безграмотная рекомендация.

Mikle1990 в сообщении #899911 писал(а):
последовательность, полученная при применении смешанного генератора, распределена неравномерно. Это можно увидеть на графике.

На графике неравномерность увидеть как раз трудно. Что на нём видно чётко -- так это явная коррелированность отсчётов. Но это уже следующий этап проверки -- следующий за оценкой числовых характеристик, если она не дала негативного результата.

 
 
 
 Re: Случайные числа и основные статистические характеристики
Сообщение26.08.2014, 01:03 
ewert в сообщении #899912 писал(а):
Всё напрочь вырубается элементарной прикидкой вероятности такого отклонения выборочного среднего.
…что тоже входит в придуманные давно и распространённые широко методы проверки. :-)

 
 
 [ Сообщений: 12 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group