2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Случайные числа и основные статистические характеристики
Сообщение21.08.2014, 17:35 


14/12/09
306
Задача
Воспользовавшись алгоритмом смешанного генератора, сформировать последовательность $50$ чисел, имеющих равномерное распределение на интервале $(0, 1)$, и проверить основные статистические характеристики полученных последовательностей.

Исходные данные:

$a_0=1200$
$\mu=14900$
$m=700$

Решение
Алгоритм смешанного генератора имеет следующий вид:
$$x_{i+1}=(a_0 x_i+\mu)\bmod m$$
где множитель $a_0$ , приращение $\mu$ и модуль $m$, а также получаемые числа $x_1 , x_2 , …$ – целые числа.

Положим $x_0=123$. Тогда

$x_1=(1200\cdot123+14900)\bmod 700=100$

По целым числам последовательности $(x_i)$ можно построить последовательность $(x_i/m)$ рациональных чисел из единичного интервала.

${x_0/m}  =123/700=0.176$
${x_1/m}  =100/700=0.143$

Воспользовавшись программой Mathcad, сформируем последовательности $(x_i)$ и $(x_i/m)$ (Таблица 1).

Таблица 1.
Изображение


Из текста задачи: "проверить основные статистические характеристики полученных последовательностей".
1. "основные" - это какие?
2. Какой вид должны иметь формулы, в которые я подставлю значения из Таблицы 1?
3. Проверка, насколько я понимаю, подразумевает сравнение. С чем мне сравнивать то, что у меня получилось?

(Оффтоп)

Шелухин О. И., Моделирование информационных систем: https://yadi.sk/d/7ntcOYKFaB3v6
Глава 3. Моделирование случайных чисел - стр. 62


Ниже написал немного мыслей, которые могут быть очень неправильными.

Математическое ожидание - одна из основных статистических характеристик.
В данном случае математическое ожидание это среднее арифметическое.
$$M[X]= \frac{\sum^{49}_{i=0}\frac {x_i}{700}}{50}=0.349$$
В учебнике (см. оффтоп) на стр. 67 написано, что "среднее значение чисел не должно существенно отличаться от $\frac{1}{2}$"
У меня существенно отличается?

Я очень запутался :-(

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение21.08.2014, 17:50 
Заслуженный участник


04/05/09
4589
Mikle1990 в сообщении #898141 писал(а):
У меня существенно отличается?
Это говорит о том, что константы для генератора очень неудачные. Одно из условий хорошести констант - взаимная простота.

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение21.08.2014, 17:56 


14/12/09
306
venco в сообщении #898150 писал(а):
Mikle1990 в сообщении #898141 писал(а):
У меня существенно отличается?
Это говорит о том, что константы для генератора очень неудачные. Одно из условий хорошести констант - взаимная простота.

Я это подозревал, но смирился с данным фактом, т.к. эти условия даны в методическом материале, который предоставил мне мой ВУЗ :facepalm:

Как не крути, мне нужно эту задачу решить :-(

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение23.08.2014, 04:55 


14/12/09
306
Вроде бы решил :-)

В конце задачи у меня написано:
"Из полученных данных можно сделать вывод о том, что ранее полученное множество случайных чисел не имеет равномерного распределения на интервале $[0, 1) $.

Результаты проверки показывают, что параметры $a_0$ , $\mu$ и $m$, которые даны в условии задачи, подобраны неправильно, а это, соответственно, не позволяет получить последовательность случайных чисел, имеющую равномерное распределение на указанном интервале".

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 18:55 


14/12/09
306
Заново открываю тему.

Давайте по порядку.

Математическое ожидание равномерно распределённой случайной величины $X$ находится посредине интервала $[0, 1) $:
$$M(X)=\frac{a+b}{2}=\frac{0+1}{2}=0.5$$
Дисперсия $D$ и среднее квадратическое отклонение $\sigma$ равны:
$$D(X)=\frac{(b-a)^{2}}{12}=\frac{1}{12} \approx 0.083$$
$$\sigma(X) =\sqrt {D(X)} \approx 0.289$$
Теперь посмотрим, что у меня получается для последовательности $(x_i/700)$ (см. прошлые сообщения).
$$M= \bar{x} = \frac{\sum^{49}_{i=0}\frac {x_i}{700}}{50}\approx0.349$$
$$D=\frac{{\sum^{49}_{i=0}{(\frac {x_i}{700})}^{2}}-\frac{(\sum^{49}_{i=0}{\frac {x_i}{700})^{2}}}{50}}{49}\approx 0.06$$
$$\sigma(X) =\sqrt {0.06} \approx 0.245$$

Сравним

$0.349\not \approx0.500$ , $0.060\approx0.083$ , $0.245\approx0.289$
$M\not \approx M(X)$ , $D \approx D(X)$ , $\sigma \approx \sigma(X)$

И теперь я задам совсем неожиданный вопрос.
Как определить примерно равны ($\approx$) два числа или примерно не равны ($\not \approx$) ?

Вот, например, я написал $0.245\approx0.289$. Эти два числа отличаются на $0.044$. И какой мне знак между ними ставить?

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 19:01 
Аватара пользователя


11/06/12
10390
стихия.вздох.мюсли
Mikle1990 в сообщении #899867 писал(а):
Как определить примерно равны ($\approx$) два числа или примерно не равны ($\not \approx$) ?
Не орите вы так ;-) Никак не определить. Всё зависит от задачи.

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 19:14 
Заслуженный участник


11/05/08
32166
Mikle1990 в сообщении #899867 писал(а):
Вот, например, я написал $0.245\approx0.289$.

Вы лучше напишите, что $0.349\approx0.500$. На сколько сигм расхождение (как их ни считай)?...

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 19:20 
Аватара пользователя


11/06/12
10390
стихия.вздох.мюсли
В том-то и дело. Ну сказано в задаче, что среднее не должно «сильно отличаться» от одной второй. И куда тут приткнёшь сигмы?

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 20:13 
Заслуженный участник


27/04/09
28128
У меня вот есть книженция Джулиан Бакнелл «Фундаментальные алгоритмы и структуры данных в Delphi», изд. DiaSoft и Питер, 2006 (перевод, как можно догадаться), и там есть глава 6 «Рандомизированные алгоритмы», и в ней конкретно описываются несколько критериев «случайности» ГПСЧ. Где не фигурирует никакое наивное примерное равенство матожиданий или дисперсий.

Уверен, эти критерии появились впервые не в уме Джулиана Бакнелла, а разработаны раньше и известны и описаны в литературе шире. Предлагаю ТС подумать над этим и над предложением авторов его методички проверить «основные статистические характеристики» генератора, если они не указали в ней, что они под этим понимают, и если не в своём тексте, так хотя бы на что-нибудь сославшись.

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 20:50 


14/12/09
306
В методичке в списке литературы первая книга - Шелухин О.И. Моделирование информационных систем

На стр.67 написано следующее.
Цитата:
Если проверяется равномерность распределения на интервале $[0;1)$, то случайные числа должны иметь следующие свойства:
    1. среднее значение чисел не должно существенно отличаться от $1/2$;
    2. среднее значение квадратов чисел не должно существенно отличаться от $1/3$;
    3. дисперсия чисел не должна существенно отличаться от $1/12$;
    4. ...

Так как же узнать, что кроется за словами "существенно отличаться"? :-(

(Оффтоп)

Из-за кривых условий задачи, последовательность, полученная при применении смешанного генератора, распределена неравномерно. Это можно увидеть на графике.
Изображение

Но хочу подчеркнуть, что это не имеет прямого отношения к тому вопросу, который я сейчас поднял.

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение25.08.2014, 20:55 
Заслуженный участник


11/05/08
32166
arseniiv в сообщении #899896 писал(а):
Уверен, эти критерии появились впервые не в уме Джулиана Бакнелла, а разработаны раньше и известны и описаны в литературе шире.

Но в данном конкретном случае ничего этого не нужно. Всё напрочь вырубается элементарной прикидкой вероятности такого отклонения выборочного среднего.

-- Пн авг 25, 2014 22:04:41 --

Mikle1990 в сообщении #899911 писал(а):
Так как же узнать, что кроется за словами "существенно отличаться"? :-(

По цитате -- никак. Какая-то совершенно безграмотная рекомендация.

Mikle1990 в сообщении #899911 писал(а):
последовательность, полученная при применении смешанного генератора, распределена неравномерно. Это можно увидеть на графике.

На графике неравномерность увидеть как раз трудно. Что на нём видно чётко -- так это явная коррелированность отсчётов. Но это уже следующий этап проверки -- следующий за оценкой числовых характеристик, если она не дала негативного результата.

 Профиль  
                  
 
 Re: Случайные числа и основные статистические характеристики
Сообщение26.08.2014, 01:03 
Заслуженный участник


27/04/09
28128
ewert в сообщении #899912 писал(а):
Всё напрочь вырубается элементарной прикидкой вероятности такого отклонения выборочного среднего.
…что тоже входит в придуманные давно и распространённые широко методы проверки. :-)

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 12 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group