2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 Распределены ли числа нормально?
Сообщение22.07.2010, 14:48 
Аватара пользователя


31/05/09
117
Calgary, AB
Добрый день,

есть 1 млн. целых чисел от 0 до 2^31 - 1.
Как проверить распределены ли они нормально?
Заранее спасибо.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение22.07.2010, 15:08 


22/09/09
374
Есть критерий Колмогорова, еще Пирсона.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение23.07.2010, 09:50 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Если Вы еще сами не знаете, верно это или нет, тогда следует построить гистограмму и посмотреть, похожа ли она на нормальную.
Есть еще глазомерный метод, при котором нужно взять выборочную функцию распределения и применить к ней функцию, обратную к ф.р. стандартного нормального закона. После этого преобразования точки должны приблизительно лежать на прямой, если это действительно нормальный закон. Для такого количества значений метод должен работать очень хорошо.

Если имеются очевидные отклонения от нормальности, то с помощью этих способов Вы их увидите.

Если же Вы видите, что данные действительно похожи на нормальное распределение, и это нужно количественно обосновать, тогда применяйте указанные выше методы.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение23.07.2010, 18:50 
Аватара пользователя


31/05/09
117
Calgary, AB
Цитата:
Есть критерий Колмогорова, еще Пирсона.

вот еще нашел критерий Колмогорова-Смирнова, для двух эмпирических функций. Я думаю разделить 1млн чисел на 2 набора по 500 тысяч. Только там в расчете подставляется "уровень значимости" ($\alpha$), откуда ее взять?

Цитата:
Если Вы еще сами не знаете, верно это или нет, тогда следует построить гистограмму и посмотреть, похожа ли она на нормальную.


не подскажете какой математический пакет может такое?

Цитата:
Если же Вы видите, что данные действительно похожи на нормальное распределение, и это нужно количественно обосновать, тогда применяйте указанные выше методы.


Нет, этого не нужно. Я решил задачу по программированию (улучшить существующий генератор случайных чисел), но вот досада, в книге не приведены ответы, а проверить хочется.

Если что, выложил числа в архив
http://gateway11.ath.cx/files/task_7_9.zip

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение23.07.2010, 18:59 
Заслуженный участник


11/05/08
32166
GrishinUS в сообщении #340557 писал(а):
Я решил задачу по программированию (улучшить существующий генератор случайных чисел),

Это довольно странная задача. Исходя из каких критериев улучшить-то?...

Ну да. Проверить нормальность генератора нормальных чисел, основанного на том генераторе -- это один из критериев. Однако же довольно странный. Он толком ничего и не проверяет.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение24.07.2010, 12:09 
Заслуженный участник


12/07/07
4522
GrishinUS, если, используя данные файла task_7_9.zip (4.6 Мб, мною скачивался 23.07.10), построить гистограмму, то очевидно: «числа не являются распределенными нормально». Возможно, Вы описались, и вместо проверки «на нормальность» следует проверить «равномерность».

Гистограмму могут строить разные пакеты, например, Statistica, Maple,… но построить гистограмму можно и написав простенькую программу при помощи универсального алгоритмического языка высокого уровня (Си, Паскаль,...).

Введение в теорию генераторов случайных чисел (ГСЧ) можно посмотреть в книге Кнут Д. Искусство программирования, Т2 (свободно доступна в электронном виде poiskknig.ru). В этой книге есть глава, посвященная тестированию ГСЧ. Это довольно сложный вопрос.

На форуме уже есть темы, посвященные генераторам случайных чисел, например:
Тестирование ГСЧ (раздел «Околонаучный софт»), Генерация случайных чисел (раздел «Программирование»). Если, после прочтения книг, будут серьезные вопросы, то лучше задавать их в этих темах.

(Оффтоп)

GrishinUS, напоминаю, в соответствии с правилами форума «Начальные сообщения любой темы должны четко и внятно формулировать предмет или вопрос, который предполагается обсудить. В противном случае тема будет закрыта или перемещена в карантин до уточнения предмета» и «По возможности следует избегать использования внешних ссылок, а включать всю необходимую информацию в текст сообщений».

Не заставляйте участников гадать и без особого смысла скачивать толстый файл.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение24.07.2010, 21:09 
Аватара пользователя


31/05/09
117
Calgary, AB
Цитата:
Это довольно странная задача. Исходя из каких критериев улучшить-то?...


Улучшить только в плане работы с большими диапазонами чем существующий генератор, который принимает только числа в диапазоне $[0;32767]$. При подаче в него 100 он должен выдать число в диапазоне $[0;100]$.

Цитата:
GrishinUS, если, используя данные файла task_7_9.zip (4.6 Мб, мною скачивался 23.07.10), построить гистограмму, то очевидно: «числа не являются распределенными нормально». Возможно, Вы описались, и вместо проверки «на нормальность» следует проверить «равномерность».


Действительно, мне следует проверить равномерность (проблемы с терминологией).
Я правильно понимаю график в осях по у фактическая вероятность, по х число из выборки должен напоминать горизонтальную линию?

Цитата:
Введение в теорию генераторов случайных чисел (ГСЧ) можно посмотреть в книге Кнут Д. Искусство программирования, Т2 (свободно доступна в электронном виде poiskknig.ru). В этой книге есть глава, посвященная тестированию ГСЧ. Это довольно сложный вопрос.


Кнут мне пока не по зубам, читаю что попрощще.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение26.07.2010, 11:40 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
GrishinUS в сообщении #340693 писал(а):
Улучшить только в плане работы с большими диапазонами чем существующий генератор, который принимает только числа в диапазоне $[0;32767]$. При подаче в него 100 он должен выдать число в диапазоне $[0;100]$


Все равно непонятно. Перевести значения большего диапазона в меньший - не проблема. Да и обратно тоже. Так что если в существующем генераторе не устраивает только шкала выходных значений, то это не достаточно весомая причина писать новый генератор.

Помимо равномерности распределения, нужно еще проверять независимость соседних (более общо - близких) значений, да и еще много чего другого. Поищите "тесты на случайность".

Для построения гистограмм и вообще статистических расчетов всевозможных я рекомендую освоить бесплатный пакет R.

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение28.07.2010, 09:05 
Аватара пользователя


31/05/09
117
Calgary, AB
Цитата:
Все равно непонятно. Перевести значения большего диапазона в меньший - не проблема. Да и обратно тоже. Так что если в существующем генераторе не устраивает только шкала выходных значений, то это не достаточно весомая причина писать новый генератор.


Мое "улучшить" = Ваше "Перевести значения большего диапазона в меньший".

Цитата:
Для построения гистограмм и вообще статистических расчетов всевозможных я рекомендую освоить бесплатный пакет R.


Вот за это спасибо!

 Профиль  
                  
 
 Re: Распределены ли числа нормально?
Сообщение29.07.2010, 11:15 
Аватара пользователя


08/06/09
59
Как вариант, попробуйте использовать "правило трех сигма". Если оно выполняется, то есть основания предполагать - слачайная величина распределена по нормальному закону.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group