2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Распределены ли числа нормально?
Сообщение22.07.2010, 14:48 
Аватара пользователя
Добрый день,

есть 1 млн. целых чисел от 0 до 2^31 - 1.
Как проверить распределены ли они нормально?
Заранее спасибо.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение22.07.2010, 15:08 
Есть критерий Колмогорова, еще Пирсона.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение23.07.2010, 09:50 
Аватара пользователя
Если Вы еще сами не знаете, верно это или нет, тогда следует построить гистограмму и посмотреть, похожа ли она на нормальную.
Есть еще глазомерный метод, при котором нужно взять выборочную функцию распределения и применить к ней функцию, обратную к ф.р. стандартного нормального закона. После этого преобразования точки должны приблизительно лежать на прямой, если это действительно нормальный закон. Для такого количества значений метод должен работать очень хорошо.

Если имеются очевидные отклонения от нормальности, то с помощью этих способов Вы их увидите.

Если же Вы видите, что данные действительно похожи на нормальное распределение, и это нужно количественно обосновать, тогда применяйте указанные выше методы.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение23.07.2010, 18:50 
Аватара пользователя
Цитата:
Есть критерий Колмогорова, еще Пирсона.

вот еще нашел критерий Колмогорова-Смирнова, для двух эмпирических функций. Я думаю разделить 1млн чисел на 2 набора по 500 тысяч. Только там в расчете подставляется "уровень значимости" ($\alpha$), откуда ее взять?

Цитата:
Если Вы еще сами не знаете, верно это или нет, тогда следует построить гистограмму и посмотреть, похожа ли она на нормальную.


не подскажете какой математический пакет может такое?

Цитата:
Если же Вы видите, что данные действительно похожи на нормальное распределение, и это нужно количественно обосновать, тогда применяйте указанные выше методы.


Нет, этого не нужно. Я решил задачу по программированию (улучшить существующий генератор случайных чисел), но вот досада, в книге не приведены ответы, а проверить хочется.

Если что, выложил числа в архив
http://gateway11.ath.cx/files/task_7_9.zip

 
 
 
 Re: Распределены ли числа нормально?
Сообщение23.07.2010, 18:59 
GrishinUS в сообщении #340557 писал(а):
Я решил задачу по программированию (улучшить существующий генератор случайных чисел),

Это довольно странная задача. Исходя из каких критериев улучшить-то?...

Ну да. Проверить нормальность генератора нормальных чисел, основанного на том генераторе -- это один из критериев. Однако же довольно странный. Он толком ничего и не проверяет.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение24.07.2010, 12:09 
GrishinUS, если, используя данные файла task_7_9.zip (4.6 Мб, мною скачивался 23.07.10), построить гистограмму, то очевидно: «числа не являются распределенными нормально». Возможно, Вы описались, и вместо проверки «на нормальность» следует проверить «равномерность».

Гистограмму могут строить разные пакеты, например, Statistica, Maple,… но построить гистограмму можно и написав простенькую программу при помощи универсального алгоритмического языка высокого уровня (Си, Паскаль,...).

Введение в теорию генераторов случайных чисел (ГСЧ) можно посмотреть в книге Кнут Д. Искусство программирования, Т2 (свободно доступна в электронном виде poiskknig.ru). В этой книге есть глава, посвященная тестированию ГСЧ. Это довольно сложный вопрос.

На форуме уже есть темы, посвященные генераторам случайных чисел, например:
Тестирование ГСЧ (раздел «Околонаучный софт»), Генерация случайных чисел (раздел «Программирование»). Если, после прочтения книг, будут серьезные вопросы, то лучше задавать их в этих темах.

(Оффтоп)

GrishinUS, напоминаю, в соответствии с правилами форума «Начальные сообщения любой темы должны четко и внятно формулировать предмет или вопрос, который предполагается обсудить. В противном случае тема будет закрыта или перемещена в карантин до уточнения предмета» и «По возможности следует избегать использования внешних ссылок, а включать всю необходимую информацию в текст сообщений».

Не заставляйте участников гадать и без особого смысла скачивать толстый файл.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение24.07.2010, 21:09 
Аватара пользователя
Цитата:
Это довольно странная задача. Исходя из каких критериев улучшить-то?...


Улучшить только в плане работы с большими диапазонами чем существующий генератор, который принимает только числа в диапазоне $[0;32767]$. При подаче в него 100 он должен выдать число в диапазоне $[0;100]$.

Цитата:
GrishinUS, если, используя данные файла task_7_9.zip (4.6 Мб, мною скачивался 23.07.10), построить гистограмму, то очевидно: «числа не являются распределенными нормально». Возможно, Вы описались, и вместо проверки «на нормальность» следует проверить «равномерность».


Действительно, мне следует проверить равномерность (проблемы с терминологией).
Я правильно понимаю график в осях по у фактическая вероятность, по х число из выборки должен напоминать горизонтальную линию?

Цитата:
Введение в теорию генераторов случайных чисел (ГСЧ) можно посмотреть в книге Кнут Д. Искусство программирования, Т2 (свободно доступна в электронном виде poiskknig.ru). В этой книге есть глава, посвященная тестированию ГСЧ. Это довольно сложный вопрос.


Кнут мне пока не по зубам, читаю что попрощще.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение26.07.2010, 11:40 
Аватара пользователя
GrishinUS в сообщении #340693 писал(а):
Улучшить только в плане работы с большими диапазонами чем существующий генератор, который принимает только числа в диапазоне $[0;32767]$. При подаче в него 100 он должен выдать число в диапазоне $[0;100]$


Все равно непонятно. Перевести значения большего диапазона в меньший - не проблема. Да и обратно тоже. Так что если в существующем генераторе не устраивает только шкала выходных значений, то это не достаточно весомая причина писать новый генератор.

Помимо равномерности распределения, нужно еще проверять независимость соседних (более общо - близких) значений, да и еще много чего другого. Поищите "тесты на случайность".

Для построения гистограмм и вообще статистических расчетов всевозможных я рекомендую освоить бесплатный пакет R.

 
 
 
 Re: Распределены ли числа нормально?
Сообщение28.07.2010, 09:05 
Аватара пользователя
Цитата:
Все равно непонятно. Перевести значения большего диапазона в меньший - не проблема. Да и обратно тоже. Так что если в существующем генераторе не устраивает только шкала выходных значений, то это не достаточно весомая причина писать новый генератор.


Мое "улучшить" = Ваше "Перевести значения большего диапазона в меньший".

Цитата:
Для построения гистограмм и вообще статистических расчетов всевозможных я рекомендую освоить бесплатный пакет R.


Вот за это спасибо!

 
 
 
 Re: Распределены ли числа нормально?
Сообщение29.07.2010, 11:15 
Аватара пользователя
Как вариант, попробуйте использовать "правило трех сигма". Если оно выполняется, то есть основания предполагать - слачайная величина распределена по нормальному закону.

 
 
 [ Сообщений: 10 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group