2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: эмпирический закон Бенфорда о первых цифрах чисел
Сообщение24.12.2009, 20:40 
Заслуженный участник
Аватара пользователя


03/06/09
1497
topic20348.html

 i  темы объединены! // maxal

 Профиль  
                  
 
 эмпирический закон Бенфорда о первых цифрах чисел
Сообщение24.12.2009, 20:51 


20/12/09
1527
Предположим для простоты, что измеряемые величины распределены равномерно на отрезке от 0 до своего максимума.
Рассмотрим, например, величину распределенную равномерно от 0 до 700. На интервале от 0 до 100 первая цифра такой величины принимает значения от 1 до 9 с равной частотой $\frac 1 9$, на интервале от 100 до 700 возможно шесть равноправных вариантов первой цифры: 1,2,3,4,5,6.
Таким образом, первые цифры этой величины будут встречаться со следующей частотой (вероятностью):
$p(1)= p(2)= p(3)= p(4) = p(5) = p(6) =\frac 1 9\frac 1 7   + \frac 1 7, p(7) = p(8) = p(9) =\frac 1 9 \frac 1 7   $
Такое же распределение будет, если величина меняется от 0 до 70, 7000, 70000 и т.д.

Для величин, меняющихся от 0 до 200,300,400, ...., 1000 аналогичные распределения для первых цифр такие:

$\begin{array}{cccccccccc} {}&{p(1)}& {p(2)}& {p(3)}& {p(4)}& {p(5)}& {p(6)}& p(7)}& {p(8)}& {p(9)}\\ {200}&{\frac 1 9\frac 1 2   + \frac 1 2} &{\frac 1 9\frac 1 2} & {\frac 1 9\frac 1 2}&{\frac 1 9\frac 1 2}&{\frac 1 9\frac 1 2}&{\frac 1 9\frac 1 2}&{\frac 1 9\frac 1 2}&{\frac 1 9\frac 1 2}&{\frac 1 9\frac 1 2}\\{300}& {\frac 1 9\frac 1 3   + \frac 1 3} &{\frac 1 9\frac 1 3 + \frac 1 3} & {\frac 1 9\frac 1 3}&{\frac 1 9\frac 1 3}&{\frac 1 9\frac 1 3}&{\frac 1 9\frac 1 3}&{\frac 1 9\frac 1 3}&{\frac 1 9\frac 1 3}&{\frac 1 9\frac 1 3}\\{400}& {\frac 1 9\frac 1 4   + \frac 1 4} &{\frac 1 9\frac 1 4 + \frac 1 4} & {\frac 1 9\frac 1 4+ \frac 1 4}&{\frac 1 9\frac 1 4}&{\frac 1 9\frac 1 4}&{\frac 1 9\frac 1 4}&{\frac 1 9\frac 1 4}&{\frac 1 9\frac 1 4}&{\frac 1 9\frac 1 4}\\{500}& {\frac 1 9\frac 1 5   + \frac 1 5} &{\frac 1 9\frac 1 5 + \frac 1 5} & {\frac 1 9\frac 1 5+ \frac 1 5}&{\frac 1 9\frac 1 5+ \frac 1 5}&{\frac 1 9\frac 1 5}&{\frac 1 9\frac 1 5}&{\frac 1 9\frac 1 5}&{\frac 1 9\frac 1 5}&{\frac 1 9\frac 1 5}\\{600}&{\frac 1 9\frac 1 6   + \frac 1 6} &{\frac 1 9\frac 1 6 + \frac 1 6} & {\frac 1 9\frac 1 6+ \frac 1 6}&{\frac 1 9\frac 1 6+ \frac 1 6}&{\frac 1 9\frac 1 6+ \frac 1 6}&{\frac 1 9\frac 1 6}&{\frac 1 9\frac 1 6}&{\frac 1 9\frac 1 6}&{\frac 1 9\frac 1 6}\\{700}&{\frac 1 9\frac 1 7   + \frac 1 7} &{\frac 1 9\frac 1 7 + \frac 1 7} & {\frac 1 9\frac 1 7+ \frac 1 7}&{\frac 1 9\frac 1 7+ \frac 1 7}&{\frac 1 9\frac 1 7+ \frac 1 7}&{\frac 1 9\frac 1 7+ \frac 1 7}&{\frac 1 9\frac 1 7}&{\frac 1 9\frac 1 7}&{\frac 1 9\frac 1 7}\\ {800}&{\frac 1 9\frac 1 8   + \frac 1 8} &{\frac 1 9\frac 1 8 + \frac 1 8} & {\frac 1 9\frac 1 8+ \frac 1 8}&{\frac 1 9\frac 1 8+ \frac 1 8}&{\frac 1 9\frac 1 8+ \frac 1 8}&{\frac 1 9\frac 1 8+ \frac 1 8}&{\frac 1 9\frac 1 8+ \frac 1 8}&{\frac 1 9\frac 1 8}&{\frac 1 9\frac 1 8}\\ {900}&{\frac 1 9\frac 1 9   + \frac 1 9} &{\frac 1 9\frac 1 9 + \frac 1 9} & {\frac 1 9\frac 1 9+ \frac 1 9}&{\frac 1 9\frac 1 9+ \frac 1 9}&{\frac 1 9\frac 1 9+ \frac 1 9}&{\frac 1 9\frac 1 9+ \frac 1 9}&{\frac 1 9\frac 1 9+ \frac 1 9}&{\frac 1 9\frac 1 9+ \frac 1 9}&{\frac 1 9\frac 1 9}\\{1000}&{\frac 1 9} &{\frac 1 9} & {\frac 1 9}&{\frac 1 9}&{\frac 1 9}&{\frac 1 9}&{\frac 1 9}&{\frac 1 9}&{\frac 1 9}\end{array} $

-- Чт дек 24, 2009 20:57:33 --

Предположим далее, что все эти девять распределений встречаются одинаково часто. Тогда, если сложить эти распределения и поделить на 9, можно получить универсальное среднее распределение, которое, на мой взгляд, и описывает износ логарифмических таблиц.

-- Чт дек 24, 2009 21:04:20 --

$\begin{array}{ccccccccc} {p(1)}& {p(2)}& {p(3)}& {p(4)}& {p(5)}& {p(6)}& p(7)}& {p(8)}& {p(9)}\\ {0.238}& {0.183}& {0.146}& {0.118}& {0.096}& {0.077}& {0.061}& {0.047}& {0.035} \end{array} $

-- Чт дек 24, 2009 21:08:30 --

Это также распределение первой цифры в таблице умножения. Особенно хорошо это видно, если умножать друг на друга числа от 10 до 99 или от 100 до 999.

-- Чт дек 24, 2009 21:12:09 --

$p(n)=(10*ln(10)/9+1-(n+1)*ln(n+1)+n*ln(n))/9$

-- Чт дек 24, 2009 21:18:41 --

Такое объяснение, на мой взгляд, более универсально, чем через экспоненциальный рост и эргодическую теорию. В мире не так уж и много экспоненциально растущих величин - расти особенно некуда.

-- Чт дек 24, 2009 21:43:47 --

Я проверил эту теорию по первым цифрам величин, встречающихся в Советском Энциклопедическом Словаре, на страницах со словами, начинающимися с ЧАРЕ-ЧЖУА. Даты, года, пункты и устойчивые сочетания типа 1-ая Конная армия, пропускал.
Получилась следующая статистика:
$\begin{array}{ccccccccc} {p(1)}& {p(2)}& {p(3)}& {p(4)}& {p(5)}& {p(6)}& p(7)}& {p(8)}& {p(9)}\\ {0.276}& {0.166}& {0.144}& {0.127}& {0.088}& {0.061}& {0.066}& {0.044}& {0.027} \end{array} $
Среднее квадратичное отклонение от моего теоретического распределения 0.016, от распределения Бенфорда $log_{10}(\frac{n+1}n)$ 0.017.
По мере роста выборки эмпирическое распределение то лучше совпадало с моим, то с распределением Бенфорда.

Та статистика, которую собрал Бенфорд, подтверждает его распределение:
$\begin{array}{ccccccccc} {p(1)}& {p(2)}& {p(3)}& {p(4)}& {p(5)}& {p(6)}& p(7)}& {p(8)}& {p(9)}\\ {0.301}& {0.176}& {0.125}& {0.097}& {0.079}& {0.067}& {0.058}& {0.051}& {0.046} \end{array} $

 Профиль  
                  
 
 эмпирический закон Бенфорда о первых цифрах чисел
Сообщение24.12.2009, 21:56 


20/12/09
1527
Согласно моему распределению 1 и 9 должны встречатся реже, а 2,3,4,5,6 чаще, чем полагал и зафиксировал Бенфорд.

В заключение замечу, что иногда статистику накапливают до тех пор, пока она не подтвердит теорию. Это неправильно, но так делают.

 Профиль  
                  
 
 Re: Закон Бенфорда
Сообщение25.12.2009, 06:35 
Модератор
Аватара пользователя


11/01/06
5660
В этой связи уместно упомянуть т.н. вопрос Гельфанда:
http://mathworld.wolfram.com/GelfandsQuestion.html

 Профиль  
                  
 
 Re: эмпирический закон Бенфорда о первых цифрах чисел
Сообщение25.12.2009, 13:14 
Заблокирован
Аватара пользователя


05/12/09

126
Brest BY
Ales в сообщении #274861 писал(а):
Я узнал про это закон из книг и статей В.И. Арнольда, например "Антинаучная революция и математика":
http://www.mmonline.ru/articles.php?mid=1006&topic=207.
Еще можно прочитать статью другого автора:
http://veinik.ru/science/fizmat/article/119.html

Для тех, кто про этот закон не слышал, вкратце изложу его историю.
Американский астроном С. Ньюкомб в 1881 году обратил внимание на то, что страницы библиотечных книг, содержащих логарифмические таблицы, истрепаны и сношены там, где содержатся логарифмы чисел, начинающихся на 1. А страницы с логарифмами чисел, начинающихся на 9 - совсем как новенькие. Отсюда получается, что в разных вычислениях и измерениях люди чаще всего встречают числа, которые начинаются на 1. Числа, начинающиеся на 2, 3, 4 и так далее, встречаются все реже. Совсем редко встречаются числа, которые начинаются на 9.

В 1938 году это явление переоткрыл другой американец - физик Ф. Бенфорд.
...

Но этот эмпирический закон можно объяснить и по-другому.

С удовольствием прочитал. И то, что всё "переоткрывается" только после того как ОДИН (хотя бы) раз уже было открыто, и то в жизни (не из теории, а из практики) чаще встречаются числа с первой единицей - верю, по Жванецкому,- сразу и навсегда.

Не зная о таком законе обнаружил, что в любом словаре (толковом и/или поли.., даже русско-белорусском_) слов, начинающихся на ОДНО(-член,-кратно...) много больше, чем МНОГО(-член, -кратно...). Может поэтому и 1математику или 1арифметику сочинить охота. А что касается широкораспространимости чисел, начинающихся на 1, то, наверно, не ПЕРВЫЙ и не последний пример такой: если переписать всех-всех жителей Земли и записать их рост (не в километрах), то эффект будет (новорождённые, естественно, сразу такого роста не имеют).
Так что, за последнюю строку поста - отдельное +1 спасибо. З павагай

 Профиль  
                  
 
 Re: Закон Бенфорда
Сообщение25.12.2009, 13:17 


20/12/09
1527
maxal в сообщении #275030 писал(а):
В этой связи уместно упомянуть т.н. вопрос Гельфанда:
http://mathworld.wolfram.com/GelfandsQuestion.html


Если принять мое объяснение, то этот вопрос Гельфанда никак не связан с эмпирическим законом Бенфорда.

А если принять объяснение через экспоненциальный рост, то связан. Причем у Арнольда написано как решать такой вопрос:
надо рассмотреть орбиту сдвига на $(log_{10}2,log_{10}3,....,log_{10}9)$ в торе $T^8$.

Я сходу предложил неправильное решение:
Поскольку эти логарифмы иррациональны и их взаимные отношения иррациональны эта орбита будет всюду плотна в торе и распределена равномерно по объему (из эргодической теории). Значит частота появления 23456789 = объему соответствующего кубика = $(log_{10}3-log_{10}2)*(log_{10}4-log_{10}3)*.....*(1-log_{10}9) = 1.534...*10^{-9}$.

На самом деле конечно $2log_{10}2=log_{10}4$, $3log_{10}2=log_{10}8$, $2log_{10}3=log_{10}9$, $log_{10}2+log_{10}3=log_{10}6$. Это усложняет задачу, но на мой взгляд не принципиально. Надо рассмотреть соответствующую плоскость в торе и объем ее пересечения с кубиком.

-- Пт дек 25, 2009 14:09:43 --

$2x_2=x_4, 3x_2=x_8, 2x_3=x_9, x_2+x_3=x_6$

 Профиль  
                  
 
 Re: Закон Бенфорда
Сообщение25.12.2009, 14:32 


20/12/09
1527
И еще $log_{10}2+log_{10}5=1$, $x_2+x_5=0$.

Исходя из этой формулы сочетание цифр 2**5****, а уж тем более 23456789, встречается только один раз, когда n=1.

-- Пт дек 25, 2009 14:52:53 --

Либо первая цифра >=2 и четвертая <5, либо первая цифра 1, а четвертая >= 5.

 Профиль  
                  
 
 Re: Закон Бенфорда
Сообщение25.12.2009, 19:04 
Заслуженный участник
Аватара пользователя


11/01/06
3822

(Оффтоп)

infoliokrat в сообщении #275071 писал(а):
Может поэтому и 1математику или 1арифметику сочинить охота.
ЭТО не Ваше творение случаем? :D

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 23 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group