Цитата:
Закон Бенфорда или закон первой цифры гласит, что в таблицах чисел, основанных на данных источников из реальной жизни цифра 1 на первом месте встречается гораздо чаще, чем все остальные (приблизительно в 30% случаях). Более того, чем больше цифра, тем меньше вероятности, что она будет стоять на первом месте в числе. Закон применим к цифрам из обычного мира и социальной сферы, будь это показания электрического счётчика, цифры из газетной статьи, уличные адреса, цены акций, количество населения, уровень смертности, длина рек, физические и математические константы, и процессы, описываемые эмпирическими законами (которые весьма распространены в природе). Вот вся таблица Бенфорда:
1: 30.1 %
2: 17.6 %
3: 12.5 %
4: 9.7 %
5: 7.9 %
6: 6.7 %
7: 5.8 %
8: 5.1 %
9: 4.6 %
Долгое время этот закон не находил никакого практического применения. Однако недавно им заинтересовался Марк Нигрини, консультант по прикладной математике Канзасского университета. Он предположил, что большинство мошенников вряд ли знакомо с законом Бенфорда, и в любых наборах чисел, претендующих на правдоподобность, частота чисел, начинающихся с единицы, не будет превышать 1/9. Разработке компьютерных программ по выявлению потенциальных случаев фальсификации данных была посвящена его диссертация на соискание степени магистра, и в ходе ее написания он выявил, что человеческая психика тоже отдает некоторое предпочтение «числам, начинающимся с определенных цифр». Правда, на этот раз «любимыми» цифрами оказались 5 и 6. То есть, если любой произвольный набор чисел содержит менее трети чисел, начинающихся с 1, и при этом достаточно много чисел, начинающихся с 5 или 6 - вероятность фальсификации или ошибки достаточно велика.
Работой д-ра Нигрини заинтересовался районный прокурор Бруклина. Математику предложили проанализировать налоговые декларации, среди которых семь были заведомо фальсифицированными. Все они были выделены программой, как требующие тщательного аудита.
С тех пор взаимовыгодное сотрудничество прокуратуры и д-ра Нигрини продолжается и заключается в написании и отработке программ по тестированию любых данных на предмет фальсификации. Теперь такой проверке подвергаются и счета за использование электроэнергии, и квитанции на штрафы за нарушение правил дорожного движения, и многое другое.
Наиболее понятное для меня логическое объяснение закона Бенфорда заключается в том, что "маленьких" объектов больше, чем "больших". Почему мир устроен именно так? Еще интересно было бы услышать, как, помимо проверок на фальсификацию, используется этот замечательный закон?