2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 12:09 
Пытаюсь понять, как была получена сплошная кривая на этом графике. Там сказано, что это плотность биномиального распределения с параметрами 249, 0.5. Однако, по оси x - дроби от 0 до 1, а биномиальное распределение, насколько мне известно, должно выдать целые числа от 0 до 249.

Код на R выдает очень похожую кривую (константы из ссылки)
Используется синтаксис C
db<-dbinom(0:249, size=249, prob=0.5)
plot(x=seq(0, 1, along.with=db), y=db*9060003, type="l")


Справедливо ли мое подозрение, что я, вот так масштабируя по осям, могу подогнать биномиальное распределение с любыми параметрами к нужному мне виду (скажем, к гистограмме, которая тоже есть на графике в ссылке выше)?

Вообще, это все про распознавание/аутентификацию по радужной оболочке глаза. При этой процедуре из цифрового изображения радужки генерируется битовая строка, и потом вычисляется расстояние Хэмминга между этими строками (т.е. кол-во отличающихся битов на совпадающих позициях).

Поскольку части радужной оболочки могут быть закрыты ресницами и веками, еще дополнительно вводятся маски, и:
(1) подчитываются только те отличающиеся биты, для которых в обеих масках стоит 1;
(2) количество отличающихся битов делится на количество битов, для которых в обеих масках стоит 1.

Получаем в результате некое дробное расстояние Хэмминга.

Сравнивая разные радужки, получаем выборку таких расстояний (она представлена в исходной ссылке гистограммой).

Я не могу объяснить, как и почему биномиальный закон распределения описывает распределение этих дробных чисел.

 
 
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 12:31 
Аватара пользователя
wl2776 в сообщении #1036908 писал(а):
сказано, что это плотность биномиального распределения с параметрами 249, 0.5.

Плотности бывают только у непрерывных распределений, а биномиальное распределение - дискретное.
Думаю, что на картинке вы видите результат аппроксимации биномиального распределения нормальным, возможность такой аппроксимации обеспечивает интегральная т. Муавра-Лапласа (ну, и, возможно, еще каких-то действий с распределением).
wl2776 в сообщении #1036908 писал(а):
Справедливо ли мое подозрение, что я, вот так масштабируя по осям, могу подогнать биномиальное распределение с любыми параметрами к нужному мне виду (скажем, к гистограмме)?

Не думаю, что такое возможно, при масштабировании не удастся избавиться, например, от симметричности и других особенностей биномиального распределения, которых нет у некоторых других распределений.

 
 
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 14:53 
Brukvalub в сообщении #1036913 писал(а):
wl2776 в сообщении #1036908 писал(а):
сказано, что это плотность биномиального распределения с параметрами 249, 0.5.
Плотности бывают только у непрерывных распределений, а биномиальное распределение - дискретное.

Ну, там прямо черным по белому сказано, мол, "binomial PDF", т.е. Probability Density Function.

Brukvalub в сообщении #1036913 писал(а):
wl2776 в сообщении #1036908 писал(а):
Справедливо ли мое подозрение, что я, вот так масштабируя по осям, могу подогнать биномиальное распределение с любыми параметрами к нужному мне виду (скажем, к гистограмме)?
Не думаю, что такое возможно, при масштабировании не удастся избавиться, например, от симметричности и других особенностей биномиального распределения, которых нет у некоторых других распределений.

Хорошо, а к симметричной гистограмме можно подогнать, теоретически?

 
 
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 15:30 
Аватара пользователя
wl2776 в сообщении #1036940 писал(а):
Хорошо, а к симметричной гистограмме можно подогнать, теоретически?

Нет, нужна, например, еще унимодальность и т.п.

 
 
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 21:03 
wl2776 в сообщении #1036940 писал(а):
Ну, там прямо черным по белому сказано, мол, "binomial PDF", т.е. Probability Density Function.
Значит, это либо сокращение не от probability density function, либо они оплошали. :-) Для дискретных величин функция вероятностей отдельных значений по-английски зовётся probability mass function.

 
 
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение15.07.2015, 11:13 
На всякий случай уточню еще, что маски валидных битов не постоянны, они рассчитываются индивидуально для каждого изображения (алгоритмы сегментации - отдельная тема), даже количество единичек в маске может меняться. Также, вероятность того, что какой-то отдельный бит будет замаскирован, меняется от бита к биту, и еще зависит от соседей.

Поэтому нельзя говорить о дискретной дробной случайной величине типа $0/n, 1/n, 2/n,..., (n-1)/n$, которую биномиальное распределение описало бы.

-- 15.07.2015, 12:38 --

Brukvalub в сообщении #1036945 писал(а):
wl2776 в сообщении #1036940 писал(а):
Хорошо, а к симметричной гистограмме можно подогнать, теоретически?

Нет, нужна, например, еще унимодальность и т.п.


Я вот к чему придираюсь.
В статье автор получил гистограмму (на хорошей, правда, выборке, больше 9 миллионов), натянул на нее аналитическую кривую и на основании этого строит теорию и формулирует правило отделения своих от чужих.
Сравнение двух битов - это испытание Бернулли.
А нельзя ли какую-то другую кривую так же натянуть?

Правда, в статье автор еще приводит quantile-quantile график наблюденных значений и биномиального распределения, который представляет собой прямую линию (на страничке есть ссылка на pdf-файл, там рис. 5)

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group