2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 12:09 


12/09/12
7
Пытаюсь понять, как была получена сплошная кривая на этом графике. Там сказано, что это плотность биномиального распределения с параметрами 249, 0.5. Однако, по оси x - дроби от 0 до 1, а биномиальное распределение, насколько мне известно, должно выдать целые числа от 0 до 249.

Код на R выдает очень похожую кривую (константы из ссылки)
Используется синтаксис C
db<-dbinom(0:249, size=249, prob=0.5)
plot(x=seq(0, 1, along.with=db), y=db*9060003, type="l")


Справедливо ли мое подозрение, что я, вот так масштабируя по осям, могу подогнать биномиальное распределение с любыми параметрами к нужному мне виду (скажем, к гистограмме, которая тоже есть на графике в ссылке выше)?

Вообще, это все про распознавание/аутентификацию по радужной оболочке глаза. При этой процедуре из цифрового изображения радужки генерируется битовая строка, и потом вычисляется расстояние Хэмминга между этими строками (т.е. кол-во отличающихся битов на совпадающих позициях).

Поскольку части радужной оболочки могут быть закрыты ресницами и веками, еще дополнительно вводятся маски, и:
(1) подчитываются только те отличающиеся биты, для которых в обеих масках стоит 1;
(2) количество отличающихся битов делится на количество битов, для которых в обеих масках стоит 1.

Получаем в результате некое дробное расстояние Хэмминга.

Сравнивая разные радужки, получаем выборку таких расстояний (она представлена в исходной ссылке гистограммой).

Я не могу объяснить, как и почему биномиальный закон распределения описывает распределение этих дробных чисел.

 Профиль  
                  
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 12:31 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
wl2776 в сообщении #1036908 писал(а):
сказано, что это плотность биномиального распределения с параметрами 249, 0.5.

Плотности бывают только у непрерывных распределений, а биномиальное распределение - дискретное.
Думаю, что на картинке вы видите результат аппроксимации биномиального распределения нормальным, возможность такой аппроксимации обеспечивает интегральная т. Муавра-Лапласа (ну, и, возможно, еще каких-то действий с распределением).
wl2776 в сообщении #1036908 писал(а):
Справедливо ли мое подозрение, что я, вот так масштабируя по осям, могу подогнать биномиальное распределение с любыми параметрами к нужному мне виду (скажем, к гистограмме)?

Не думаю, что такое возможно, при масштабировании не удастся избавиться, например, от симметричности и других особенностей биномиального распределения, которых нет у некоторых других распределений.

 Профиль  
                  
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 14:53 


12/09/12
7
Brukvalub в сообщении #1036913 писал(а):
wl2776 в сообщении #1036908 писал(а):
сказано, что это плотность биномиального распределения с параметрами 249, 0.5.
Плотности бывают только у непрерывных распределений, а биномиальное распределение - дискретное.

Ну, там прямо черным по белому сказано, мол, "binomial PDF", т.е. Probability Density Function.

Brukvalub в сообщении #1036913 писал(а):
wl2776 в сообщении #1036908 писал(а):
Справедливо ли мое подозрение, что я, вот так масштабируя по осям, могу подогнать биномиальное распределение с любыми параметрами к нужному мне виду (скажем, к гистограмме)?
Не думаю, что такое возможно, при масштабировании не удастся избавиться, например, от симметричности и других особенностей биномиального распределения, которых нет у некоторых других распределений.

Хорошо, а к симметричной гистограмме можно подогнать, теоретически?

 Профиль  
                  
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 15:30 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
wl2776 в сообщении #1036940 писал(а):
Хорошо, а к симметричной гистограмме можно подогнать, теоретически?

Нет, нужна, например, еще унимодальность и т.п.

 Профиль  
                  
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение14.07.2015, 21:03 
Заслуженный участник


27/04/09
28128
wl2776 в сообщении #1036940 писал(а):
Ну, там прямо черным по белому сказано, мол, "binomial PDF", т.е. Probability Density Function.
Значит, это либо сокращение не от probability density function, либо они оплошали. :-) Для дискретных величин функция вероятностей отдельных значений по-английски зовётся probability mass function.

 Профиль  
                  
 
 Re: Биномиальное распределение при распознавании по радужке глаз
Сообщение15.07.2015, 11:13 


12/09/12
7
На всякий случай уточню еще, что маски валидных битов не постоянны, они рассчитываются индивидуально для каждого изображения (алгоритмы сегментации - отдельная тема), даже количество единичек в маске может меняться. Также, вероятность того, что какой-то отдельный бит будет замаскирован, меняется от бита к биту, и еще зависит от соседей.

Поэтому нельзя говорить о дискретной дробной случайной величине типа $0/n, 1/n, 2/n,..., (n-1)/n$, которую биномиальное распределение описало бы.

-- 15.07.2015, 12:38 --

Brukvalub в сообщении #1036945 писал(а):
wl2776 в сообщении #1036940 писал(а):
Хорошо, а к симметричной гистограмме можно подогнать, теоретически?

Нет, нужна, например, еще унимодальность и т.п.


Я вот к чему придираюсь.
В статье автор получил гистограмму (на хорошей, правда, выборке, больше 9 миллионов), натянул на нее аналитическую кривую и на основании этого строит теорию и формулирует правило отделения своих от чужих.
Сравнение двух битов - это испытание Бернулли.
А нельзя ли какую-то другую кривую так же натянуть?

Правда, в статье автор еще приводит quantile-quantile график наблюденных значений и биномиального распределения, который представляет собой прямую линию (на страничке есть ссылка на pdf-файл, там рис. 5)

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group