Последний раз редактировалось mathpath 25.10.2022, 14:37, всего редактировалось 1 раз.
Как работают системы распознавания лиц, установленные в метро, аэропортах ?
Я слабо представляю, как это выглядит Имеется эталонная база данных людей, на каждого человека в этой базе, как я понимаю, заведена пара фотографий в профиль и в анфас. Понятно, что может быть и больше, но в основном, как я понимаю, одна-две-три фотографии.
Видеокамера пишет видео, на видео мелькает интересующий нас субьект несколько секунд Далее эти несколько секунд парсятся, и на интересующего субьекта генерится пачка фотографий
Потом эта пачка фотографий поступает на вход классификатора. Эти фотки обрабатываются и сравниваются с базой данной В этой эталонной базе данных нужно найти всего одного человека, если он там есть, который представлен всего двумя-тремя эталонными фотографиями
И вот тут у меня диссонанс ... Классические алгоритмы распознавания изображений построены наоборот: имеется большая база данных, допустим классификация собак по породам На вход поступает - одна ! - фотография собаки, далее она классифицируется как определенная порода собака Т.е. здесь на входе - один обьект, а эталонная база очень большая
А в случае с распознаванием личности все наоборот - на входе куча обьектов, и нужно определить не класс обьекта, а идентифицировать обьект по эталонной базе, т.е. найти иголку в стоге сена
Как это работает ?
PS: хотя немного подумал и понял: по пачке входных фотографий строится стандартная модель а потом по ней прогоняется вся эталонная база
|