2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Учет перспективы при распознавании изображений
Сообщение24.07.2008, 17:32 


10/02/06
54
Добрый день, коллеги.

Я распознаю 2-мерные аналоги штрихкодов (Data Matrix, QR Code - http://en.wikipedia.org/wiki/Datamatrix), снятые на камеру телефона.

В большинстве случаев задачу можно рассматривать как плоскую. Оригинальный код - это квадратная область, равномерно разбитая на квадратные ячейки (напоминает шахматную доску). При съемке его форма может искажаться и на изображении мы имеем произвольный четырехугольник, что не мешает процессу распознавания - находим четыре угла, количество ячеек в строке/столбце, и равномерно делим каждую сторону 4-угольника для проведения отрезков сетки, в узлах которой находятся центры ячеек. После построения сетки задачу можно считать решенной.

Проблема возникает на снимках, сделанных с близкого расстояния под углом. Т.е., как и раньше мы находим 4 угла, но, за счет перспективы, сетка делит стороны 4-угольника-образа не равномерно - ячейки, расположенные дальше от плоскости проектирования имеют меньшие размеры.

В общем виде задача стоит так:
1. Имеется центральная перспективная проекция с фокусом в точке (0, 0, -f), и плоскостью проектирования XY (матрица фотокамеры). f - неизвестно.
2. Имеется спроектированный образ - 4-угольник. Т.е. 4 точки вершины A'(x, y, 0), B'(x, y, 0), C'(x, y, 0), D'(x, y, 0).
3. Известно, что оригинальная фигура - квадрат (все Z положительны).

Вопрос:
Достаточно ли нам этой информации для получения пространственных координат прообраза (A(x, y, z), B(x, y, z), C(x, y, z), D(x, y, z)) и как их получить?

Собственно узнать надо меньше. Достаточно иметь оценку размеров ячейки на снимке (образе) для различных участков кода. Т.е. очень грубое приближение - есть хорошее решение.

При поверхностном анализе получается, что мы можем решить задачу в общем виде. Мы имеем 13 неизвестных - координаты 4 точек и фокусное расстояние - f. Уравнений вроде бы можно составить достаточное количество. Но ресурсов процессора мобильного устройства для решения такой системы не хватит.

Если кто сталкивался / имеет соображения / может посоветовать литературу - помогите кто чем может.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group