neurofish писал(а):
Нет необходимости определять координаты или параметры объекта, только его наличие.
Есть древний, но эффективный метод стохастической геометрии, решающий эту задачу в такой постановке. Он легко моделируется в сетевом варианте.
Суть метода:
Пусть детектор(поле зрения) распознавателя имеет круглую форму.
Пусть для простоты объект, который нужно распознать бинаризован, т.е. имеет 1 градацию яркости. В качестве объекта возьмем любую букву или цифру или отрезок прямой.
Выполним обучение распознаванию данного объекта.
1. Поместим объект в случайное место детектора и повернем на случайный угол.
2. Просканируем детектор одним из способов (фиксированным для всех случаев)
- Отрезком единичного размера << диаметра детектора, бросаемым случайным образом на детектор. Представте иголку, бросаемую на круглую площадку. Иголка будет случайно пересекать объект.
- Прямой линией пересекающей детектор под случайным углом и случайным смещением по x и y
- Синусоидой, окружностью или любой другой линией. Главное, чтобы всегда одинаковой.
Сканирование заключается в подсчете пересечений объекта со сканирующей линией
Выполним цикл 2 достаточное число раз и найдем среднее значение для единичного теста.
Выполним цикл 1 достаточное число раз и найдем среднее значение для всех тестов.
Эта величина и будет использоваться для распознавания данного объекта.
Для разных форм объектов эта величина будет уникальна с некоторой небольшой погрешностью.
Хотите, реализуйте несетевой вариант, просто поиск наилучшего соотвествия по массиву.
Или сетевой вариант - 1-3 слойный перцептрон, на вход подается сигнал (число с плавающей точкой), на выходе идентификатор объекта.
Можно заменить алгоритм сканирования, на вспомогательную нейросеть-глаз, выполяющую тоже самое, т.е преобразующую изображение в сигнал(число с плавающей точной), которое будет подавать на второй перцептрон-моск. Суть от реализации не меняется.
Метод устойчив к небольшим афинным искажениям формы, кривизны, масштаба, топологии
и абсолютно инвариантен к поворотам и сдвигам. Легко реализуется аппаратно, что и было сделано во многих быстродействующих устройствах технического зрения.
Ищите книги на тему "Методы стохастической геометрии для распознавания образов"