Математика для обработки изображений и распознавания образов

Rockatansky · 24.04.2013, 10:16

Какие разделы математики из курса для математического университета/факультета наиболее важны для обработки изображений (image processing) и распознавания образов (pattern recognition)? Хочу знать, на что обращать пристальное внимание =)

Pavia · 24.04.2013, 11:52

На всё.
Вот краткий список того с чем приходилось сталкиваться:
Линейная алгебра, векторный и матричный анализ, тензорные исчисления. Интегралы, приделы. Фурье преобразование. Теория вероятности и статистики. Оптимизация. Дифуры. Теория автоматического управления. Теория комплексной переменной.
Дискретная математика.

Обычно все статьи написаны на языке математике и что бы их понимать его нужно знать.

Stan Slapenarski · 24.04.2013, 12:25

Как по мне, обращать пристальное внимание это уже чересчур :-)

– интересующей Вас работой с образами (чистая) математика непосредственно не занимается, в этой работе используются лишь фрагменты таких математических теорий и курсов. Из которых, наверное, прежде всего я назвал бы фрагменты линейной алгебры. Затем – аналитической геометрии и теории рядов и преобразований Фурье, а также аппроксимаций функций, и понятие метрики (для использования оной для сравнения). Разные там числовые фильтры, детекторы, методы сжатия – это уже не чистая университетская математика. Впрочем, я не вдавался очень глубоко в такую работу с образами, так что мое мнение не экспертно. Вы можете сами посмотреть статьи и книги по этой тематике, чтобы выяснить, какие разделы математики в них используются.

Nimza · 26.04.2013, 00:15

Топологию\дифгем тоже можно применять. Там даже многообразия Грассмана и Штифеля возникают! статья

А вообще, обращайте пристальное внимание на всё. Если что-то не используется сейчас, не факт, что оно не будет использоваться завтра. Может, Вы сами используете что-то чисто математическое, что до Вас никто не додумывался использовать (м.б. с грассмановыми многообразиями так и получилось?

)

B@R5uk · 28.04.2013, 09:43

Rockatansky, почитайте книгу С. Малла - Вейвлеты в обработке сигналов. Составите базовое представление о математике, лежащей в основе обработки изображений и звука.

xmaister · 29.04.2013, 10:09

Nimza
Плюсую за статью, весьма занятно

. А есть что-нибудь еще в этом же духе?

mrgloom_ · 29.04.2013, 12:47

Nimza в сообщении #715567 писал(а):

Топологию\дифгем тоже можно применять. Там даже многообразия Грассмана и Штифеля возникают!

можете пояснить для чего там вообще эти многообразия используются?
это вроде как называется manifold learning.
в machine learning допустим мы имеем m сэмплов и на их основе пытаемся построить "новое пространство"? т.е. мы хотим наши сэмплы туда отобразить и получить какие то "удобные свойства"? или просто в новом пространстве мы получим новую метрику? (метрику "похожести/близости" между сэмплами) (или это уже отдельное metric learning?)

ну я надеюсь я понятно объяснил, т.е. мы не хотим использовать готовую метрику, а метрика у нас должна зависеть от данных, по идее есть 2 варианта, это использовать какую то сложную формулу или отобразить наши сэмплы на какое то другое пространство и там опять использовать евклидову метрику. Вот хотелось бы узнать с какого бока тут подходят эти многообразия.

Цитата:

One of the fundamental questions of machine learning is how to compare examples. If an algorithm could perfectly determine whether two examples were semantically similar or dissimilar, most subsequent machine learning tasks would become trivial. For example, in classification settings, one would only require one labeled example per class and could then, during test-time, categorize all similar examples with the same class-label. An analogous reduction applies to regression if a continuous estimate of the degree of similarity were available.
...
A common choice of dissimilarity measure is an uninformed norm, like the Euclidean distance. Here it is assumed that the features are represented in a Euclidean subspace in which similar inputs are close and dissimilar inputs are far away. Although the Euclidean distance is convenient and intuitive, it ignores the fact that the semantic meaning of “similarity” is inherently task- and data-dependent.
...
It is therefore desirable to learn the metric (or data representation) explicitly.

Цитата:

Manifold Learning (often also referred to as non-linear dimensionality reduction) pursuits the goal to embed data that originally lies in a high dimensional space in a lower dimensional space, while preserving characteristic properties. This is possible because for any high dimensional data to be interesting, it must be intrinsically low dimensional. For example, images of faces might be represented as points in a high dimensional space (let’s say your camera has 5MP -- so your images, considering each pixel consists of three values [r,g,b], lie in a 15M dimensional space), but not every 5MP image is a face. Faces lie on a sub-manifold in this high dimensional space. A sub-manifold is locally Euclidean, i.e. if you take two very similar points, for example two images of identical twins, you can interpolate between them and still obtain an image on the manifold, but globally not Euclidean -- if you take two images that are very different --- for example Arnold Schwarzenegger and Hillary Clinton -- you cannot interpolate between them.

так вот какой прок с того что мы получаем sub-manifold который is locally Euclidean ?
чтобы точки в sub-manifold были сравнимы по евклидовой метрике? или не любые 2 точки, а только которые близки?

mrgloom_ · 29.04.2013, 15:07

похоже сам нашел ответ
http://www.cs.cmu.edu/~liuy/lle_isomap_metric.pdf

Научный форум dxdy

Математика для обработки изображений и распознавания образов