Ищу алгоритм кластеризации данных

Mathemt · 18.01.2007, 18:25

При попытке создания торговой системы напрямую столкнулся с задачей кластеризации двумерного множества. Интуитивная постановка задачи такова:

Дано множество точек с координатами

(x, y, w)

(скажем, 1000 точек). Первые две координаты - обычные декартовы неотрицательные, третья - вес точки

(x, y).

Требуется кластеризовать это множество по сумме весов точек - причем расстояние (декартово) между точками кластера не должно превышать заданного диаметра. Число кластеров заранее неизвестно, так что k-means тут, похоже, не катит.

В принципе задачу легко свести к кластеризации обычных двумерных точек с идентичными весами. Буду очень рад, если кто-нибудь подскажет, где найти нормальный алгоритм, желательно реализованный на Си или Паскале (но не обязательно), чтобы перенести его в терминал МТ4.

reader_st · 19.01.2007, 14:16

Mathemt

Вот ссылочка на статью.

photon · 20.01.2007, 14:25

Сам я с этим совсем не работал, спросил сестру, которая разбирается чуть лучше меня, вот часть ее ответа:

сестра photon-а писал(а):

я на форуме региться не хочу, но ситуация такая:
1) лично я с точками, имеющими вес на работала, но, поскольку важно расстояние между точками, то ОДНОЗНАЧНО используются методы кластризации по плотности (OPTICS, DBSCAN, Chameleon и иже с ними). Коды по первым двум найти в сети не проблема...

Mathemt · 21.01.2007, 02:53

Большое спасибо откликнувшимся, поищем.

Я не указал некоторых обстоятельств, упрощающих задачу:

1. В этом множестве вряд ли больше 1500-2000 точек, т.е. оно явно небольшое. Координаты - обычные неотрицательные числа.
2. Структура кластеров меня не интересует. Важны только координаты центроидов и веса соответствующих кластеров.

Dan_Te · 22.01.2007, 06:29

!	Dan_Te:
	Вряд ли эта задача относится к экономике (не по тому, откуда она взялась, а по методу решения). Мы тут посовещались и решили, что в CS ей будет куда лучше. Тема перенесена.

Konuhov · 14.02.2007, 21:42

не знаю что за методы предлагали, знаю есть итеративный метод самоорганизующихся данных (ИСОМАД). исходники не видел, почитать можно в "Принципы распознавания образов" Дж. Ту, Р. Гонсалес. Мир, Москва 1978.

Научный форум dxdy

Ищу алгоритм кластеризации данных