2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Ищу алгоритм кластеризации данных
Сообщение18.01.2007, 18:25 
При попытке создания торговой системы напрямую столкнулся с задачей кластеризации двумерного множества. Интуитивная постановка задачи такова:

Дано множество точек с координатами (x, y, w) (скажем, 1000 точек). Первые две координаты - обычные декартовы неотрицательные, третья - вес точки (x, y). Требуется кластеризовать это множество по сумме весов точек - причем расстояние (декартово) между точками кластера не должно превышать заданного диаметра. Число кластеров заранее неизвестно, так что k-means тут, похоже, не катит.

В принципе задачу легко свести к кластеризации обычных двумерных точек с идентичными весами. Буду очень рад, если кто-нибудь подскажет, где найти нормальный алгоритм, желательно реализованный на Си или Паскале (но не обязательно), чтобы перенести его в терминал МТ4.

 
 
 
 
Сообщение19.01.2007, 14:16 
Аватара пользователя
Mathemt

Вот ссылочка на статью.

 
 
 
 
Сообщение20.01.2007, 14:25 
Аватара пользователя
Сам я с этим совсем не работал, спросил сестру, которая разбирается чуть лучше меня, вот часть ее ответа:
сестра photon-а писал(а):
я на форуме региться не хочу, но ситуация такая:
1) лично я с точками, имеющими вес на работала, но, поскольку важно расстояние между точками, то ОДНОЗНАЧНО используются методы кластризации по плотности (OPTICS, DBSCAN, Chameleon и иже с ними). Коды по первым двум найти в сети не проблема...

 
 
 
 
Сообщение21.01.2007, 02:53 
Большое спасибо откликнувшимся, поищем.

Я не указал некоторых обстоятельств, упрощающих задачу:

1. В этом множестве вряд ли больше 1500-2000 точек, т.е. оно явно небольшое. Координаты - обычные неотрицательные числа.
2. Структура кластеров меня не интересует. Важны только координаты центроидов и веса соответствующих кластеров.

 
 
 
 
Сообщение22.01.2007, 06:29 
 !  Dan_Te:
Вряд ли эта задача относится к экономике (не по тому, откуда она взялась, а по методу решения). Мы тут посовещались и решили, что в CS ей будет куда лучше. Тема перенесена.

 
 
 
 
Сообщение14.02.2007, 21:42 
не знаю что за методы предлагали, знаю есть итеративный метод самоорганизующихся данных (ИСОМАД). исходники не видел, почитать можно в "Принципы распознавания образов" Дж. Ту, Р. Гонсалес. Мир, Москва 1978.

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group