2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Ищу алгоритм кластеризации данных
Сообщение18.01.2007, 18:25 


20/12/06
13
При попытке создания торговой системы напрямую столкнулся с задачей кластеризации двумерного множества. Интуитивная постановка задачи такова:

Дано множество точек с координатами (x, y, w) (скажем, 1000 точек). Первые две координаты - обычные декартовы неотрицательные, третья - вес точки (x, y). Требуется кластеризовать это множество по сумме весов точек - причем расстояние (декартово) между точками кластера не должно превышать заданного диаметра. Число кластеров заранее неизвестно, так что k-means тут, похоже, не катит.

В принципе задачу легко свести к кластеризации обычных двумерных точек с идентичными весами. Буду очень рад, если кто-нибудь подскажет, где найти нормальный алгоритм, желательно реализованный на Си или Паскале (но не обязательно), чтобы перенести его в терминал МТ4.

 Профиль  
                  
 
 
Сообщение19.01.2007, 14:16 
Заслуженный участник
Аватара пользователя


03/03/06
648
Mathemt

Вот ссылочка на статью.

 Профиль  
                  
 
 
Сообщение20.01.2007, 14:25 
Экс-модератор
Аватара пользователя


23/12/05
12064
Сам я с этим совсем не работал, спросил сестру, которая разбирается чуть лучше меня, вот часть ее ответа:
сестра photon-а писал(а):
я на форуме региться не хочу, но ситуация такая:
1) лично я с точками, имеющими вес на работала, но, поскольку важно расстояние между точками, то ОДНОЗНАЧНО используются методы кластризации по плотности (OPTICS, DBSCAN, Chameleon и иже с ними). Коды по первым двум найти в сети не проблема...

 Профиль  
                  
 
 
Сообщение21.01.2007, 02:53 


20/12/06
13
Большое спасибо откликнувшимся, поищем.

Я не указал некоторых обстоятельств, упрощающих задачу:

1. В этом множестве вряд ли больше 1500-2000 точек, т.е. оно явно небольшое. Координаты - обычные неотрицательные числа.
2. Структура кластеров меня не интересует. Важны только координаты центроидов и веса соответствующих кластеров.

 Профиль  
                  
 
 
Сообщение22.01.2007, 06:29 
Экс-модератор


12/06/05
1595
MSU
 !  Dan_Te:
Вряд ли эта задача относится к экономике (не по тому, откуда она взялась, а по методу решения). Мы тут посовещались и решили, что в CS ей будет куда лучше. Тема перенесена.

 Профиль  
                  
 
 
Сообщение14.02.2007, 21:42 


14/02/07
2
Москва
не знаю что за методы предлагали, знаю есть итеративный метод самоорганизующихся данных (ИСОМАД). исходники не видел, почитать можно в "Принципы распознавания образов" Дж. Ту, Р. Гонсалес. Мир, Москва 1978.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group