2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 Кластеризация на группы заданного размера
Сообщение15.07.2012, 14:47 


28/11/11
2884
Существуют ли методы кластеризации, позволяющие разбить группу точек евклидовой плоскости на группы, размер которых задан?

Пример. Для заданного расположения двадцати домов (см. рисунок) нужно расположить две подстанции. Предполагается сначала разбить дома на две группы, внутри которых потом найти оптимальное размещение подстанций. Стандартное разбиение на два кластера даёт группы по $5$ и $15$ элементов. Однако, подстанции имеют ограниченную мощность и более 10 обслуживать не могут. Нужна кластеризация для такой ситуации.
Изображение

-- 15.07.2012, 14:51 --

Ещё лучше, если бы размер групп задавался бы не точным равенством, а приближённым. И уж совсем хорошо было бы, если бы можно было указывать точное количество требуемых групп. Итак, в идеале такая постановка: разбить заданные $N$ точек на евклидовой плоскости на $K$ групп, по ($P$ плюс-минус $Q$) точек в группе.

 Профиль  
                  
 
 Re: Кластеризация на группы заданного размера
Сообщение15.07.2012, 23:02 


28/11/11
2884
Годится ли последовательное добавление всё менее вероятных точек при вероятностной (нежёсткой) кластеризации? Или это заведомо плохо?

 Профиль  
                  
 
 Re: Кластеризация на группы заданного размера
Сообщение16.07.2012, 07:40 


28/11/11
2884
В википедии написано, что некий метод Уорда (применяется в социологии) в итоге создаёт кластеры приблизительно равных размеров. Кроме этого ничего не нашёл. :-(

 Профиль  
                  
 
 Re: Кластеризация на группы заданного размера
Сообщение16.07.2012, 23:46 


28/11/11
2884
Нашёл любительский алгоритм кластеризации, который разбивает на равные группы. Скачать, чтобы посмотреть как он работает: http://code.google.com/p/ekmeans/downloads/list

Код этого алгоритма на Java: http://code.google.com/p/ekmeans/source ... means.java

Как он работает, не разобрался. К сожалению, не знаю этого языка. Судя по всему, он не поддерживает разбиения на заданные кластеры, а разбивает только на равные. Но и такое разбиение мне интересно. И вдруг потом улучшить можно будет... Буду рад, если кто отпишется $-$ поделится впечатлениями или идеями.

 Профиль  
                  
 
 Re: Кластеризация на группы заданного размера
Сообщение17.07.2012, 14:06 


23/12/07
1763
А может, все-таки, попробовать четко сформулировать задачу оптимизации, наподобие
найти такое расположение двух подстанций максимальных мощностей $P_{I}$, $P_{I\!I}$ и распределение по ним $n$ домов с максимально потребляемыми мощностями $p_i$, $i = 1,\dots,n$, чтобы минимизировать суммарную длину кабелей.

Тогда, в качестве формальной постановки можно рассмотреть, например, следующую. Пусть $\mathbf{x}_{I}, \mathbf{x}_{I\!I}$ - координаты подстанций, $\mathbf{x}_{i}$, $i = 1,\dots, n$ - координаты домов, $b_i$ - идентификатор подстанции, к которой присоединен $i$-ый дом (для удобства считаем $b_i \in \{0,1\}$). Тогда суммарная длина кабелей $L$
$$L(\mathbf{x}_{I}, \mathbf{x}_{I\!I}, b_1,\dots,b_n ) = \sum_{i=1}^{n}b_i d(\mathbf{x}_{I}, \mathbf{x}_{i}) + (1- b_i) d(\mathbf{x}_{I\!I}, \mathbf{x}_{i}).$$
Задача оптимизации:
$$L(\mathbf{x}_{I}, \mathbf{x}_{I\!I}, b_1,\dots,b_n ) \rightarrow \min,$$
$$\sum_{i=1}^{n}b_i p_i \leq P_{I}, \quad \sum_{i=1}^{n}(1 - b_i) p_i \leq P_{I\!I}.$$

И далее копать в сторону методов решения подобных оптимизационных задач...

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group