2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Задача кластеризации регионов РФ
Сообщение03.05.2012, 23:16 


25/06/07
124
Новосибирск
Добрый день!

Сразу прошу прощения, если ошибся разделом: возможно, мне не сюда, и тогда поправьте, пожалуйста.

Есть задача кластеризации (группировки) субъектов РФ (это для конкретики, а вообще — просто географических областей).
Дано: значения некого вещественного параметра $\[P\]$ — своё для каждого региона — и карта РФ.
Необходимо: сгруппировать субъекты в кластеры (не более 10, скажем), которые были бы, во-первых, связными георграфически, и во-вторых, характеризовались бы некой общностью значений параметра $\[P\]$.
Подскажите, есть ли какие-то программные пакеты, позволяющие решать подобные задачи? Поиск в гугле показывает, что чаще всего решают задачи кластеризации на карте для набора точек, но не целых географических областей, граничащих между собой, или же кластеризации географических областей, но не ставят явное и строгое условие на связность полученных кластеров.

Одним способом я эту задачу уже решил. Упрощённо: для таблицы $\[N \times N\]$, где $\[N\]$ — число субъектов, заполнил значением 1 те ячейки с номерами столбца $\[i\]$ и строки $\[j\]$, для которых субъект с номером$\[j\]$ и субъект с номером $\[i\]$ имеют общую границу, а значением 0 — остальные. Добавил ещё столбец с признаком $\[P\]$. Таким образом получил таблицу из $\[N+1\]$ столбца с отдельной строкой для каждого субъекта. Эти данные «засунул» в нейронную сеть Кохонена (ну или можно в кластеризатор — уже не столь принципиально) — получил разделение на кластеры. Даже связные. Но это какой-то очень «коленочный» метод. А ведь возможно есть специально предназначенные для подобных задач программные решения.
Насколько удалось выяснить, MapInfo Professional такие задачи не решает. С ArcGIS знаком только посредством Гугла, и похоже, что подобные задачи он решает опять-таки для точек, но не для областей.

 Профиль  
                  
 
 Re: Задача кластеризации регионов РФ
Сообщение04.05.2012, 09:13 
Заслуженный участник
Аватара пользователя


11/03/08
9908
Москва
Ну, лично я бы решал стандартными пакетами кластерного анализа, причём для не граничащих меж собой областей расстояние задавал бы $\infty$, а для граничащих - конечной величиной, зависящей от P.

 Профиль  
                  
 
 Re: Задача кластеризации регионов РФ
Сообщение04.05.2012, 11:27 
Заслуженный участник


28/04/09
1933
Deductor (есть бесплатная версия с урезанным функционалом, которую можно использовать в учебных целях). Помимо всего прочего, в этом пакете и кластерный анализ (на основе тех же карт Кохонена). Только вот у Вас задача довольно довольно специфическая, и можно ли ее решить именно в этом пакете, я не знаю.

 Профиль  
                  
 
 Re: Задача кластеризации регионов РФ
Сообщение05.05.2012, 22:33 


25/06/07
124
Новосибирск
EtCetera в сообщении #567197 писал(а):
Deductor (есть бесплатная версия с урезанным функционалом, которую можно использовать в учебных целях). Помимо всего прочего, в этом пакете и кластерный анализ (на основе тех же карт Кохонена). Только вот у Вас задача довольно довольно специфическая, и можно ли ее решить именно в этом пакете, я не знаю.


Да, именно им, Deductor'ом, я и пользовался, реализовывая описанный выше метод :)
Я бы сделал больший упор на программы для работы с картами. Насколько я знаю, ArcGIS обладает довольно мощным функционалом по анализу картографических данных. Кластеризацию точек, как я понимаю, там сделать можно. А вот насчёт областей — непонятно.

 Профиль  
                  
 
 Re: Задача кластеризации регионов РФ
Сообщение18.06.2012, 04:06 


12/06/12
25
В данном случае это, насколько я понял, кластеризация одномерных данных?
Для кластеризации одномерных данных есть несколько специфический - "ранговый" - метод кластеризации.
См. статьи:
http://ics.khstu.ru/media/2010/N21_02.pdf (в этой статье предложен этот метод)
http://ics.khstu.ru/media/2012/N31_08.pdf (в этой статье предложена вычислительная реализация этого метода)
У меня есть программа, в которой реализован подход, предложенный во второй статье.
Что касается географической связности областей, то это - как получится, надо посмотреть, какой получится результат, какое получится разбиение на кластеры ранговым методом.
Кстати, при разбиении данных на кластеры ранговым методом кластеры получаются как промежутки значений исходной величины, т.е. при помощи этого метода можно выделить кластер с наибольшими значениями $P$, кластер со средними значениями $P$, кластер с наименьшими значениями $P$ и т.п. Получится ли при этом связность регионов - это зависит от величины $P$.
Я пробовал кластеризовать этим методом страны мира по численности населения.
Ссылка на файл: http://narod.ru/disk/53217848001.7e7c65 ... B.png.html

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group