Alexeybk5 |
PCA - метод главных компонент, дистанция между кластерами 05.06.2017, 18:18 |
|
27/10/11 228
|
Здравствуйте Помогите пожалуйста разобраться. У меня есть данные эксперимента, которые располагаются на графике путём метода главных компонент: ось OX - PC1 (~60%), OY - PC2 (20%). Данные групируются по трем кластерам. Кластер A,B и C. Виуально видно, что кластер А находится ближе к B, чем к кластеру C. Но надо докахать это математически. Как я могу выполнить данную задачу ? Какой метод мне использовать ? K means ? Спасибо Алексей
|
|
|
|
|
Andrey_Kireew |
Re: PCA - метод главных компонент, дистанция между кластерами 22.08.2017, 22:29 |
|
07/10/15 ∞ 2400
|
Есть разные критерии близости кластеров: 1. Одиночная связь. Близость кластеров определяется минимальным расстоянием между ближайшими наблюдениями из сравниваемых кластеров. 2. Полная связь. Близость определяется расстоянием между наиболее удалёнными наблюдениями сравниваемых кластеров. 3. Попарное среднее. Близость определяется как среднее расстояние между всеми парами наблюдений сравниваемых кластеров. (Бывает взвешенное попарное среднее, в котором наблюдениям разных кластеров присваиваются разные веса, в зависимости от размеров кластеров). 4. Центроидный метод. Расстояние между кластерами определяется как расстояние между их центрами тяжести. (Есть взвешенный центроидный метод, известный так же под названием медиана). 5. Метод Варда. Основывается на методах дисперсионного анализа.
Какой метод лучше использовать -зависит от конкретных данных. Если кластеры визуально различаются, то с выбором особых проблем быть не должно.
Посмотрите подробнее об этом в Дюран Б., Оделл П. Кластерный анализ. -М.: Статистика, 1997.
|
|
|
|
|
|
Страница 1 из 1
|
[ Сообщений: 2 ] |
|
Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы