Есть разные критерии близости кластеров: 1. Одиночная связь. Близость кластеров определяется минимальным расстоянием между ближайшими наблюдениями из сравниваемых кластеров. 2. Полная связь. Близость определяется расстоянием между наиболее удалёнными наблюдениями сравниваемых кластеров. 3. Попарное среднее. Близость определяется как среднее расстояние между всеми парами наблюдений сравниваемых кластеров. (Бывает взвешенное попарное среднее, в котором наблюдениям разных кластеров присваиваются разные веса, в зависимости от размеров кластеров). 4. Центроидный метод. Расстояние между кластерами определяется как расстояние между их центрами тяжести. (Есть взвешенный центроидный метод, известный так же под названием медиана). 5. Метод Варда. Основывается на методах дисперсионного анализа.
Какой метод лучше использовать -зависит от конкретных данных. Если кластеры визуально различаются, то с выбором особых проблем быть не должно.
Посмотрите подробнее об этом в Дюран Б., Оделл П. Кластерный анализ. -М.: Статистика, 1997.
|