Хочу для себя разобраться в том числе и на уровне программирования с алгоритмами кластерного анализа. (Именно кластерного а не автоматической классификации).Собственно 1-й попавшийся мне метод М-средних М-Means реализован.Удобно графическое отображение точек для 2d или в крайнем случае для 3d. Хочется большего сравнить в одной проге разные алгоритмы.
Прога умеет загружать выборки из файла или моделировать (на плоскости ) выборки с несколькими скоплениями. Дальше - на них оценивать качество кластеризации. Метод К-Means хорош, но на входе там надо задавать кол-во кластеров, а на выходе- что получилось, с такими внутригрупповыми расстояниями которые получились.
А если ввести доп.требование для кластера
где D -предельный диаметр кластера, а расстояние от центра кластера до текущей его точки
То К-Means пролетает. А какой берется это сделать?[/b]
Вроде есть методы иерархической классификации..
2-я проблема -известная - визуализация кластеров многомерных данных в 2dВроде какие-то пакеты что-то здесь умеют, но описаний на уровне алгоритмов не видел.
------------------------------------------------------------------------------
Можно конечно мне заметить, "а чё ты, мужик все сам да сам- ведь например, в пакете Statistika может в Matematika и уж точно в GPSS и еще где это давно все профессионально реализовано..."
Но вот хочется профессионального исследования.
2)
где можно посмотреть описание алгоритмов? можно даже программные реализации методов в С++, Pascal, VBискал по интернету, но результатами поиска недоволен
а вот пример генерирования скопления с 4 областями и результат их распознавания. Лучи выходят из найденных центров кластеров по K-Means