2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Оптимальная классификация
Сообщение12.01.2014, 21:22 
Аватара пользователя
Иерархическая классификация (ИК) встречается повсеместно. ИК широко используется при построении визуальных моделей сложных систем (ментальные карты, SADT, DFD, диаграммы вариантов использования и т.п.).
Провести иерархическое группирование можно несколькими способами. Например, 81 объект может быть отнесен к 9 классам, каждый из которых содержит еще 9 подклассов или к 3 классам, каждый из которых вновь разбит на 3, потом снова на 3 и еще раз на 3.

Вопрос, какую структуру классификации лучше использовать?
Рекомендаций в Интернете не так и много, самое распространенное выбирать размерность классификационных группировок от 3 до 8. В соответствии с небезызвестным кошельком Миллера.

Может быть, у кого-то есть какие-либо соображения на этот счет?

 
 
 
 Re: Оптимальная классификация
Сообщение12.01.2014, 22:01 
Аватара пользователя
prof.uskov в сообщении #813465 писал(а):
Например, 81 объект может быть отнесен к 9 классам, каждый из которых содержит еще 9 подклассов или к 3 классам, каждый из которых вновь разбит на 3, потом снова на 3 и еще раз на 3.

Я не специалист в этой науке, но не зависит ли ситуация прежде всего от того, какими признаками обладают классифицируемые объекты, сколько значений у каждого признака, какие признаки универсальные, а какие нет, и т.д.?

 
 
 
 Re: Оптимальная классификация
Сообщение12.01.2014, 22:56 
Аватара пользователя
prof.uskov, на этот вопрос нет общего ответа. Все зависит от задачи. Довольно часто число классов подбирают из эвристических соображений. Иногда сам процесс классификации имеет "скачок", который говорит о том, что здесь можно "провести черту" и прекратить объединение /разбиение кластеров.

Кстати, почему у вас в примерах кластеры одинакового размера? Это совсем не обязательно. Более того, в стандартных методах на каждом шаге объединяют не по 3 или 9, а по 2 кластера.

 
 
 
 Re: Оптимальная классификация
Сообщение12.01.2014, 23:08 
Аватара пользователя
provincialka в сообщении #813503 писал(а):
prof.uskov, на этот вопрос нет общего ответа. Все зависит от задачи. Довольно часто число классов подбирают из эвристических соображений. Иногда сам процесс классификации имеет "скачок", который говорит о том, что здесь можно "провести черту" и прекратить объединение /разбиение кластеров.

Кстати, почему у вас в примерах кластеры одинакового размера? Это совсем не обязательно. Более того, в стандартных методах на каждом шаге объединяют не по 3 или 9, а по 2 кластера.

Одинаковые я привел только для примера, чтобы пояснить, а так, конечно, классификация неоднородна.

Понятно, что задача имеет много решений. Но хотелось бы критерий на который ориентироваться, четко сформулированный т.е. измеряемый.

Вот диаграмма SADT, рисуем один блок, потом его разбиваем, потом уже эти блоки разбиваем, если система большая, то можно и так поделить и так...

 
 
 
 Re: Оптимальная классификация
Сообщение12.01.2014, 23:09 
Аватара пользователя
svv в сообщении #813483 писал(а):
не зависит ли ситуация прежде всего от того, какими признаками обладают классифицируемые объекты, сколько значений у каждого признака, какие признаки универсальные, а какие нет, и т.д.?

provincialka в сообщении #813503 писал(а):
на этот вопрос нет общего ответа.

Что, вам в третий раз сказать?

 
 
 
 Re: Оптимальная классификация
Сообщение12.01.2014, 23:17 
Аватара пользователя
provincialka в сообщении #813521 писал(а):
svv в сообщении #813483 писал(а):
не зависит ли ситуация прежде всего от того, какими признаками обладают классифицируемые объекты, сколько значений у каждого признака, какие признаки универсальные, а какие нет, и т.д.?

provincialka в сообщении #813503 писал(а):
на этот вопрос нет общего ответа.

Что, вам в третий раз сказать?

Зачем в третий раз, я Вас услышал... только в литературе я уже нашел три подхода, как можно сформулировать критерий наилучшего разбиения на классы, а четвертый придумал сам. :-)
Один из найденных в литературе методов предложен лингвистом Сухотиным Б.В. идея состоит минимизации количества имен для обозначения объектов классификации. Сводится к задаче дискретного программирования.
Вот собственно интересуюсь не тривиальными ли (самоочевидными) являются мои умозаключения, вижу что нет. Можно писать статью в журнал. :-)

 
 
 
 Re: Оптимальная классификация
Сообщение12.01.2014, 23:59 
Аватара пользователя
Бог в помощь! Эта тема неисчерпаема.

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group