2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Разбиение на группы и подгруппы
Сообщение08.09.2014, 23:01 


15/04/10
985
г.Москва
В задаче по статистике дан объем данных с значениями нескольких признаков каждый. По заданию надо по одному признаку разбить данные на 2 группы.
А затем каждую еще на 2 подгруппы по другому признаку.
Что взять в качестве критерия разбиения? Если требовать одинакового или почти одинакового объема то порог разбиения - медиана по данному признаку. Так?

 Профиль  
                  
 
 Re: Разбиение на группы и подгруппы
Сообщение09.09.2014, 12:39 
Заслуженный участник


12/09/10
1547
Так Вы сами и определяете как лучше надо делить.
Ну вот, например, $70$ точек со значением признака около $1$, а $50$ точек со значением около $2$. Можно, конечно, и по медиане...
Без выяснения цели разбиения, задача, на мой взгляд, бессмысленна.

 Профиль  
                  
 
 Re: Разбиение на группы и подгруппы
Сообщение09.09.2014, 19:43 


15/04/10
985
г.Москва
Если бы я составлял эту задачу -то согласился бы, но задача - готовая из сборника задач по статистике для вуза (сельское хозяйство). И что имели ввиду авторы? разбиение по медиане не единственно. Можно в качестве порога например взять середину размаха.

 Профиль  
                  
 
 Re: Разбиение на группы и подгруппы
Сообщение09.09.2014, 19:46 
Заслуженный участник
Аватара пользователя


18/05/06
13438
с Территории
Кластерный анализ же.

 Профиль  
                  
 
 Re: Разбиение на группы и подгруппы
Сообщение10.09.2014, 23:12 


15/04/10
985
г.Москва
похоже -да.
Вот цитирую точное условие
На основе данных сгруппируйте зверей по массе тушки образовав две группы.
Каждую из которых разбить на 2 подгруппы по длине тела
может гораздо проще - автор имел ввиду группировку по равномерным интервалам при $k=2$
($X_{min}, \frac{X_{min} + X_{max}}{2})$
($(\frac{X_{min} + X_{max}}{2},X_{max})$
т.е. гистограмму из 2 столбцов ?
ну тогда извините -дезинформировал и себя и вас.
Вот как важна точная формулировка - получается -разбить на 2 группы - одно (кластеры), а сгруппировать - другое. В 1 случае группируем по "густоте" облаков во 2 случае по середине диапазона

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group