2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3  След.
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение13.09.2013, 12:45 
Аватара пользователя


11/06/12
10390
стихия.вздох.мюсли
Спасибо за объяснение.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 17:50 


07/09/13
77
Modesty в сообщении #761414 писал(а):
Имеются результаты опроса двух групп людей, оценивших набор объектов (их 10) по набору шкал (их 18). Шкалы 7-балльные.

Решил тут же спросить. Если имеются пропущенные значения, то чем их лучше заменять?

Интуитивно не хочется среднее арифметическое, т.к. не было вариантов ответа типа "1,345 баллов".
Кажется, логично брать моду, то есть как большинство ответило. Но не могу себе объяснить, почему не медиану...

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 20:50 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Modesty в сообщении #767378 писал(а):
Решил тут же спросить. Если имеются пропущенные значения, то чем их лучше заменять?

Интуитивно не хочется среднее арифметическое, т.к. не было вариантов ответа типа "1,345 баллов".
Кажется, логично брать моду, то есть как большинство ответило. Но не могу себе объяснить, почему не медиану...

Ну, если мода ярко выражена, можно и моду. А если у вас по 4 раза встречаются все значения, кроме 7 и 5 раз семерка - чем она так уж лучше? Впрочем, в этом случае можно взять любое значение, никакое не предпочтительнее.

Хм, в этом случае медиана как бы уж совсем ни причем.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 20:59 


07/09/13
77
Похоже что да, моду брать придется. Хотя она не всегда ярко выражена.

А в некоторых случаях у меня мода не единственная. Какую тогда выбрать? Интуитивно кажется, что стоит брать ту, которая ближе к значению среднего арифметического.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 21:06 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
На среднее лучше не ориентироваться, у вас ведь данные не количественные, а, скорее, порядковые. Тут больше подходит медиана.
А пропусков много? Если мало, то большой разницы нет.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 21:10 


07/09/13
77
Ну, предположение о равноинтервальности все-таки делается, но строго наверное все-таки порядковая шкала.

Пропусков не слишком много.

Значит, при неединственности моды ориентироваться на медиану, да?

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 21:19 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Странный Вы человек. Это же зависит от вашей задачи, от ваших данных. Мы их не знаем. В таких случаях нет единой рекомендации. Ну, возьмите медиану и не заморачивайтесь! Или так: попробуйте разные варианты и посмотрите, будут ли существенные различия в результатах. Если да - какой результат кажется Вам интуитивно более естественным?

(Оффтоп)

Я так подбираю весовые коэффициенты при подсчете рейтинга студентов: иду от результата. :facepalm:

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 21:24 


07/09/13
77
Другой вопрос.

Пусть опрошены $N$ людей. В отчете при указании возраста обычно вроде бы ограничиваются размахом (например, "от 40 до 60 лет"). Какой ещё показатель можно было бы полезно использовать для характеристики возраста? Наверное, среднее арифметическое - ведь кол-во лет не обязательно целое. Или все-таки медиану, или моду?

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 21:54 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
А зачем? Вы хотите представить эти данные как значения случайной величины?

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:02 


07/09/13
77
Почему случайной?

Просто более полное описание будет, если добавить ещё одну характеристику (помимо размаха).

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:07 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
А что, у вас группы сильно неравномерные? Среднее сильно смещено от центра интервала? Может, тогда их по-другому сформировать?
И - остается в силе рекомендация: семь раз отмерь. Пробуйте, пробуйте, смотрите.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:20 


07/09/13
77
provincialka в сообщении #767824 писал(а):
А что, у вас группы сильно неравномерные? Среднее сильно смещено от центра интервала?

Распределение возраста в группе неравномерно, но среднее недалеко от центра.

provincialka в сообщении #767824 писал(а):
семь раз отмерь. Пробуйте, пробуйте, смотрите.

Хотелось бы теорию о том, какое будет лучше использовать.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:50 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Если среднее недалеко от центра, оно несет практически ту же информацию, что и интервал, так как вычисляется по нему.
А что касается теории... Ни в коем случае не считаю себя специалистом, но мой скудный опыт показывает, что построение адекватной модели - дело скорее эвристическое, требующее (помимо определенных знаний) пристального вглядывания в конкретную задачу. Чего я (в связи с вашей задачей), понятно, лишена.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 23:08 


07/09/13
77
provincialka в сообщении #767837 писал(а):
Если среднее недалеко от центра, оно несет практически ту же информацию, что и интервал, так как вычисляется по нему.

Несет ту же информацию только если особо оговорено, что распределение возрастов близко к нормальному.

 Профиль  
                  
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение26.09.2013, 07:55 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Да? Не уверена. Пусть у вас есть интервалы $[20;40],[40;60], [60;80]$. Каждый вы пометите еще числом, скажем, $28; 52; 71$. И что нового вы узнаете о своих данных? Например, неравномерность распределения внутри интервала никак в этих числах не отразится. Может, их надо взять просто по-уже и побольше?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 35 ]  На страницу Пред.  1, 2, 3  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group