2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2, 3  След.
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение13.09.2013, 12:45 
Аватара пользователя
Спасибо за объяснение.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 17:50 
Modesty в сообщении #761414 писал(а):
Имеются результаты опроса двух групп людей, оценивших набор объектов (их 10) по набору шкал (их 18). Шкалы 7-балльные.

Решил тут же спросить. Если имеются пропущенные значения, то чем их лучше заменять?

Интуитивно не хочется среднее арифметическое, т.к. не было вариантов ответа типа "1,345 баллов".
Кажется, логично брать моду, то есть как большинство ответило. Но не могу себе объяснить, почему не медиану...

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 20:50 
Аватара пользователя
Modesty в сообщении #767378 писал(а):
Решил тут же спросить. Если имеются пропущенные значения, то чем их лучше заменять?

Интуитивно не хочется среднее арифметическое, т.к. не было вариантов ответа типа "1,345 баллов".
Кажется, логично брать моду, то есть как большинство ответило. Но не могу себе объяснить, почему не медиану...

Ну, если мода ярко выражена, можно и моду. А если у вас по 4 раза встречаются все значения, кроме 7 и 5 раз семерка - чем она так уж лучше? Впрочем, в этом случае можно взять любое значение, никакое не предпочтительнее.

Хм, в этом случае медиана как бы уж совсем ни причем.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 20:59 
Похоже что да, моду брать придется. Хотя она не всегда ярко выражена.

А в некоторых случаях у меня мода не единственная. Какую тогда выбрать? Интуитивно кажется, что стоит брать ту, которая ближе к значению среднего арифметического.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 21:06 
Аватара пользователя
На среднее лучше не ориентироваться, у вас ведь данные не количественные, а, скорее, порядковые. Тут больше подходит медиана.
А пропусков много? Если мало, то большой разницы нет.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 21:10 
Ну, предположение о равноинтервальности все-таки делается, но строго наверное все-таки порядковая шкала.

Пропусков не слишком много.

Значит, при неединственности моды ориентироваться на медиану, да?

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение24.09.2013, 21:19 
Аватара пользователя
Странный Вы человек. Это же зависит от вашей задачи, от ваших данных. Мы их не знаем. В таких случаях нет единой рекомендации. Ну, возьмите медиану и не заморачивайтесь! Или так: попробуйте разные варианты и посмотрите, будут ли существенные различия в результатах. Если да - какой результат кажется Вам интуитивно более естественным?

(Оффтоп)

Я так подбираю весовые коэффициенты при подсчете рейтинга студентов: иду от результата. :facepalm:

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 21:24 
Другой вопрос.

Пусть опрошены $N$ людей. В отчете при указании возраста обычно вроде бы ограничиваются размахом (например, "от 40 до 60 лет"). Какой ещё показатель можно было бы полезно использовать для характеристики возраста? Наверное, среднее арифметическое - ведь кол-во лет не обязательно целое. Или все-таки медиану, или моду?

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 21:54 
Аватара пользователя
А зачем? Вы хотите представить эти данные как значения случайной величины?

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:02 
Почему случайной?

Просто более полное описание будет, если добавить ещё одну характеристику (помимо размаха).

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:07 
Аватара пользователя
А что, у вас группы сильно неравномерные? Среднее сильно смещено от центра интервала? Может, тогда их по-другому сформировать?
И - остается в силе рекомендация: семь раз отмерь. Пробуйте, пробуйте, смотрите.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:20 
provincialka в сообщении #767824 писал(а):
А что, у вас группы сильно неравномерные? Среднее сильно смещено от центра интервала?

Распределение возраста в группе неравномерно, но среднее недалеко от центра.

provincialka в сообщении #767824 писал(а):
семь раз отмерь. Пробуйте, пробуйте, смотрите.

Хотелось бы теорию о том, какое будет лучше использовать.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 22:50 
Аватара пользователя
Если среднее недалеко от центра, оно несет практически ту же информацию, что и интервал, так как вычисляется по нему.
А что касается теории... Ни в коем случае не считаю себя специалистом, но мой скудный опыт показывает, что построение адекватной модели - дело скорее эвристическое, требующее (помимо определенных знаний) пристального вглядывания в конкретную задачу. Чего я (в связи с вашей задачей), понятно, лишена.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение25.09.2013, 23:08 
provincialka в сообщении #767837 писал(а):
Если среднее недалеко от центра, оно несет практически ту же информацию, что и интервал, так как вычисляется по нему.

Несет ту же информацию только если особо оговорено, что распределение возрастов близко к нормальному.

 
 
 
 Re: Какой показатель рассеивания значений использовать?
Сообщение26.09.2013, 07:55 
Аватара пользователя
Да? Не уверена. Пусть у вас есть интервалы $[20;40],[40;60], [60;80]$. Каждый вы пометите еще числом, скажем, $28; 52; 71$. И что нового вы узнаете о своих данных? Например, неравномерность распределения внутри интервала никак в этих числах не отразится. Может, их надо взять просто по-уже и побольше?

 
 
 [ Сообщений: 35 ]  На страницу Пред.  1, 2, 3  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group