2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение09.10.2014, 15:13 
alexey_og в сообщении #916914 писал(а):
Не понимаю...

если честно, сам не вполне понимаю.
характеристика не должна меняться в зависимости от того как вы обозначите случайную величину.
например, неважно как вы обозначите расстояние от центра мишени - в сантиметрах, в попугаях, в секундах полета суперджета, все равно среднее будет характеризовать расброс всегда одинаково - оно будет инвариантно к выбору обозначения данных, поскольку вы будете их выбирать в одной шкале.
а у вас оценки, переставляя эти оценки, например
0 - не согласен
1 - полностью согласен
2 - совсем не согласен
3 - скорее не согласен
4 - скорее согласен
5 - согласен

у вас среднее меняется, оно зависит от того, как вы распределите значения случайной величины по оценкам.
это означает, что вы не можете применять среднее арифметическое к этому набору данных, оно говорит о чем угодно, но не характеризует случайную величину. насколько я понимаю, об этом и теорема - если шкала порядковая, то есть порядок следования значений случайной величины имеет значение, среднее арифметическое не применимо, а применимы лишь порядковые статистики.

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 08:44 
upgrade, что-то начинаю понимать, но полное понимание как-то ускользает.
Как гртися, без поллитра... :)
Если у одного в корзине подберезовики, у второго - опята, а у третьего рыжики, то значение, скажем, "2" не может быть принято как что-то однородное для этого ряда продуктов (грибов).

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 10:09 
Как я понял, порядковые статистики применяются тогда, когда шкалы нет.
Например рост человека. - Минимума и максимума мы же не знаем, мы просто измеряем. Потом выстраиваем от минимума к максимума значения, рассчитываем плотность распределения, математическое ожидание.
А у нас ведь шкала есть. Она определена и не меняется.
Поэтому все равно до конца не могу взять в толк, почему мы не можем взять 2,5 как среднее значение нашей шкалы?

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 10:52 
alexey_og в сообщении #917158 писал(а):
то значение, скажем, "2" не может быть принято

может, но с какой-то дополнительной характеристикой, определенным образом, вот как именно?
если просто поименовать грибы $1,2,3$ то среднее $2$ конечно не скажет, что грибы - это в среднем опята.
возьмем данные о какой-либо динамике.
например, сегодня собрали в $1,5$ раза больше грибов чем вчера, завтра в $2$ раза меньше чем сегодня, послезавтра в $10$ раз больше чем завтра.
среднее арифметическое ($\frac{1,5+0,5+10}{3}=5,333$) не применимо, оно лишь вводит в заблуждение и чем больше оно в дальнейших расчетах участвует тем сильнее накопленная ошибка и ошибочнее общие выводы.
это на самом деле так.
применимо и осмысленно среднее геометрическое ($(1,5\cdot0.5\cdot10)^{\frac{1}{3}}=1,95$) которое в данном случае показывает на какое число надо умножить первый элемент выборки $n$ раз (где $n$ - количество случайных величин), чтобы получить последний - средний множитель для всех случайных величин, то есть настоящее среднее среди упорядоченных отношений.

alexey_og в сообщении #917169 писал(а):
Как я понял, порядковые статистики применяются тогда, когда шкалы нет.

шкала есть всегда. данные они всегда в шкале - сопоставляются с реальными объектами некоторым образом, иначе это просто бессмыслица.

alexey_og в сообщении #917169 писал(а):
почему мы не можем взять 2,5 как среднее значение нашей шкалы?

потому что неинвариантно относительно переназначений оценок.
в аналогии с грибами, $2$ в зависимости от того как именно обозначить корзинки, может быть и опятами и рыжиками и подберезовиками. а общая характеристика должна быть инвариантна к выбору обозначения случайной величины - уж если среднее опята, то как там ни изворачивайся, все равно должны быть опята.
в примере с отношениями - неважно какие именно значения начальные ($1000$ грибов мы в начале собрали или $1$) среднее все равно будет $1,95$ и умножение на него первого значения случайной величины все равно даст последнее значение случайной величины.
а вот среднее арифметическое не даст.

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 16:49 
upgrade, а у нас ведь шкала остается неизменной. Оценки не переназначаются. Как было присвоено "1" - это не согласен, так оно и останется.

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 16:58 
alexey_og в сообщении #917248 писал(а):
Оценки не переназначаются.

они не инварианты относительно выбора обозначения для них. я так понял, характерный признаки - вы не можете сказать что такое $2,5$ (например женщины это люди которые бывают двух состояний - беременные и не беременные, значит ли это что в среднем женщина - это наполовину беременный человек? нет) и если вы все-таки можете сказать что такое $2,5$, но при изменении оценок оно меняется.
если вместо $0,1,2,3,4,5$ вы укажете $1,2,3,4,5,600$ что вполне корректно, так как у вас не количественные характеристики, а качественные, но среднее будет $102,5$.

например, при анализе процессов в которых случайная величина некоторым образом зависит от предыдущей (скорость) это очень ярко проявляется - чуть поменялся масштаб и среднее арифметическое величины поехало куда глаза глядят, выдавая все что угодно графики меняются от убывающих к возрастающим от выпуклых к вогнутым...

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 17:25 
upgrade, я хотел сказать, что наша шкала никак не меняется (не будет меняться).
Мы не укажем 6 или 10 вместо 5. Шкала фиксирована.
А вот обосновать середину 2,5 тем, что это как бы правильное значение между "скорее не согласен" ("2") и "скорее согласен" ("3") - это да, трудновато :)

-- 10.10.2014, 17:31 --

Беременные и не беременные - это, если не ошибаюсь, номинальная шкала. А в нашем случае есть прогресс от совсем не согласен до полностью согласен, что про беременность так сказать нельзя (чуть менее беременна или чуть более...)

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 17:45 
alexey_og в сообщении #911426 писал(а):
Задача простая - определить степень однородности оценок, чтобы (в том числе) понимать насколько велико количество крайних оценок.

вот если взять все оценки, поставить напротив каждой из них количество и уже с этими цифрами работать, тогда применение среднего арифметического допустимо.
"не согласен" ($X$) - $55$ штук
"согласен" ($Y$)- $100$ штук
опрос (опыт) № 1 $X_1 = 10, \quad Y_1=3$
и так далее
тогда будет $6$ случайных величин и их распределение по опросам.
вы их выборки и будете считать по каждому опросу.
там и вариация понятная будет и корреляцию корректно увидите - например насколько не согласие зависит от согласия и так далее.

а так вы начинаете искать среднее арифметическое не среди значения случайной величины, а среди разных случайных величин, просто обозначенных цифрами, которые вы назначили произвольно.

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 18:31 
upgrade в сообщении #917286 писал(а):
вот если взять все оценки, поставить напротив каждой из них количество и уже с этими цифрами работать, тогда применение среднего арифметического допустимо.

Да, мы так и делаем.
например, в опросе участвуют 23 человека.
ответ "совсем не согласен", то есть "0" баллов, выбрало 3 человека
"1" - 6
"2" - 1
"3" - 8
"4" - 3
"5" - 2
Среднее арифметическое здесь получается округленно 2,3 балла.
А далее нам нужно определить степень разнородности ответов. Поэтому считаем среднеквадратич. отклонение.

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 18:47 
alexey_og в сообщении #917309 писал(а):
Среднее арифметическое здесь получается округленно 2,3 балла.

ну и как вы его получили?

-- 10.10.2014, 18:51 --

что вы вкладываете в фразу "степень разнородности ответов"?

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение10.10.2014, 19:02 
Три раза 0 баллов, 6 раз 1 балл и т.д. Получается сумма всех баллов и делится на количество респондентов. А под степенью разородности я имел в виду как сильно различатся оценки между собой, много или мало крайних оценок. Другими словами: насколько оценки близки к среднему

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение11.10.2014, 00:02 
alexey_og в сообщении #917309 писал(а):
Среднее арифметическое здесь получается округленно 2,3 балла.
А далее нам нужно определить степень разнородности ответов. Поэтому считаем среднеквадратич. отклонение.
Так ведь те 0, 1, 2, 3, 4, 5 могут быть равны и 0, 2, 10, 11, 80, 1000 — и тогда среднее арифметическое и среднеквадратическое отклонение немного не в тему. Видите — даже порядок тот же, а считать всё равно смысла особого нет.

Не могу написать подробнее, т. к. не знаю теории таких вещей тоже.

-- Сб окт 11, 2014 03:08:12 --

arseniiv в сообщении #917481 писал(а):
и тогда среднее арифметическое и среднеквадратическое отклонение немного не в тему
К примеру, среднее от 1 и 4 — 2,5, что лежит между 2 и 3, но среднее от 2 и 80 — это 41, что лежит не между 10 и 11. Может, так будет очевиднее.

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение11.10.2014, 00:31 
Здесь один нюанс: у нас шкала измерений неизменна для всех измеряемых признаков - 5-балльная от 0 до 5. Может быть, в этом случае все-таки корректно рассчитывать средний балл?

 
 
 
 Re: Однородность-неоднородность и коэффициент вариации
Сообщение11.10.2014, 00:54 
Неизменность не отменяет некорректности. :-)

Ну не будет одного числа, будет шесть — так ли уж плохо в формуле для вычисления неоднородности?

 
 
 [ Сообщений: 29 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group