2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2, 3, 4
 
 Re: Среднее арифметическое, медиана, мода, ...
Сообщение21.12.2011, 00:16 
Всё-таки, что имеется в виду под "задачей сравнения двух дискретных распределений"?

 
 
 
 Re: Среднее арифметическое, медиана, мода, ...
Сообщение21.12.2011, 09:10 
Аватара пользователя
0. Задача сравнения разных оценок без задания закона распределения (почти) бессмысленна.
Для нормального распределения наилучшей оценкой является среднее, а медиана имеет эффективность 0.57.
Для распределения Коши среднее вообще не имеет смысла, а медиана даёт осмысленную (но не лучшую) оценку центра распределения.
Для распределения Лапласа (двустороннего) наилучшая оценка - медиана.

(Оффтоп)

Коши, конечно, крайний пример, но вот ситуация, когда среднее даёт "формально правильную, а по существу издевательскую" оценку. Самые богатые учёные мира жили в начале 90-х в Москве, работая в Институте Проблем Управления. Среднее состояние, исчисленное по завлабу Борисе Абрамовичу Б. (у которого было 3 миллиарда) и тысяче нищих профессоров, равнялось трём миллионам долларов.

1. Зная закон распределения (и получив, что оценка имеет матожидание и дисперсию), можно оценить её эффективность, как отношение минимально возможной дисперсии среди всех оценок данного параметра к дисперсии данной оценки. Также эффективность можно интерпретировать, как "во сколько раз по сравнению с наилучшей оценкой надо взять больше наблюдений, чтобы точность данной оценки равнялась точности наилучшей".
2. У меня такое впечатление, что в приведенных топикстартером примерах среднее арифметическое не применимо не из-за плохих статистических свойств, а просто потому, что "оценки экспертов" не аддитивны, их суммы содержательного смысла не имеют.
3. Что до моды - то это крайне неустойчивая оценка, и польза от неё случается редко.

 
 
 
 Re: Среднее арифметическое, медиана, мода, ...
Сообщение21.12.2011, 12:35 
0. То, какое у меня распределение - это вопрос теоретический (то есть ответ на него можно получить до эксперимента-опроса), или экспериментальный (когда составляю гистограмму ответов и пытаюсь понять на что она похожа)?

(Оффтоп)

Ага, я слышал что в штате Техас, где живёт много богатых людей, при расчёте средней заработной платы много смеха. :D А также был удивлён, когда узнал, что Б.А. Березовский был математиком. :shock: Даже вклад какой-то внёс, вроде бы.


1. А что, если я не знаю вид распределения, оценка не будет иметь матожидания? И потом, что значит минимально возможная дисперсия (нулевая что ли)?
Цитата:
Также эффективность можно интерпретировать, как "во сколько раз по сравнению с наилучшей оценкой надо взять больше наблюдений, чтобы точность данной оценки равнялась точности наилучшей".

Можете, пожалуйста, помочь мне это понять? :oops: Правильно ли я понял, что Вы говорите о возможности вычислить число людей (опрашиваемых), нужных для того, чтобы результаты усреднения их оценок можно было экстраполировать на большую выборку (всё население).

2. Вы абсолютно правы! Я исхожу из того, что оценки "экспертов" не аддитивны. Об этом же говорит так называемая репрезентативная теория измерений: "Вообще, похоже что все психологические и социологические измерения проводятся по порядковой шкале". И уж в моём случае это явно. А раз измерения проводятся в порядковой шкале, арифметические действия неправомерны. Чтобы можно было использовать арифметические действия, измерение должно проводится в шкале интервалов или отношений (это более "мощные" шкалы по сравнению с порядковой).

3. Про моду я понял и согласен :D

-- 21.12.2011, 12:45 --

Евгений Машеров, большое спасибо Вам за ответы!

А что Вы можете сказать про следующее указание из учебника Б.Л. ван дер Вардена Математическая статистика, стр. 335:
Цитата:
Большим преимуществом порядковых критериев является их полная независимость от предположения нормальности.


Я для "усреднения" оценок использую медиану Кемени, которая работает с упорядоченностями. Получается ли, что такой подход, в отличие от тех, что предполагают возможность применять арифметические действия к оценкам, лучше хотя бы в том смысле, что не предполагает нормальности распределения оценок (то есть в других подходах по-хорошему нужно сначала доказать, что распределение является нормальным, гауссовым)?

 
 
 
 Re: Среднее арифметическое, медиана, мода, ...
Сообщение21.12.2011, 14:36 
Аватара пользователя
0. Это не теоретический вопрос и не практический. Это больной вопрос. ;)
К нему подступаются либо предварительным исследованием распределения (проверкой нормальности и т.п.), либо исходя из модели процесса, либо сочетанием двух подходов.

(Оффтоп)

Борис Березовский у меня в Совете сидел, когда я кандидатскую защищал. Не догадался я вовремя подойти - сейчас бы либо в Лондоне сидел, с миллионами, либо в могиле лежал, под роскошным надгробием;)
А занимался он матметодами в экономике.
Бинарные отношения в многокритериальной оптимизации / Б. А. Березовский, В. И. Борзенко, Л. М. Кемпнер М. : Наука, 1981
Многокритериальная оптимизация : Мат. аспекты / Б. А. Березовский, Ю. М. Барышников, В. И. Борзенко, Л. М. Кемпнер; Отв. ред. П. С. Краснощеков; АН СССР, Ин-т пробл. управления М. : Наука, 1989
Задача наилучшего выбора / Б. А. Березовский, А. В. Гнедин; Отв. ред. Э. А. Трахтенгерц М. : Наука, 1984

1. Имеется в виду "минимально возможная дисперсия среди всех оценок" (такие оценки называются "эффективными"). А "число людей в опросе" - дисперсия выборочного среднего обратно пропорциональна объёму выборки. Но если мы используем менее эффективную оценку (скажем, медиану), то для достижения одинаковой дисперсии выборочного среднего и выборочной медианы понадобится 57 человек для среднего и 100 для медианы (но зато медиана даже не заметит попадания в выборку Березовского).

 
 
 [ Сообщений: 49 ]  На страницу Пред.  1, 2, 3, 4


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group