2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение21.02.2015, 21:50 
Аватара пользователя
--mS--
А! Вот оно что. Но в чем был первоначальный вопрос -- так и не поняла.
Александрович
Вы же любите проводить численные эксперименты. Вот и постройте для какого-нибудь распределения разные оценки центральной тенденции. Может, увидите какие-нибудь закономерности, какая оценка "лучше". Может, более робастна.

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение21.02.2015, 22:22 
Аватара пользователя
provincialka в сообщении #980991 писал(а):
А! Вот оно что. Но в чем был первоначальный вопрос -- так и не поняла.

Тут Вы не одиноки.

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение22.02.2015, 05:29 
Аватара пользователя
provincialka в сообщении #980991 писал(а):
--mS--
А! Вот оно что. Но в чем был первоначальный вопрос -- так и не поняла.

Крайние выборочные квантили имеют бОльшие ошибки чем центральные и поэтому должны входить в формулу оценки среднего с меньшим весом. А в приведенной формуле наоборот Вопрос - почему?

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение22.02.2015, 07:22 
Аватара пользователя
--mS-- в сообщении #980981 писал(а):
Александрович в сообщении #980917 писал(а):
Центр распределения это точка, вокруг которой сосредоточены значения св. Их много, например, среднее значение, медиана, мода, центр сгиба, межквартельное расстояние, междецильное расстояние, центр размаха и т.д.

И какое отношение имеет "точка, вокруг которой сосредоточены значения св." к "межквартельному расстоянию, междецильному расстоянию" и т.д.?

Речь возможно шла о середине мкр и мдр, которые тоже являются мерами центральной тенденции. И вопрос поднят о весах различных мер при создании некой комбинированной меры цт

-- 22.02.2015, 08:34 --

Александрович в сообщении #981105 писал(а):
provincialka в сообщении #980991 писал(а):
--mS--
А! Вот оно что. Но в чем был первоначальный вопрос -- так и не поняла.

Крайние выборочные квантили имеют бОльшие ошибки чем центральные и поэтому должны входить в формулу оценки среднего с меньшим весом. А в приведенной формуле наоборот Вопрос - почему?

Меньший вес даже не крайних квантилей а всех значений в стороне от центрального значения учтен в бивес-оценке Мостеллера-Тьюки. Так там оценка вырабатывается почти всеми св, исключая самые крайние, которые отбрасываются тоже достаточно произвольно по выбору константы-критерия 6 или 9. А кстати откуда приведенная Вами в стартовом посте формула?
И что если автор формулы попытался учесть бОльшим весом двух децилей исключение из формулы нескольких квантилей между 10% и 50%, 50% и 90%, чтобы не придавать слишком большого веса медиане? Скажем могла же быть выработана мера цт по 5 квантилям 10%, 30%, 50%, 70% и 90%? И вес 10% и 90% вобрал в себя исключенные веса 30% и 70%?

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение22.02.2015, 07:41 
Аватара пользователя
Александрович в сообщении #981105 писал(а):
Крайние выборочные квантили имеют бОльшие ошибки чем центральные и поэтому должны входить в формулу оценки среднего с меньшим весом. А в приведенной формуле наоборот Вопрос - почему?

А формула
$$\overline X = \dfrac{1}{n}\left(X_{(1)}+X_{(2)}+\ldots+X_{(n)}\right), $$
где $X_{(i)}$ - порядковые статистики, - у Вас тех же вопросов не вызывает? Тут вообще безобразие: с одним и тем же весом складываются и минимум, и максимум, и медиана (если она тут есть), и вообще всё, мало относящееся к "центру распределения".

-- Вс фев 22, 2015 10:49:37 --

Korvin в сообщении #981110 писал(а):
Речь возможно шла о середине мкр и мдр, которые тоже являются мерами центральной тенденции.

Зачем мы будем гадать, о чем "возможно шла речь"? ТС никто не мешал дать точный ответ, но он предпочитает бессмысленные.

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение22.02.2015, 11:22 
Аватара пользователя
Насколько я могу судить, эта оценка является плодом двух компромиссов, между робастностью и эффективностью оценки и между оптимальностью и практическим удобством (причём тут даже два компромисса, в выборе квантилей и в выборе весов).
Наиболее робастная оценка, вероятно, медиана, но у неё эффективность 64%. Усредняя два квантиля (симметричных, по очевидным причинам), можно получить оценку с эффективностью выше медианы. Так, среднее 29% и 71% персентилей имеет эффективность 81%. Это оправдывает придание для этой оценки при усреднении с медианой веса, большего, чем для медианы (если я правильно понял, именно в этом состояло недоумение?)
Как использование квартилей (входящих в часто используемый набор статистических характеристик - "ящик с усами" - куда входят также медиана, максимум и минимум) вместо "оптимальных квантилей", так и придание вместо "оптимальных весов" весов равных, легко вычисляемых и запоминаемых эффективность полученной оценки снижает. Однако она предлагалась для "грубых прикидок" (первоначально в атомной физике, публикация в справочнике 1955 года, ранее, вероятно, в каких-то закрытых отчётах), и там упрощение расчётов, вероятно, было оправдано. Эффективность такой оценки (с квартилями и равными весами) 88%, а в отношении робастности - устойчива при наличии в наблюдениях не более 25% грубых ошибок.

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение22.02.2015, 18:20 
Аватара пользователя
Евгений Машеров
Спасибо за информацию для размышления.

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение22.02.2015, 19:59 
Аватара пользователя
И от меня спасибо. В закладки поставила.

 
 
 
 Re: Квантили в экспресс-оценках параметров распределений
Сообщение23.02.2015, 10:23 
Аватара пользователя
Вообще это частный (и очень ранний, задолго до появления термина "робастность") случай робастных L-оценок. Причём оптимизирован она, trimean, под вычислительные средства своего времени, под "вычислительные бюро", где складывали быстро, на бумажке ли, или на счётах, или даже аддиатор был, а умножали медленно и с физическим трудом на арифмометре, "Настольные Мерседесы" это уже 1950-е. Поэтому веса загрубили (оптимальные для квартилей всё же несколько меньше, чем для медианы, но не вдвое), вовсе избавившись от умножения (а деление на 3 можно делать без арифмометра, на той же бумажке). Сейчас такая оценка имеет скорее историческое значение (хотя Тьюки её пропагандирует, как практическую, видимо, имея в виду использование для "прикидок в уме"). Можно её несколько улучшить, изменив веса, а также беря вместо квартилей иные квантили, однако выигрыш будет невелик, а, учитывая, что для экспериментальных данных нормальное распределение, как правило, не более чем приближение, и не гарантирован.

 
 
 [ Сообщений: 24 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group