Последний раз редактировалось Евгений Машеров 27.03.2014, 09:26, всего редактировалось 1 раз.
Неполный ответ. Моменты первого и второго порядка используются широко, и достаточно информативны. Поэтому возникает желание получить дополнительную информацию, используя моменты более высоких порядков. Однако, чем выше порядок момента, тем более существенно на него влияют экстремальные значения. (достаточно условный пример - выборка [-1,-1,-1,-1,-1, 5] со средним 0, первые пять слагаемых входят в выражение для моментов, как +1 или -1, но последнее во второй момент вкладывает 25, третий 125, четвёртый 625, пятый 3125, шестой 15625 и т.д, совершенно нивелируя влияние прочих элементов выборки; чем больше выборка, тем менее это пагубно, но для реально достижимых выборок вычисленные моменты порядка выше четвёртого не слишком осмыслены, единственное большое отклонение их может совершенно исказить) Хотя моменты более высоких порядков иногда пытались использовать, к хорошему это не приводило (скажем, предложенный в конце XIX века метод разделения смеси двух нормальных совокупностей, использовавший моменты до пятого включительно, оказался столь чувствителен к погрешностям, что известный криминалист Бертильон, применив его к выборке измерений роста, пришёл к выводу, что французский народ состоит из двух несмешавшихся рас, с дальнейшими выводами социально-политического характера, хотя дело было всего лишь в неточностях округления границ интервалов). Даже третий, тем более четвёртый, при выборках менее сотен объёмом практической ценности не имеют (это, разумеется, лишь моё частное мнение, основанное на некотором опыте). Момент, вычисленный по размерной величине, также имеет размерность. Причём её интерпретировать довольно трудно. Даже для дисперсии труднообъяснимы "квадратные рубли", "квадратные килограммы" или "квадратные миллимоли", а "квадратные метры" ещё хуже, поскольку возникает соблазн спутать их с площадью. А уж возникающие в моментах высшего порядка третьи, четвёртые и т.д. степени размерностей вовсе непостижимы разумом. Тут есть два пути - перейти к безразмерной величине, разделив на величину той же размерности, или перейти к величине понятной нам размерности, в частности, совпадающей с размерностью исходной величины (для чего можно, к примеру, извлечь корень соответственной степени). Поскольку "разброс" мы умеем измерить дисперсией (и корнем из неё, среднеквадратичным отклонением, то есть используем второй из названных подходов), высшие моменты мы привлекаем для описания формы распределения. А поскольку форма есть нечто безразмерное (форма легкового автомобиля, детского педального автомобильчика и коллекционной модели этого авто может быть одинакова, при весьма разных размерах), то первый подход интереснее. Характеристика формы должна не зависеть от положения центра распределения (выполнено, поскольку мы используем центральные моменты) и от разброса значений (в частности, замена единицы измерения, скажем, метров на футы, не должна менять форму, а разброс должен меняться пропорционально соотношению единиц). Для последнего проще всего делить высший момент (в который масштабный коэффициент входит в степени, равной порядку момента) на среднеквадратичное отклонение (в которое масштабный коэффициент входит в первой степени), возведённое в степень, равную порядку момента в числителе. Идя таким путём, мы и приходим к коэффициентам асимметрии и эксцесса (тут надо иметь в виду, что для нормального распределения отношение четвёртого момента к квадрату второго имеет матожидание 3, и для такого отношения был предложен термин "куртозис", а эксцесс это превышение куртозиса над его значением для нормального распределения, отсюда -3 в формуле и самоё слово "эксцесс" - "превышение"). Разумеется, это не единственные меры скошенности и "островершинности" распределений. Просто исторически первые. Что до коэффициента вариации - это также попытка получить безразмерную величину, показывающую, насколько далеко от центра распределения могут быть разбросаны значения. Практическая важность этого вопроса объясняет широкое использование этого коэффициента, несмотря на его не слишком красивые теоретические свойства (хотя, скажем, для логнормального распределения, в отличие от нормального, он достаточно естественен).
|