2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Основы статистики
Сообщение01.12.2022, 12:13 
Аватара пользователя
Евгений Машеров в сообщении #1572105 писал(а):
если у нас вместо априори известного матожидания фигурирует выборочное среднее - имеет смысл делить не на n, а на $n-1$
Ну не среднее же! Выборочную дисперсию естественно следует исправить, поскольку одна степень свободы уже использована.
Евгений Машеров в сообщении #1572009 писал(а):
О выборочных оценках речь идёт ipso facto формулы расчёта.
Да не было там ничего подобного. Посмотрите внимательно ещё раз на формулы.

 
 
 
 Re: Основы статистики
Сообщение01.12.2022, 12:27 
Аватара пользователя
Посмотрел. Оценки выборочных моментов (ММП-оценки, если быть точным).

 
 
 
 Re: Основы статистики
Сообщение01.12.2022, 14:06 
Аватара пользователя
Евгений Машеров в сообщении #1572125 писал(а):
Посмотрел. Оценки выборочных моментов (ММП-оценки, если быть точным).

Или я чего-то не вижу. Задана функция распределения. Ни о какой выборке речи не шло.

 
 
 
 Re: Основы статистики
Сообщение01.12.2022, 14:32 
Аватара пользователя
Давайте тогда договоримся о дефинициях. Функция распределения - математическое выражение. Выборка - набор чисел. Приведен набор чисел.

 
 
 
 Re: Основы статистики
Сообщение01.12.2022, 14:37 
Аватара пользователя
Евгений Машеров в сообщении #1572149 писал(а):
Выборка - набор чисел.
Для случайной выбоки это случайный набор. Но здесь же -
Solaris86 в сообщении #1571953 писал(а):
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9

 
 
 
 Re: Основы статистики
Сообщение01.12.2022, 16:11 
Аватара пользователя
Напоминает байку про студента, которому задали написать генератор случайных чисел. Написанный - он выдавал прстоянно 13.
- А что такого? Я ведь случайно число выбрал!

 
 
 
 Re: Основы статистики
Сообщение07.12.2022, 21:06 
Евгений Машеров в сообщении #1572004 писал(а):
3. Какую выбрать?
Стандартное отклонение (квадратичная оценка) оптимально в предположении нормальности распределения. Более высокие степени используют редко, они подчёркивают большие отклонения. Ну, или самостоятельная оценка для моментов высшего порядка. При наличии подозрений на "тяжёлые хвосты" лучше использовать робастные оценки (САО или вообще из неназванных Вами, вроде МАО и т.п.). Но даже для стандартного отклонения "возможны варианты".

Александрович в сообщении #1572013 писал(а):
Стандартное отклонение (2-я степень) характеризует расброс около среднего, 3-я степень ассимметрию распределения, 4-тая степень - эксцесс.

Тогда если всё резюмировать:
1. Первая степень - ?
2. Вторая степень - разброс около среднего
3. Третья степень - асимметрия распределения
4. Четвертая степень - эксцесс
Вот на моём конкретном примере - как трактовать полученные цифры степенных средних, можете привести примеры формулировок, заключений?
Solaris86 в сообщении #1571953 писал(а):
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9
Рассмотрим среднее линейное отклонение (СЛО), среднее квадратическое отклонение (СКвО), среднее кубическое отклонение (СКуО) и среднее биквадратическое отклонение (СБО).
$\overline{x} = \frac{\sum^{10}_{i=1}x_i n_i}{\sum^{10}_{i=1}n_i}$ = \dfrac{(0+1+2+3+4+5+6+7+8+9)\cdot1}{1\cdot10} = 4.5$
$\text{СЛО} =  \frac{\sum^{10}_{i=1}|x_i-\overline{x}|n_i}{\sum^{10}_{i=1}n_i} = \dfrac{(4.5+3.5+2.5+1.5+0.5)\cdot2}{2\cdot5} = 2.5$
$\text{СКвО} =  \sqrt{\frac{\sum^{10}_{i=1}(x_i-\overline{x})^2n_i}{\sum^{10}_{i=1}n_i}} = \sqrt{\dfrac{(4.5^2+3.5^2+2.5^2+1.5^2+0.5^2)\cdot2}{2\cdot5}} \approx 2.87$
$\text{СКуО} =  \sqrt[3]{\frac{\sum^{10}_{i=1}|x_i-\overline{x}|^3n_i}{\sum^{10}_{i=1}n_i}} = \sqrt[3]{\dfrac{(4.5^3+3.5^3+2.5^3+1.5^3+0.5^3)\cdot2}{2\cdot5}} \approx 3.13$
$\text{СБО} =  \sqrt[4]{\frac{\sum^{10}_{i=1}(x_i-\overline{x})^4n_i}{\sum^{10}_{i=1}n_i}} = \sqrt[4]{\dfrac{(4.5^4+3.5^4+2.5^4+1.5^4+0.5^4)\cdot2}{2\cdot5}} \approx 3.32$

 
 
 
 Re: Основы статистики
Сообщение07.12.2022, 22:25 
Аватара пользователя
Solaris86 в сообщении #1573015 писал(а):
1. Первая степень - ?
Среднее значение естественно.

 
 
 
 Re: Основы статистики
Сообщение07.12.2022, 22:40 
Александрович в сообщении #1573024 писал(а):
Solaris86 в сообщении #1573015 писал(а):
1. Первая степень - ?
Среднее значение естественно.

Не понял. У меня в примере среднее - 4.5, а СЛО - 2.5.

 
 
 
 Re: Основы статистики
Сообщение07.12.2022, 23:30 
Аватара пользователя
Давайте сначала.
Solaris86 в сообщении #1571953 писал(а):
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9
Многие подумали что это выборка. А вы что имели в виду?

 
 
 
 Re: Основы статистики
Сообщение08.12.2022, 06:37 
Аватара пользователя
Я не вправе приказывать Вам пользоваться своей, а не общепринятой терминологией, но выражение согласно первой Вашей формуле обычно именуют САО (среднее абсолютное отклонение) - абсолютная величина функция нелинейная. Даёт она не среднее, а оценку параметра масштаба, одну из. Остальные выражения также оценивают параметр масштаба. Для известного распределения они могут быть выражены одно через другое введением коэффициента. Разница возникает, если рассматриваем величины с различным распределением. Чем выше показатель степени, тем сильнее влияют "тяжёлые хвосты".
Второе - обычная оценка среднеквадратичного отклонения (с точностью до величины в знаменателе - вычитать ли единицу для несмещённости, не вычитать для ММП-оценки или прибавить единицу для минимизации среднеквадратичной ошибки оценки; для больших выборок принципиальной разницы нет, а непринципиальная снимается "единообразным выбором"). Для нормального распределения квадратика оптимальна, для других, вообще говоря, нет.
Третью в таком виде не встречал, для расчёта асимметрии абсолютную величину не берут, при абсолютной величине мы собственно асимметрии не увидим, а её считают, чтобы понять, что "правый хвост длиннее".
Четвёртая связана с оцениванием эксцесса, но не есть оценка эксцесса, она зависит и от четвёртого семиинварианта, и от второго (дисперсии). Для оценивания эксцесса делят на квадрат дисперсии, получая величину, зависящую от формы распределения, но не от масштаба. Часто также вычитают 3, поскольку для нормального нормированный четвёртый момент равен трём, и получают в собственном смысле "эксцесс", превышение над нормальным или снижение сравнительно с нормальным. При использовании надо обращать внимание на эту деталь расчёта.

 
 
 
 Re: Основы статистики
Сообщение08.12.2022, 10:50 
Аватара пользователя
Александрович в сообщении #1573024 писал(а):
Среднее значение естественно.


Там абсолютная величина отклонения берётся.

 
 
 
 Re: Основы статистики
Сообщение08.12.2022, 10:57 
Аватара пользователя
Solaris86 Это что за формула?

Solaris86 в сообщении #1571953 писал(а):
$\overline{x} = \frac{\sum^{10}_{i=1}x_i n_i}{\sum^{10}_{i=1}n_i}$= \dfrac{(0+1+2+3+4+5+6+7+8+9)\cdot1}{1\cdot10} = 4.5$

 
 
 
 Re: Основы статистики
Сообщение08.12.2022, 13:39 
Аватара пользователя
ТС под "средним линейным отклонением" понимает
Solaris86 в сообщении #1571953 писал(а):
$\text{СЛО} =  \frac{\sum^{10}_{i=1}|x_i-\overline{x}|n_i}{\sum^{10}_{i=1}n_i} = \dfrac{(4.5+3.5+2.5+1.5+0.5)\cdot2}{2\cdot5} = 2.5$

Что обычно именуется "средним абсолютным отклонением".
Формулу для среднего арифметического он приводит в ином контексте.

 
 
 [ Сообщений: 29 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group