2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Основы статистики
Сообщение29.11.2022, 22:32 


28/01/15
670
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9
Рассмотрим среднее линейное отклонение (СЛО), среднее квадратическое отклонение (СКвО), среднее кубическое отклонение (СКуО) и среднее биквадратическое отклонение (СБО).
$\overline{x} = \frac{\sum^{10}_{i=1}x_i n_i}{\sum^{10}_{i=1}n_i}$ = \dfrac{(0+1+2+3+4+5+6+7+8+9)\cdot1}{1\cdot10} = 4.5$
$\text{СЛО} =  \frac{\sum^{10}_{i=1}|x_i-\overline{x}|n_i}{\sum^{10}_{i=1}n_i} = \dfrac{(4.5+3.5+2.5+1.5+0.5)\cdot2}{2\cdot5} = 2.5$
$\text{СКвО} =  \sqrt{\frac{\sum^{10}_{i=1}(x_i-\overline{x})^2n_i}{\sum^{10}_{i=1}n_i}} = \sqrt{\dfrac{(4.5^2+3.5^2+2.5^2+1.5^2+0.5^2)\cdot2}{2\cdot5}} \approx 2.87$
$\text{СКуО} =  \sqrt[3]{\frac{\sum^{10}_{i=1}|x_i-\overline{x}|^3n_i}{\sum^{10}_{i=1}n_i}} = \sqrt[3]{\dfrac{(4.5^3+3.5^3+2.5^3+1.5^3+0.5^3)\cdot2}{2\cdot5}} \approx 3.13$
$\text{СБО} =  \sqrt[4]{\frac{\sum^{10}_{i=1}(x_i-\overline{x})^4n_i}{\sum^{10}_{i=1}n_i}} = \sqrt[4]{\dfrac{(4.5^4+3.5^4+2.5^4+1.5^4+0.5^4)\cdot2}{2\cdot5}} \approx 3.32$
Математическое ожидание: отсутствует
Среднее арифметическое $= \overline{x} = 4.5$
Медиана $= \dfrac{4+5}{2}=4.5$
Мода: отсутствует
Вопросы:
1. Как нужно понимать все эти средние отклонения: это отклонения от математического ожидания, от среднего арифметического, от медианы, от моды или ещё от какой-нибудь иной меры центральной тенденции?
2. Как понимать, какая степень среднего отклонения (СЛО, СКвО, СКуО, СБО и т.д.) нужна в конкретной ситуации? Почему именно СКвО имеет наибольшую популярность?

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 01:55 


10/03/16
4444
Aeroport
Solaris86
Каким образом выборка из равномерного распределения получилась такой "неслучайной"?

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 05:46 
Аватара пользователя


21/01/09
3925
Дивногорск
ozheredov в сообщении #1571976 писал(а):
Solaris86
Каким образом выборка из равномерного распределения получилась такой "неслучайной"?
А где вы увидели что речь идёт о случайной выборке?

-- Ср ноя 30, 2022 09:49:20 --

Solaris86 в сообщении #1571953 писал(а):
Математическое ожидание: отсутствует
Почему? Среднее арифметическое оно и является таковым.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 05:51 


10/03/16
4444
Aeroport
Александрович в сообщении #1571993 писал(а):
А где вы увидели что речь идёт о случайной выборке?


В названии темы.
Или Вы серьезно считаете, что автора просто заинтересовали какие-то свойства чисел от 0 до 9?

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 05:53 
Аватара пользователя


21/01/09
3925
Дивногорск
Solaris86 в сообщении #1571953 писал(а):
Почему именно СКвО имеет наибольшую популярность?
Потому что ско это один из параметров распределения.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 05:55 


10/03/16
4444
Aeroport
Александрович в сообщении #1571995 писал(а):
Потому что ско это один из параметров распределения.


Выборка не случайна, но распределение есть, да?

И вопрос был, чем второй момент выделен среди всех, в т.ч. моментов более высокого порядка.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 05:56 
Аватара пользователя


21/01/09
3925
Дивногорск
ozheredov в сообщении #1571994 писал(а):
В названии темы.
Я лично не увидел. Может быть название переименовали?

-- Ср ноя 30, 2022 09:58:10 --

ozheredov в сообщении #1571996 писал(а):
Выборка не случайна, но распределение есть, да?
Да, и даже сказано что оно равномерное.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 05:59 


10/03/16
4444
Aeroport
Александрович
Название "основы статистики". Статистика применима только к случайным реализациям.

-- 30.11.2022, 06:00 --

Александрович в сообщении #1571997 писал(а):
Да, и даже сказано что оно равномерное.


А, кажись дошло: 0-9 это носитель дискретного распределения что ли?

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 06:22 
Аватара пользователя


21/01/09
3925
Дивногорск
ozheredov в сообщении #1571998 писал(а):
Статистика применима только к случайным реализациям.
К распределениям случайных величин тоже.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 06:42 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
0. Почему их так много?
Потому, что в статистике хороших оценок нет. Есть совсем плохие, и есть работающие. Причём универсального критерия качества нет, только применительно к распределению исходных данных и прикладной задаче. Посколку данные случайны, всегда возможна ситуация, когда любая мыслимая оценка окажется совершенно негодной. Задав вид распределения и выбрав критерий - можно сравнивать оценки (способ сравнения тоже может быть разным - "в среднем", минимакс и ещё "99 и 7 способов"). И даже выбирать оптимальные, но если меняется распределение и/или прикладная задача, "оптимальная оценка" может стать совершенно непригодной.
1. Что меряют все эти оценки?
Это оценки параметра масштаба. Переменную x можно подвергнуть линейному преобразованию $y=ax+b$, a меняет масштаб, b - положение. Это не единственные оценки, есть, скажем, размах, семиинтерквартильное расстояние (и вообще L-оценки масштаба), медиана абсолютных отклонений (МАО) и многие другие.
2. Чем отличаются приведенные Вами оценки?
Для них выполняется неравенство: при $\alpha<\beta$ имеет место $E_{\alpha}<E_{\beta}$, где альфа и бета показатели степени в оценках приведенного Вами вида. Кстати, при первой степени обычное именование не СЛО, а САО, среднее абсолютное отклонение. Без абсолютной величины тоже считают, хотя смысл она имеет, если отклонения берутся не от среднего арифметического, тогда тривиальный ноль, а, например, от желаемого значения, скажем, при контроле качества, и отклонения от номинального размера.
3. Какую выбрать?
Стандартное отклонение (квадратичная оценка) оптимально в предположении нормальности распределения. Более высокие степени используют редко, они подчёркивают большие отклонения. Ну, или самостоятельная оценка для моментов высшего порядка. При наличии подозрений на "тяжёлые хвосты" лучше использовать робастные оценки (САО или вообще из неназванных Вами, вроде МАО и т.п.). Но даже для стандартного отклонения "возможны варианты".

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 07:02 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1572004 писал(а):
Причём универсального критерия качества нет, только применительно к распределению исходных данных и прикладной задаче.
Нигде пока речь и не шла об выборочных оценках.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 08:32 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
О выборочных оценках речь идёт ipso facto формулы расчёта. В которой фигурируют некие пронумерованные элементы. Велась бы речь о характеристиках распределения - был бы интеграл и вероятности отдельных значений.
Квадратичная оценка популярна в том числе из-за того, что нормальное распределение полностью описывается моментами первого и второго порядков. "Физики думают, что распределение нормально в силу того, что это доказали математики, математики думают, что распределение нормально, потому что его наблюдают физики". Нормальное распределение не является единственно возможным, но оно часто оказывается достаточно близко к наблюдаемым распределениям, для него развита теория, а оценивание параметров сравнительно просто. Зачастую начинают с него, а затем уточняют модель (хотя бы отбрасыванием наиболее уклоняющихся наблюдений, полагая, что они порождены какими-то дополнительными факторами, которые в основной модели не учитываем).

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 09:51 
Аватара пользователя


21/01/09
3925
Дивногорск
Solaris86 в сообщении #1571953 писал(а):
1. Как нужно понимать все эти средние отклонения: это отклонения от математического ожидания, от среднего арифметического, от медианы, от моды или ещё от какой-нибудь иной меры центральной тенденции?

Судя по формулам, вами написанными, то от среднего арифметического (математического ожидания).

-- Ср ноя 30, 2022 14:49:13 --

Евгений Машеров в сообщении #1572004 писал(а):
Стандартное отклонение (квадратичная оценка) оптимально в предположении нормальности распределения. Более высокие степени используют редко, они подчёркивают большие отклонения.

Стандартное отклонение (2-я степень) характеризует расброс около среднего, 3-я степень ассимметрию распределения, 4-тая степень - эксцесс.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение30.11.2022, 11:29 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Александрович в сообщении #1572013 писал(а):
Стандартное отклонение (2-я степень) характеризует расброс около среднего, 3-я степень ассимметрию распределения, 4-тая степень - эксцесс.


Читайте дальше. Там
Евгений Машеров в сообщении #1572004 писал(а):
Ну, или самостоятельная оценка для моментов высшего порядка.


А в качестве оценки для параметра масштаба - редко. Хотя есть распределения, для которых они окажутся оптимальны. Но на практике они встречаются нечасто.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение01.12.2022, 08:12 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Александрович в сообщении #1572013 писал(а):
Судя по формулам, вами написанными, то от среднего арифметического (математического ожидания).


Ну, вообще-то это разные вещи. Параметр распределения и его оценка (одна из...). Причём это не "философские тонкости", если у нас вместо априори известного матожидания фигурирует выборочное среднее - имеет смысл делить не на n, а на $n-1$ (или не имеет - "несмещённость" только один из критериев)

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group