2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Основы статистики
Сообщение01.12.2022, 12:13 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1572105 писал(а):
если у нас вместо априори известного матожидания фигурирует выборочное среднее - имеет смысл делить не на n, а на $n-1$
Ну не среднее же! Выборочную дисперсию естественно следует исправить, поскольку одна степень свободы уже использована.
Евгений Машеров в сообщении #1572009 писал(а):
О выборочных оценках речь идёт ipso facto формулы расчёта.
Да не было там ничего подобного. Посмотрите внимательно ещё раз на формулы.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение01.12.2022, 12:27 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Посмотрел. Оценки выборочных моментов (ММП-оценки, если быть точным).

 Профиль  
                  
 
 Re: Основы статистики
Сообщение01.12.2022, 14:06 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1572125 писал(а):
Посмотрел. Оценки выборочных моментов (ММП-оценки, если быть точным).

Или я чего-то не вижу. Задана функция распределения. Ни о какой выборке речи не шло.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение01.12.2022, 14:32 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Давайте тогда договоримся о дефинициях. Функция распределения - математическое выражение. Выборка - набор чисел. Приведен набор чисел.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение01.12.2022, 14:37 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1572149 писал(а):
Выборка - набор чисел.
Для случайной выбоки это случайный набор. Но здесь же -
Solaris86 в сообщении #1571953 писал(а):
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9

 Профиль  
                  
 
 Re: Основы статистики
Сообщение01.12.2022, 16:11 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Напоминает байку про студента, которому задали написать генератор случайных чисел. Написанный - он выдавал прстоянно 13.
- А что такого? Я ведь случайно число выбрал!

 Профиль  
                  
 
 Re: Основы статистики
Сообщение07.12.2022, 21:06 


28/01/15
670
Евгений Машеров в сообщении #1572004 писал(а):
3. Какую выбрать?
Стандартное отклонение (квадратичная оценка) оптимально в предположении нормальности распределения. Более высокие степени используют редко, они подчёркивают большие отклонения. Ну, или самостоятельная оценка для моментов высшего порядка. При наличии подозрений на "тяжёлые хвосты" лучше использовать робастные оценки (САО или вообще из неназванных Вами, вроде МАО и т.п.). Но даже для стандартного отклонения "возможны варианты".

Александрович в сообщении #1572013 писал(а):
Стандартное отклонение (2-я степень) характеризует расброс около среднего, 3-я степень ассимметрию распределения, 4-тая степень - эксцесс.

Тогда если всё резюмировать:
1. Первая степень - ?
2. Вторая степень - разброс около среднего
3. Третья степень - асимметрия распределения
4. Четвертая степень - эксцесс
Вот на моём конкретном примере - как трактовать полученные цифры степенных средних, можете привести примеры формулировок, заключений?
Solaris86 в сообщении #1571953 писал(а):
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9
Рассмотрим среднее линейное отклонение (СЛО), среднее квадратическое отклонение (СКвО), среднее кубическое отклонение (СКуО) и среднее биквадратическое отклонение (СБО).
$\overline{x} = \frac{\sum^{10}_{i=1}x_i n_i}{\sum^{10}_{i=1}n_i}$ = \dfrac{(0+1+2+3+4+5+6+7+8+9)\cdot1}{1\cdot10} = 4.5$
$\text{СЛО} =  \frac{\sum^{10}_{i=1}|x_i-\overline{x}|n_i}{\sum^{10}_{i=1}n_i} = \dfrac{(4.5+3.5+2.5+1.5+0.5)\cdot2}{2\cdot5} = 2.5$
$\text{СКвО} =  \sqrt{\frac{\sum^{10}_{i=1}(x_i-\overline{x})^2n_i}{\sum^{10}_{i=1}n_i}} = \sqrt{\dfrac{(4.5^2+3.5^2+2.5^2+1.5^2+0.5^2)\cdot2}{2\cdot5}} \approx 2.87$
$\text{СКуО} =  \sqrt[3]{\frac{\sum^{10}_{i=1}|x_i-\overline{x}|^3n_i}{\sum^{10}_{i=1}n_i}} = \sqrt[3]{\dfrac{(4.5^3+3.5^3+2.5^3+1.5^3+0.5^3)\cdot2}{2\cdot5}} \approx 3.13$
$\text{СБО} =  \sqrt[4]{\frac{\sum^{10}_{i=1}(x_i-\overline{x})^4n_i}{\sum^{10}_{i=1}n_i}} = \sqrt[4]{\dfrac{(4.5^4+3.5^4+2.5^4+1.5^4+0.5^4)\cdot2}{2\cdot5}} \approx 3.32$

 Профиль  
                  
 
 Re: Основы статистики
Сообщение07.12.2022, 22:25 
Аватара пользователя


21/01/09
3925
Дивногорск
Solaris86 в сообщении #1573015 писал(а):
1. Первая степень - ?
Среднее значение естественно.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение07.12.2022, 22:40 


28/01/15
670
Александрович в сообщении #1573024 писал(а):
Solaris86 в сообщении #1573015 писал(а):
1. Первая степень - ?
Среднее значение естественно.

Не понял. У меня в примере среднее - 4.5, а СЛО - 2.5.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение07.12.2022, 23:30 
Аватара пользователя


21/01/09
3925
Дивногорск
Давайте сначала.
Solaris86 в сообщении #1571953 писал(а):
Пусть есть ряд чисел с равномерным распределением: 0 1 2 3 4 5 6 7 8 9
Многие подумали что это выборка. А вы что имели в виду?

 Профиль  
                  
 
 Re: Основы статистики
Сообщение08.12.2022, 06:37 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Я не вправе приказывать Вам пользоваться своей, а не общепринятой терминологией, но выражение согласно первой Вашей формуле обычно именуют САО (среднее абсолютное отклонение) - абсолютная величина функция нелинейная. Даёт она не среднее, а оценку параметра масштаба, одну из. Остальные выражения также оценивают параметр масштаба. Для известного распределения они могут быть выражены одно через другое введением коэффициента. Разница возникает, если рассматриваем величины с различным распределением. Чем выше показатель степени, тем сильнее влияют "тяжёлые хвосты".
Второе - обычная оценка среднеквадратичного отклонения (с точностью до величины в знаменателе - вычитать ли единицу для несмещённости, не вычитать для ММП-оценки или прибавить единицу для минимизации среднеквадратичной ошибки оценки; для больших выборок принципиальной разницы нет, а непринципиальная снимается "единообразным выбором"). Для нормального распределения квадратика оптимальна, для других, вообще говоря, нет.
Третью в таком виде не встречал, для расчёта асимметрии абсолютную величину не берут, при абсолютной величине мы собственно асимметрии не увидим, а её считают, чтобы понять, что "правый хвост длиннее".
Четвёртая связана с оцениванием эксцесса, но не есть оценка эксцесса, она зависит и от четвёртого семиинварианта, и от второго (дисперсии). Для оценивания эксцесса делят на квадрат дисперсии, получая величину, зависящую от формы распределения, но не от масштаба. Часто также вычитают 3, поскольку для нормального нормированный четвёртый момент равен трём, и получают в собственном смысле "эксцесс", превышение над нормальным или снижение сравнительно с нормальным. При использовании надо обращать внимание на эту деталь расчёта.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение08.12.2022, 10:50 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Александрович в сообщении #1573024 писал(а):
Среднее значение естественно.


Там абсолютная величина отклонения берётся.

 Профиль  
                  
 
 Re: Основы статистики
Сообщение08.12.2022, 10:57 
Аватара пользователя


21/01/09
3925
Дивногорск
Solaris86 Это что за формула?

Solaris86 в сообщении #1571953 писал(а):
$\overline{x} = \frac{\sum^{10}_{i=1}x_i n_i}{\sum^{10}_{i=1}n_i}$= \dfrac{(0+1+2+3+4+5+6+7+8+9)\cdot1}{1\cdot10} = 4.5$

 Профиль  
                  
 
 Re: Основы статистики
Сообщение08.12.2022, 13:39 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
ТС под "средним линейным отклонением" понимает
Solaris86 в сообщении #1571953 писал(а):
$\text{СЛО} =  \frac{\sum^{10}_{i=1}|x_i-\overline{x}|n_i}{\sum^{10}_{i=1}n_i} = \dfrac{(4.5+3.5+2.5+1.5+0.5)\cdot2}{2\cdot5} = 2.5$

Что обычно именуется "средним абсолютным отклонением".
Формулу для среднего арифметического он приводит в ином контексте.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: dgwuqtj


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group