2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Отклонение
Сообщение12.11.2011, 17:53 


12/04/11
17
Насколько я понимаю, среднеквадратичное отклонение - это насколько величина отклоняется в среднем от матожидания, а стандартное отклонение - значение, вероятность превышения отклонения случайной величины от матожидания которого, равна 1/2.

Если я прав, то
Код:
double x[5]   = {13,23,12,44,55};
double E      = (x[0]+x[1]+x[2]+x[3]+x[4]) / 5;
double o(int i) { return x[i] - E; }
double o2(int i) { return o(i)*o(i); }
double Dsk    = (o2(0)+o2(1)+o2(2)+o2(3)+o2(4)) / 5;
double DevSk  = sqrt(Dsk); // 17.21162
double Dstd   = (o2(0)+o2(1)+o2(2)+o2(3)+o2(4)) / 4;
double DevStd = sqrt(Dstd); // 19.24318

int main()
{
    double osum = 0;
    double lessdevstdcount = 0;
    for (int i = 1; ; i++)
    {
        int r = rand();
        while (r > 32764) r = rand();
        r %= 5;
        osum += fabs(x[r] - E);
        if (fabs(x[r] - E) < DevStd) lessdevstdcount++;
        printf("%14.8f  %14.8f\n", osum / i, lessdevstdcount / i);
    }
}


на большом количестве итераций, первое выводимое число должно быть близко к 17.21162, а второе к 0.5.
А у меня получается 16.11763372 0.79832573
В чём я не прав?

 Профиль  
                  
 
 Re: Отклонение
Сообщение12.11.2011, 18:36 
Заслуженный участник
Аватара пользователя


11/03/08
9911
Москва
Нет. Не правы. Отклонение, вероятность превысить которое равно 0.5, именуется не стандартным, а срединным отклонением. Оно равно примерно 0.6672 среднеквадратичного.
Термин "стандартное отклонение" был введен, как синоним для среднеквадратичного отклонения в практике статистического контроля качества (поскольку ставилась цель довести методику до персонала, слабо подготовленного математически). Иногда его употребляют взамен термина "среднеквадратическое", иногда "стандартным отклонением" именуют среднеквадратическое отклонение среднего арифметического (которое меньше среднеквадратического отклонения наблюдений в $\sqrt n$ раз.

 Профиль  
                  
 
 Re: Отклонение
Сообщение12.11.2011, 19:45 


12/04/11
17
Код:
double x[5]   = {13,23,12,44,55};
double E      = (x[0]+x[1]+x[2]+x[3]+x[4]) / 5;
inline double o(int i) { return x[i] - E; }
inline double o2(int i) { return o(i)*o(i); }
double D2     = (o2(0)+o2(1)+o2(2)+o2(3)+o2(4)) / 4;
double DevSredinnoe = sqrt(D2); // 19.24318

int main()
{
    double osum = 0;
    double lessdevstdcount = 0;
    for (int i = 1; ; i++)
    {
        int r = rand();
        while (r > 32764) r = rand();
        r %= 5;
        if (fabs(x[r] - E) < DevSredinnoe) lessdevstdcount++;
        printf("%14.8f\n", lessdevstdcount / i);
    }
}

Пытаюсь увидеть что отклонение превышает срединное отклонение в среднем один раз из двух.
Ожидаю получить что-то близкое к 0.5, а получаю близкое к 0.8.
Что я сделал неправильно?

 Профиль  
                  
 
 Re: Отклонение
Сообщение12.11.2011, 21:20 
Заслуженный участник
Аватара пользователя


11/03/08
9911
Москва
Эээ... Прошу прощения, а что Вы хотите получить?
Взяв пять каких-то левых значений и как-то странно с ними манипулируя?
И, прошу прощения, Вы мой предыдущий комментарий прочли?

 Профиль  
                  
 
 Re: Отклонение
Сообщение12.11.2011, 21:33 


12/04/11
17
Евгений Машеров в сообщении #502948 писал(а):
Эээ... Прошу прощения, а что Вы хотите получить?
Взяв пять каких-то левых значений и как-то странно с ними манипулируя?
И, прошу прощения, Вы мой предыдущий комментарий прочли?

Прочёл. Если я правильно понял, примерно в половине случаев разница между x и M(X) должна превысить 19.24318. Это я и пытаюсь увидеть. Но результат получается другим.

 Профиль  
                  
 
 Re: Отклонение
Сообщение12.11.2011, 21:59 
Заслуженный участник
Аватара пользователя


11/03/08
9911
Москва
Из чего следует Ваш вывод?
На всякий случай напомню. Указанное соотношение для срединного и среднеквадратического отклонения справедливо для нормального распределения. Для других оно может быть другим. Вплоть до ситуации отсутствия среднеквадратического отклонения.
У Вас же величина Х имеет какое-то дискретное распределение, и уж точно не нормальное.

 Профиль  
                  
 
 Re: Отклонение
Сообщение13.11.2011, 11:41 


12/04/11
17
http://easycalculation.com/statistics/s ... iation.php
Здесь расчитывается два отклонения. Кроме того, что это характеристики разброса, им можно дать какое-то объяснение? Как их можно получить на практике?

 Профиль  
                  
 
 Re: Отклонение
Сообщение13.11.2011, 12:56 
Заслуженный участник
Аватара пользователя


11/03/08
9911
Москва
При расчёте дисперсии и среднеквадратического отклонения из наблюдаемых значений вычитают матожидание. Если оно нам неизвестно, его заменяют средним арифметическим, то есть оценкой М.О. Отклонения случайных величин в ту или иную сторону смещают туда же и среднее, и рассчитанная так сумма квадратов оказывается меньше истинной. Чтобы компенсировать это, сумму квадратов отклонений делят не на число наблюдений n, а на "число степеней свободы" (n-1). После этого оказывается, что матодожидание такой оценки равно истинному значению (т.е. оценка несмещённая). Если же среднее арифметическое равно матожиданию (например, если у нас не выборка, а вся генеральная совокупность), то эта мера излишня, и делят на n. Полученную оценку именуют population variance (population standard deviation).

 Профиль  
                  
 
 Re: Отклонение
Сообщение13.11.2011, 14:17 


12/04/11
17
Евгений Машеров в сообщении #503150 писал(а):
Отклонения случайных величин в ту или иную сторону смещают туда же и среднее

Не совсем понятно

 Профиль  
                  
 
 Re: Отклонение
Сообщение13.11.2011, 15:23 


12/04/11
17
user88 в сообщении #503175 писал(а):
Евгений Машеров в сообщении #503150 писал(а):
Отклонения случайных величин в ту или иную сторону смещают туда же и среднее

Не совсем понятно

Наверное понял, но теперь не могу понять, что значит
Евгений Машеров в сообщении #503150 писал(а):
и рассчитанная так сумма квадратов оказывается меньше истинной.

 Профиль  
                  
 
 Re: Отклонение
Сообщение13.11.2011, 17:57 
Заслуженный участник
Аватара пользователя


11/03/08
9911
Москва
Ну, вот сильно упрощённый пример.
Случайная величина принимает с равной вероятностью значения -1 и +1.
Желаем оценить разброс. Матожидание, очевидно 0.
Матожидание квадрата должно быть 1.
Получаем выборку из 10 значений случайной величины. Получить случайно частости, в точности равные вероятностям, можно. В данном случае вероятность этого 0.246, а с вероятностью 0.754 будет либо больше +1, либо больше -1. Рассмотрим один из возможных вариантов.
У нас 6 раз получилось +1 и 4 раза -1.
Среднее арифметическое будет 0.2
Сумма квадратов получится $6(1-0.2)^2+4(-1-0.2)^2=6 \dot 0.64 + 4 \dot 1.44=9.6$
То есть сумма занижена. Чтобы компенсировать это, при вычислении среднего делят не на 10, а на (10-1)=9. Для данного случая "гиперкомпенсация", тем более для случая "в пополаме", но если рассмотреть все варианты , окажется, что матожидание оценки будет равно истинному значению.

 Профиль  
                  
 
 Re: Отклонение
Сообщение13.11.2011, 20:22 
Заслуженный участник


11/05/08
32166
user88 в сообщении #503193 писал(а):
Наверное понял, но теперь не могу понять, что значит
Евгений Машеров в сообщении #503150 писал(а):
и рассчитанная так сумма квадратов оказывается меньше истинной.

Достаточно рассмотреть случай, когда случайные величины $X_k$ центрированы, т.е. имеют нулевое матожидание (этого всегда можно добиться, вычтя из них их матожидание -- ни $D\left[X_k\right]\equiv D\left[X\right]$, ни выборочная дисперсия $S\equiv\frac1n\sum\limits_{k=1}^{n}(X_k-\overline X)^2$ от этого не изменятся). Тогда
$$M\left[\overline X\right]=0;\ \ \ \ M\left[X_k^2\right]=M\left[X^2\right]=D\left[X\right];\ \ \ \ M\left[X_kX_i\right]=0\ (\forall i\neq k);$$
$$M\left[\overline X^2\right]=D\left[\overline X\right]=\frac1nD\left[X\right];\ \ \ \ M\left[X_k\overline X\right]=M\left[\frac1n\sum\limits_{i=1}^{n}X_kX_i^\right]=\frac1nM\left[X^2\right]=\frac1nD\left[X\right]\ (\forall k);$$
$$S=M\left[\frac1n\sum\limits_{k=1}^{n}\left(X_k^2-2X_k\overline X+\overline X^2\right)\right]=\frac1n\left(n\,D[X]-2n\cdot\frac1nD[X]+n\cdot\frac1nD[X]\right)=\left(1-\frac1n\right)D[X],$$
что вовсе не совпадает с желаемым просто $D[X]$.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 12 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group