2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 00:00 


18/10/16
12
Выбираем $N$ чисел от $0$ до $99$ (с одинаковой вероятностью и возвратом). Из получившегося набора выбираем $10$ чисел (снова с возвратом числа обратно в выборку и одинаковой вероятностью). Вопрос, какова вероятность, что среднее значение второй выборки (из $10$ чисел) отличается от среднего значения первой ($N$ элементов) больше чем на $20$.

Мой расчёт даёт хороший результат если $N > 15$, но занижает для малых $N$.

Например если $N=30$, $A$ - первая выборка и $X$ - вторая выборка, $U$ - дискретное равномерное распределение от $0$ до $99$.

Я рассчитал дисперсию дискретного распределения $U$: $$D[U]=\frac{((99-0+2)(99-0))}{12}=833.25$$
Диспeрсию выборки $A$: $$D[A]=\frac{29}{30}D[U]=805.5$$
Дисперсию среднего значения выборки $X$: $$D[\overline X]=\frac{D[A]}{10}=80.55$$

После этого питон:
Код:
p = stats.norm(0, math.sqrt(80.55)).cdf(-20) * 2


И я получил $0.02585$ (симуляция даёт $0.02572$). Однако для, например $N=2$ мои вычисления дают около $0.002$, а симуляция около $0.015$ (в разы больше). Подскажите, где ошибка.

 Профиль  
                  
 
 Posted automatically
Сообщение01.07.2018, 00:52 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
по следующим причинам:

- неправильно набраны формулы (краткие инструкции: «Краткий FAQ по тегу [math]» и видеоролик Как записывать формулы).

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

 Профиль  
                  
 
 Posted automatically
Сообщение01.07.2018, 01:56 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Карантин» в форум «Помогите решить / разобраться (М)»

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 09:28 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Наивный ответ сходу. Потому, что при N=2 распределение среднего никак не будет нормальным.

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 18:56 


18/10/16
12
Евгений Машеров в сообщении #1323746 писал(а):
Наивный ответ сходу. Потому, что при N=2 распределение среднего никак не будет нормальным.


Спасибо за помощь, но...

Нормальность от выборки A не требуется (мы не требуем нормальности от распределения орла и решки: если мы рассмотрим распределение ее выборки из 10 бросков, то такое биномиальное распределения будет достаточно близко выражаться через нормальное, не говоря уже о распределении среднего).

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 21:02 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Тем не менее Вы используете для расчёта формулу нормального распределения. А при малых N аппроксимирующая сила такого приближения крайне скромная. Для случая N=2 у Вас в выборке два элемента, повторяющиеся разное число раз. И распределение из среднего от нормального отличается сильно.

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 21:34 


18/10/16
12
Извините, другие версии есть?

-- 01.07.2018, 23:31 --

Для малыx N, вычисления строго занижают, и это закономерность.
Кто может подсказать где ее функция?

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 22:58 


18/10/16
12
Вот как выглядит, для наглядности.https://ibb.co/ejJ3HJ

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение02.07.2018, 03:41 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Ну, если мало соображений о плохой аппроксимации нормальным, то дисперсия среднего арифметического новой выборки вычислена неверно. Вот тут https://nsu.ru/phorum/read.php?f=6&i=25733&t=25733 есть правильные вычисления, и ответ для $N=2$, $k=10$ будет в пять с половиной раз большим.
$$
\mathsf D\overline X = \frac{N+k-1}{Nk} \cdot\mathsf D A = \frac{11}{20}\cdot \mathsf D A \neq \frac{\mathsf D A}{10}.
$$

(Оффтоп)

Сейчас недосуг переписать сюда формулы, как вернусь с экзамена - сделаю.

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение02.07.2018, 08:53 


18/10/16
12
В общем я разобрался где ошибся, спасибо Евгений и --mS--

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение02.07.2018, 13:25 
Заслуженный участник
Аватара пользователя


23/11/06
4171

(Оффтоп)

Ну тогда я не буду переписывать формулы.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 11 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: vpb


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group