2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 00:00 


18/10/16
12
Выбираем $N$ чисел от $0$ до $99$ (с одинаковой вероятностью и возвратом). Из получившегося набора выбираем $10$ чисел (снова с возвратом числа обратно в выборку и одинаковой вероятностью). Вопрос, какова вероятность, что среднее значение второй выборки (из $10$ чисел) отличается от среднего значения первой ($N$ элементов) больше чем на $20$.

Мой расчёт даёт хороший результат если $N > 15$, но занижает для малых $N$.

Например если $N=30$, $A$ - первая выборка и $X$ - вторая выборка, $U$ - дискретное равномерное распределение от $0$ до $99$.

Я рассчитал дисперсию дискретного распределения $U$: $$D[U]=\frac{((99-0+2)(99-0))}{12}=833.25$$
Диспeрсию выборки $A$: $$D[A]=\frac{29}{30}D[U]=805.5$$
Дисперсию среднего значения выборки $X$: $$D[\overline X]=\frac{D[A]}{10}=80.55$$

После этого питон:
Код:
p = stats.norm(0, math.sqrt(80.55)).cdf(-20) * 2


И я получил $0.02585$ (симуляция даёт $0.02572$). Однако для, например $N=2$ мои вычисления дают около $0.002$, а симуляция около $0.015$ (в разы больше). Подскажите, где ошибка.

 Профиль  
                  
 
 Posted automatically
Сообщение01.07.2018, 00:52 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
по следующим причинам:

- неправильно набраны формулы (краткие инструкции: «Краткий FAQ по тегу [math]» и видеоролик Как записывать формулы).

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

 Профиль  
                  
 
 Posted automatically
Сообщение01.07.2018, 01:56 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Карантин» в форум «Помогите решить / разобраться (М)»

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 09:28 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Наивный ответ сходу. Потому, что при N=2 распределение среднего никак не будет нормальным.

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 18:56 


18/10/16
12
Евгений Машеров в сообщении #1323746 писал(а):
Наивный ответ сходу. Потому, что при N=2 распределение среднего никак не будет нормальным.


Спасибо за помощь, но...

Нормальность от выборки A не требуется (мы не требуем нормальности от распределения орла и решки: если мы рассмотрим распределение ее выборки из 10 бросков, то такое биномиальное распределения будет достаточно близко выражаться через нормальное, не говоря уже о распределении среднего).

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 21:02 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Тем не менее Вы используете для расчёта формулу нормального распределения. А при малых N аппроксимирующая сила такого приближения крайне скромная. Для случая N=2 у Вас в выборке два элемента, повторяющиеся разное число раз. И распределение из среднего от нормального отличается сильно.

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 21:34 


18/10/16
12
Извините, другие версии есть?

-- 01.07.2018, 23:31 --

Для малыx N, вычисления строго занижают, и это закономерность.
Кто может подсказать где ее функция?

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение01.07.2018, 22:58 


18/10/16
12
Вот как выглядит, для наглядности.https://ibb.co/ejJ3HJ

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение02.07.2018, 03:41 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Ну, если мало соображений о плохой аппроксимации нормальным, то дисперсия среднего арифметического новой выборки вычислена неверно. Вот тут https://nsu.ru/phorum/read.php?f=6&i=25733&t=25733 есть правильные вычисления, и ответ для $N=2$, $k=10$ будет в пять с половиной раз большим.
$$
\mathsf D\overline X = \frac{N+k-1}{Nk} \cdot\mathsf D A = \frac{11}{20}\cdot \mathsf D A \neq \frac{\mathsf D A}{10}.
$$

(Оффтоп)

Сейчас недосуг переписать сюда формулы, как вернусь с экзамена - сделаю.

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение02.07.2018, 08:53 


18/10/16
12
В общем я разобрался где ошибся, спасибо Евгений и --mS--

 Профиль  
                  
 
 Re: Выборка из выборки, помогите найти ошибку.
Сообщение02.07.2018, 13:25 
Заслуженный участник
Аватара пользователя


23/11/06
4171

(Оффтоп)

Ну тогда я не буду переписывать формулы.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 11 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group