2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 О выборке
Сообщение17.05.2023, 23:55 


31/01/23
27
В стандартных курсах математической статистики под выборкой $X = (X_1, X_2,...,X_n)$ понимаю набор независимых одинаково распределенных случайных величин. При этом набор чисел, который получен из эксперимента, понимается, как реализация этой выборки. Тут сразу встает несколько вопросов.

1) Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = (X_1 (\omega), X_2 (\omega),...,X_n (\omega)$?
2) Если да, то не получается ли это немного странно? Предположим, что у нас случайная величина - это синус. Мы получили реализацию этого синуса - некоторый набор значений. Однако в интерпретации выше получается, что мы имеем дело с целым набором случайных величин, имеющих то же распределение, что и синус, но при этом, имеющие разные значения в одной и той же точке $\omega$. И при этом теорема Гливенко-Кантелли говорит нам, что мы еще по этим значениям по сути можем восстановить функцию распределения, хотя на самом деле, мы взяли значения случайных величин лишь в одной точке.

Я понимаю, что в матстатистике мы больше интересуемся областью значения случайных величин, но у меня все равно не укладывается в голове, как идеологически мы можем что-то восстановить из значения в одной точке. При этом мы могли бы рассматривать данные эксперимента, как реализацию одной и той же случайной величины, но тогда мы не сможем использовать ЗБЧ, ЦПТ итд. Как это осознать?

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 00:33 
Заслуженный участник
Аватара пользователя


16/07/14
9217
Цюрих
Да, предполагается, что у нас есть вероятностное пространство, набор случайных величин на нём, а реализация выборка - это вектор значений этих случайных величин на некотором элементе $\omega$.
Путаница, думаю, в этом:
ElfDante в сообщении #1594271 писал(а):
Предположим, что у нас случайная величина - это синус
Нужно сказать, на каком вероятностном пространстве он определен.
И в любом случае, у нас есть не одна функция, а целый набор. Одинаково распределенных, но функции-то разные.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 00:52 


31/01/23
27
mihaild в сообщении #1594274 писал(а):
Нужно сказать, на каком вероятностном пространстве он определен.

Это просто. Пусть $\Omega = [0,1]$, случайная величина $\xi(\omega) = \sin(2 \pi \omega)$, а мера - это стандартная мера Лебега.

Я просто не понимаю, как из значений одного этого синуса мы соорудили множество случайных величин? Например в нашей выборке есть 0 и 1. Тогда $\omega$ может быть, например, равной 1/4, и тогда значение 1 принадлежит нужному синусу, а 0 - например, косинусу, который распределен так же, как и синус (правда, он зависим с синусом, но да ладно). При том, что изначально у нас реализовывался именно синус!

Можно еще мой вопрос сформулировать так: почему эквивалентно рассматривать несколько случайных величин в одной точке тому, чтобы рассматривать одну случайную величину в нескольких точках?
Даже выборочная функция распределения становится странным объектом в первом подходе. Тут же пропадает понятие частоты (все случайные величины реализовались один раз).

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 01:10 
Заслуженный участник
Аватара пользователя


16/07/14
9217
Цюрих
ElfDante в сообщении #1594277 писал(а):
Я просто не понимаю, как из значений одного этого синуса мы соорудили множество случайных величин?
А никак. Мы считаем, что у нас есть много случайных величин, каждая из которых распределена как этот синус, и которые независимы в совокупности. Теорема Колмогорова о существовании меры утверждает, что подходящее вероятностное пространство (на котором можно определить эти случайные величины, чтобы получились нужные распределения) существует.

Если хотите, можно например взять в качестве вероятностного пространства $\mathbb N^{[0, 1]}$, т.е. множество функций из натуральных чисел в $[0, 1]$. Алгебра на нём порождается конечномерными цилиндрами, т.е. множествами вида $\{f | f(n) \in A_n, n \in B\}$, где $B$ конечно, а все $A_n$ измеримы, и мера такого множества равна произведению мер $A_n$ (по сути равномерное распределение на бесконечномерном кубе). Тогда случайные величины можно будет определить как $X_n(f) = \sin(2\pi f(n))$. Они все независимы, а каждая распределена как Ваша $\xi$.
ElfDante в сообщении #1594277 писал(а):
Можно еще мой вопрос сформулировать так: почему эквивалентно рассматривать несколько случайных величин в одной точке тому, чтобы рассматривать одну случайную величину в нескольких точках?
В общем случае не эквивалентно. Существенная часть матстата это как раз когда можно по набору значений в одной точке сделать вывод о значении в остальных.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 03:29 


27/06/20
337
ElfDante в сообщении #1594271 писал(а):
1) Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = X_1 (\omega), X_2 (\omega),...,X_n (\omega)$?
Если я правильно понимаю Ваш вопрос, то конечно нет. Реализуется сам элементарный (возможно ни капельки не являющийся числом) исход $\omega$ в соответствии с его мерой. А $X$ это всего лишь детерминированная функция из этого (возможно нечислового) исхода $\omega$ в (в Вашем случае) действительное число.
$X: \omega \to \mathbb{R}$
Поскольку $X$ это функция, она не может дать на выходе разные числа, имея на входе одну и ту же $\omega$.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 07:30 


31/01/23
27
mihaild в сообщении #1594279 писал(а):
Если хотите, можно например взять в качестве вероятностного пространства $\mathbb N^{[0, 1]}$, т.е. множество функций из натуральных чисел в $[0, 1]$. Алгебра на нём порождается конечномерными цилиндрами, т.е. множествами вида $\{f | f(n) \in A_n, n \in B\}$, где $B$ конечно, а все $A_n$ измеримы, и мера такого множества равна произведению мер $A_n$ (по сути равномерное распределение на бесконечномерном кубе). Тогда случайные величины можно будет определить как $X_n(f) = \sin(2\pi f(n))$. Они все независимы, а каждая распределена как Ваша $\xi$.

Я, кажется, понял! То есть, случайные величины из выборки реализуются не на том же вероятностном пространстве, а, возможно, на каком-то другом (в принципе, видимо, даже не важно на каком), главное - чтобы равнялись функции распределения $P^*(X_n < x) = P(\xi < x)$. Я правильно понимаю?
ipgmvq в сообщении #1594284 писал(а):
Поскольку $X$ это функция, она не может дать на выходе разные числа, имея на входе одну и ту же $\omega$.

Почему? Просто вектор-функция, определенная в одной точке.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 07:52 
Аватара пользователя


22/11/22
676
ElfDante в сообщении #1594271 писал(а):
В стандартных курсах математической статистики под выборкой $X = (X_1, X_2,...,X_n)$ понимаю набор независимых одинаково распределенных случайных величин. При этом набор чисел, который получен из эксперимента, понимается, как реализация этой выборки. Тут сразу встает несколько вопросов.

1) Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = (X_1 (\omega), X_2 (\omega),...,X_n (\omega))$?

Нет.
Реализацией выборки что только ни называют, но в том контексте, что у вас - это набор $(x_1,\ldots,x_n)$ значений с.в. $(X_1,\ldots,X_n)$. Есть случайный вектор - и есть его значения.
Иначе : набор $(x_1,\ldots,x_n)$ = реализации с.в. X, если это результат n независимых испытаний, где каждое значение $x_k$ есть результат k-го испытания, подчиненного тому же закону, что и X.
Пример.
Пусть бросается кубик с несмещенным центром тяжести. X - число очков, выпавших при одном бросании.
Тогда выборка объема n в одном смысле есть набор с.в. $(X_1,\ldots,X_n)$. На каждом месте стоит с.в. с тем же, что и у X, распеределением, все независимы в совокупности.
Во втором смысле, как реализация - это набор значений, "что прилетело", из 1, 2, ... 6. Например (для $n=5$), $(3,5,5,3,6)$.

Кстати, эмпирическая функция распределения спокойно определяется и с помощью первого определения, и с помощью второго. Поскольку в теореме Гливенко-Кантелли речь идет о сходимости по вероятности (последовательности с.в.), то конечно, там имеется в виду именно первое определение.

А вероятностное пространство - какое было с самого начала, то и осталось. То, на котором заданы с.в. Хотя можно от них уйти, конечно, к пространству распределений с соотв. мерой, но не особо нужно. По сути, оно и так всплывет.
ElfDante в сообщении #1594292 писал(а):
чтобы равнялись функции распределения $P^*(X_n < x) = P(\xi < x)$. Я правильно понимаю?

Тут уже я не понимаю. С чего бы им равняться?

-- 18.05.2023, 07:03 --

А, я кажется, догадываюсь, в чем проблема. Видимо, она тут:
Цитата:
Реализацией выборки что только ни называют, но в том контексте, что у вас - это набор $(x_1,\ldots,x_n)$ значений с.в. $(X_1,\ldots,X_n)$.

И судя по всему, вы считаете, что если с.в. одинаково распределены - например, как
ElfDante в сообщении #1594277 писал(а):
$\xi(\omega) = \sin(2 \pi \omega)$

то вектор состоит из одинаковых компонент.
Типа $(X_1(\omega),\ldots,X_n(\omega))=(\xi(\omega),\ldots\xi(\omega))$.

Так ничего подобного. Одинаково распределенные случайные величины - не есть совпадающие. И совпадающие - точно не могут быть независимыми. Это старая проблема: одинаковые распределения и одинаковые с.в. - очень разные вещи.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 09:39 


31/01/23
27
Combat Zone в сообщении #1594293 писал(а):
Нет.
Реализацией выборки что только ни называют, но в том контексте, что у вас - это набор $(x_1,\ldots,x_n)$ значений с.в. $(X_1,\ldots,X_n)$. Есть случайный вектор - и есть его значения.

Не очень понял, в чем разница с тем, что написал я... Я написал, что $(X_1,\ldots,X_n)$ - это вектор, а выборка - это значение вектора в некоторой точке вероятностного пространства.
Combat Zone в сообщении #1594293 писал(а):
Тут уже я не понимаю. С чего бы им равняться?

Потому что у них одинаковые функции распределения.
Combat Zone в сообщении #1594293 писал(а):
то вектор состоит из одинаковых компонент.
Типа $(X_1(\omega),\ldots,X_n(\omega))=(\xi(\omega),\ldots\xi(\omega))$.

Нет, я там привел пример, что случайная величина $\eta (\omega) = \cos (2 \pi \omega)$ одинаково распределена с $\xi$, но сама функция другая (правда, они зависимы).
Combat Zone в сообщении #1594293 писал(а):
Тогда выборка объема n в одном смысле есть набор с.в. $(X_1,\ldots,X_n)$. На каждом месте стоит с.в. с тем же, что и у X, распеределением, все независимы в совокупности.

Но из того, что написали выше, я правильно понимаю, что если, например, исходная случайная величина $X$ в примере с кубиком - это функция, принимающая значения от 1 до 6, то с.в. $X_n$, стоящие в выборке, это тоже функции, принимающие значения от 1 до 6, но, возможно, в другом порядке? И их реализация - это мы просто в каждую с.в. вставляем одинаковую омегу?
Кстати, в этом случае получается, что у нас есть всего 6! независимых функций. Что произойдет, когда они начнут повторяться? У нас же пропадет независимость.

Извините, если сильно туплю :(

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 10:39 
Заслуженный участник
Аватара пользователя


16/07/14
9217
Цюрих
ElfDante в сообщении #1594292 писал(а):
То есть, случайные величины из выборки реализуются не на том же вероятностном пространстве, а, возможно, на каком-то другом (в принципе, видимо, даже не важно на каком)
Да, так. В принципе исходное $X$ даже не обязано быть случайной величиной, достаточно распределения.
Combat Zone в сообщении #1594293 писал(а):
Пусть бросается кубик с несмещенным центром тяжести. X - число очков, выпавших при одном бросании
Если требовать максимальной строгости, то так говорить нельзя. Что вообще такое $X$ у вас получается - функция? Откуда куда?
ElfDante в сообщении #1594302 писал(а):
Но из того, что написали выше, я правильно понимаю, что если, например, исходная случайная величина $X$ в примере с кубиком - это функция, принимающая значения от 1 до 6, то с.в. $X_n$, стоящие в выборке, это тоже функции, принимающие значения от 1 до 6, но, возможно, в другом порядке?
Они ещё и на другом пространстве определены. Если мы кидаем кубик, то удобно взять пространство, в котором элементарный исход - это весь протокол бросаний. А величины, соответственно, просто последовательные его компоненты.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 10:50 
Аватара пользователя


22/11/22
676
mihaild в сообщении #1594310 писал(а):
Если требовать максимальной строгости, то так говорить нельзя. Что вообще такое $X$ у вас получается - функция? Откуда куда?

Если требовать максимальной строгости, то надо выбросить все задачники по терверу, где такого сорта формулировок - до черта.
И да, в такого сорта задачах, как правило, речь, по факту идет о распределении с.в., а не о ней самой.

... Мне кажется, глазам будет проще, если в теме станет одной нянькой меньше. Я о себе, конечно. И последний пост ТС оставлю без внимания - тут много народу, кто может его уделить.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 11:08 


31/01/23
27
mihaild в сообщении #1594310 писал(а):
Они ещё и на другом пространстве определены. Если мы кидаем кубик, то удобно взять пространство, в котором элементарный исход - это весь протокол бросаний. А величины, соответственно, просто последовательные его компоненты.

Я Вас понял. В этом же случае не возникает проблем с независимостью. Спасибо Вам большое!
Combat Zone
И Вам спасибо за мысли!

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 11:09 
Аватара пользователя


22/11/22
676
Пожалуйста. Чего от меня тут не было - так это именно мыслей.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 14:09 


27/06/20
337
ElfDante в сообщении #1594277 писал(а):
Пусть $\Omega = [0,1]$, случайная величина $\xi(\omega) = \sin(2 \pi \omega)$,
ElfDante в сообщении #1594292 писал(а):
Почему? Просто вектор-функция, определенная в одной точке.
Это так, я просто не увидел в примерах вектор-функции. А осмысление $\Omega$ как $\left[ 0,\ 1 \right]$ для функции выдающее целое векторное пространство $X: \left[ 0,\ 1 \right] \to \mathbb{R}^n $ или $X: \left[ 0,\ 1 \right] \to \left[ -1,\ 1 \right]^n $ :| Если бы ещё это была не выборка, а вектор с зависимыми элементами...

 Профиль  
                  
 
 Re: О выборке
Сообщение22.05.2023, 12:33 
Заслуженный участник
Аватара пользователя


11/03/08
10006
Москва
ElfDante в сообщении #1594271 писал(а):
Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = (X_1 (\omega), X_2 (\omega),...,X_n (\omega))$?


Э, а с чего это один и тот же элемент, то есть исход испытания? Если бы был одна и та же омега, то были бы одни и те же иксы. Разные элементы одного и того же вероятностного пространства. Кидаем монетку, чтобы по выборке выяснить, честная ли она. Каждый бросок - новая омега.

 Профиль  
                  
 
 Re: О выборке
Сообщение22.05.2023, 12:46 
Заслуженный участник
Аватара пользователя


16/07/14
9217
Цюрих
Евгений Машеров в сообщении #1594732 писал(а):
Каждый бросок - новая омега
Как при таком подходе определяется, например, состоятельность?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 17 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group