2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 О выборке
Сообщение17.05.2023, 23:55 


31/01/23
27
В стандартных курсах математической статистики под выборкой $X = (X_1, X_2,...,X_n)$ понимаю набор независимых одинаково распределенных случайных величин. При этом набор чисел, который получен из эксперимента, понимается, как реализация этой выборки. Тут сразу встает несколько вопросов.

1) Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = (X_1 (\omega), X_2 (\omega),...,X_n (\omega)$?
2) Если да, то не получается ли это немного странно? Предположим, что у нас случайная величина - это синус. Мы получили реализацию этого синуса - некоторый набор значений. Однако в интерпретации выше получается, что мы имеем дело с целым набором случайных величин, имеющих то же распределение, что и синус, но при этом, имеющие разные значения в одной и той же точке $\omega$. И при этом теорема Гливенко-Кантелли говорит нам, что мы еще по этим значениям по сути можем восстановить функцию распределения, хотя на самом деле, мы взяли значения случайных величин лишь в одной точке.

Я понимаю, что в матстатистике мы больше интересуемся областью значения случайных величин, но у меня все равно не укладывается в голове, как идеологически мы можем что-то восстановить из значения в одной точке. При этом мы могли бы рассматривать данные эксперимента, как реализацию одной и той же случайной величины, но тогда мы не сможем использовать ЗБЧ, ЦПТ итд. Как это осознать?

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 00:33 
Заслуженный участник
Аватара пользователя


16/07/14
9219
Цюрих
Да, предполагается, что у нас есть вероятностное пространство, набор случайных величин на нём, а реализация выборка - это вектор значений этих случайных величин на некотором элементе $\omega$.
Путаница, думаю, в этом:
ElfDante в сообщении #1594271 писал(а):
Предположим, что у нас случайная величина - это синус
Нужно сказать, на каком вероятностном пространстве он определен.
И в любом случае, у нас есть не одна функция, а целый набор. Одинаково распределенных, но функции-то разные.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 00:52 


31/01/23
27
mihaild в сообщении #1594274 писал(а):
Нужно сказать, на каком вероятностном пространстве он определен.

Это просто. Пусть $\Omega = [0,1]$, случайная величина $\xi(\omega) = \sin(2 \pi \omega)$, а мера - это стандартная мера Лебега.

Я просто не понимаю, как из значений одного этого синуса мы соорудили множество случайных величин? Например в нашей выборке есть 0 и 1. Тогда $\omega$ может быть, например, равной 1/4, и тогда значение 1 принадлежит нужному синусу, а 0 - например, косинусу, который распределен так же, как и синус (правда, он зависим с синусом, но да ладно). При том, что изначально у нас реализовывался именно синус!

Можно еще мой вопрос сформулировать так: почему эквивалентно рассматривать несколько случайных величин в одной точке тому, чтобы рассматривать одну случайную величину в нескольких точках?
Даже выборочная функция распределения становится странным объектом в первом подходе. Тут же пропадает понятие частоты (все случайные величины реализовались один раз).

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 01:10 
Заслуженный участник
Аватара пользователя


16/07/14
9219
Цюрих
ElfDante в сообщении #1594277 писал(а):
Я просто не понимаю, как из значений одного этого синуса мы соорудили множество случайных величин?
А никак. Мы считаем, что у нас есть много случайных величин, каждая из которых распределена как этот синус, и которые независимы в совокупности. Теорема Колмогорова о существовании меры утверждает, что подходящее вероятностное пространство (на котором можно определить эти случайные величины, чтобы получились нужные распределения) существует.

Если хотите, можно например взять в качестве вероятностного пространства $\mathbb N^{[0, 1]}$, т.е. множество функций из натуральных чисел в $[0, 1]$. Алгебра на нём порождается конечномерными цилиндрами, т.е. множествами вида $\{f | f(n) \in A_n, n \in B\}$, где $B$ конечно, а все $A_n$ измеримы, и мера такого множества равна произведению мер $A_n$ (по сути равномерное распределение на бесконечномерном кубе). Тогда случайные величины можно будет определить как $X_n(f) = \sin(2\pi f(n))$. Они все независимы, а каждая распределена как Ваша $\xi$.
ElfDante в сообщении #1594277 писал(а):
Можно еще мой вопрос сформулировать так: почему эквивалентно рассматривать несколько случайных величин в одной точке тому, чтобы рассматривать одну случайную величину в нескольких точках?
В общем случае не эквивалентно. Существенная часть матстата это как раз когда можно по набору значений в одной точке сделать вывод о значении в остальных.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 03:29 


27/06/20
337
ElfDante в сообщении #1594271 писал(а):
1) Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = X_1 (\omega), X_2 (\omega),...,X_n (\omega)$?
Если я правильно понимаю Ваш вопрос, то конечно нет. Реализуется сам элементарный (возможно ни капельки не являющийся числом) исход $\omega$ в соответствии с его мерой. А $X$ это всего лишь детерминированная функция из этого (возможно нечислового) исхода $\omega$ в (в Вашем случае) действительное число.
$X: \omega \to \mathbb{R}$
Поскольку $X$ это функция, она не может дать на выходе разные числа, имея на входе одну и ту же $\omega$.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 07:30 


31/01/23
27
mihaild в сообщении #1594279 писал(а):
Если хотите, можно например взять в качестве вероятностного пространства $\mathbb N^{[0, 1]}$, т.е. множество функций из натуральных чисел в $[0, 1]$. Алгебра на нём порождается конечномерными цилиндрами, т.е. множествами вида $\{f | f(n) \in A_n, n \in B\}$, где $B$ конечно, а все $A_n$ измеримы, и мера такого множества равна произведению мер $A_n$ (по сути равномерное распределение на бесконечномерном кубе). Тогда случайные величины можно будет определить как $X_n(f) = \sin(2\pi f(n))$. Они все независимы, а каждая распределена как Ваша $\xi$.

Я, кажется, понял! То есть, случайные величины из выборки реализуются не на том же вероятностном пространстве, а, возможно, на каком-то другом (в принципе, видимо, даже не важно на каком), главное - чтобы равнялись функции распределения $P^*(X_n < x) = P(\xi < x)$. Я правильно понимаю?
ipgmvq в сообщении #1594284 писал(а):
Поскольку $X$ это функция, она не может дать на выходе разные числа, имея на входе одну и ту же $\omega$.

Почему? Просто вектор-функция, определенная в одной точке.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 07:52 
Аватара пользователя


22/11/22
682
ElfDante в сообщении #1594271 писал(а):
В стандартных курсах математической статистики под выборкой $X = (X_1, X_2,...,X_n)$ понимаю набор независимых одинаково распределенных случайных величин. При этом набор чисел, который получен из эксперимента, понимается, как реализация этой выборки. Тут сразу встает несколько вопросов.

1) Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = (X_1 (\omega), X_2 (\omega),...,X_n (\omega))$?

Нет.
Реализацией выборки что только ни называют, но в том контексте, что у вас - это набор $(x_1,\ldots,x_n)$ значений с.в. $(X_1,\ldots,X_n)$. Есть случайный вектор - и есть его значения.
Иначе : набор $(x_1,\ldots,x_n)$ = реализации с.в. X, если это результат n независимых испытаний, где каждое значение $x_k$ есть результат k-го испытания, подчиненного тому же закону, что и X.
Пример.
Пусть бросается кубик с несмещенным центром тяжести. X - число очков, выпавших при одном бросании.
Тогда выборка объема n в одном смысле есть набор с.в. $(X_1,\ldots,X_n)$. На каждом месте стоит с.в. с тем же, что и у X, распеределением, все независимы в совокупности.
Во втором смысле, как реализация - это набор значений, "что прилетело", из 1, 2, ... 6. Например (для $n=5$), $(3,5,5,3,6)$.

Кстати, эмпирическая функция распределения спокойно определяется и с помощью первого определения, и с помощью второго. Поскольку в теореме Гливенко-Кантелли речь идет о сходимости по вероятности (последовательности с.в.), то конечно, там имеется в виду именно первое определение.

А вероятностное пространство - какое было с самого начала, то и осталось. То, на котором заданы с.в. Хотя можно от них уйти, конечно, к пространству распределений с соотв. мерой, но не особо нужно. По сути, оно и так всплывет.
ElfDante в сообщении #1594292 писал(а):
чтобы равнялись функции распределения $P^*(X_n < x) = P(\xi < x)$. Я правильно понимаю?

Тут уже я не понимаю. С чего бы им равняться?

-- 18.05.2023, 07:03 --

А, я кажется, догадываюсь, в чем проблема. Видимо, она тут:
Цитата:
Реализацией выборки что только ни называют, но в том контексте, что у вас - это набор $(x_1,\ldots,x_n)$ значений с.в. $(X_1,\ldots,X_n)$.

И судя по всему, вы считаете, что если с.в. одинаково распределены - например, как
ElfDante в сообщении #1594277 писал(а):
$\xi(\omega) = \sin(2 \pi \omega)$

то вектор состоит из одинаковых компонент.
Типа $(X_1(\omega),\ldots,X_n(\omega))=(\xi(\omega),\ldots\xi(\omega))$.

Так ничего подобного. Одинаково распределенные случайные величины - не есть совпадающие. И совпадающие - точно не могут быть независимыми. Это старая проблема: одинаковые распределения и одинаковые с.в. - очень разные вещи.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 09:39 


31/01/23
27
Combat Zone в сообщении #1594293 писал(а):
Нет.
Реализацией выборки что только ни называют, но в том контексте, что у вас - это набор $(x_1,\ldots,x_n)$ значений с.в. $(X_1,\ldots,X_n)$. Есть случайный вектор - и есть его значения.

Не очень понял, в чем разница с тем, что написал я... Я написал, что $(X_1,\ldots,X_n)$ - это вектор, а выборка - это значение вектора в некоторой точке вероятностного пространства.
Combat Zone в сообщении #1594293 писал(а):
Тут уже я не понимаю. С чего бы им равняться?

Потому что у них одинаковые функции распределения.
Combat Zone в сообщении #1594293 писал(а):
то вектор состоит из одинаковых компонент.
Типа $(X_1(\omega),\ldots,X_n(\omega))=(\xi(\omega),\ldots\xi(\omega))$.

Нет, я там привел пример, что случайная величина $\eta (\omega) = \cos (2 \pi \omega)$ одинаково распределена с $\xi$, но сама функция другая (правда, они зависимы).
Combat Zone в сообщении #1594293 писал(а):
Тогда выборка объема n в одном смысле есть набор с.в. $(X_1,\ldots,X_n)$. На каждом месте стоит с.в. с тем же, что и у X, распеределением, все независимы в совокупности.

Но из того, что написали выше, я правильно понимаю, что если, например, исходная случайная величина $X$ в примере с кубиком - это функция, принимающая значения от 1 до 6, то с.в. $X_n$, стоящие в выборке, это тоже функции, принимающие значения от 1 до 6, но, возможно, в другом порядке? И их реализация - это мы просто в каждую с.в. вставляем одинаковую омегу?
Кстати, в этом случае получается, что у нас есть всего 6! независимых функций. Что произойдет, когда они начнут повторяться? У нас же пропадет независимость.

Извините, если сильно туплю :(

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 10:39 
Заслуженный участник
Аватара пользователя


16/07/14
9219
Цюрих
ElfDante в сообщении #1594292 писал(а):
То есть, случайные величины из выборки реализуются не на том же вероятностном пространстве, а, возможно, на каком-то другом (в принципе, видимо, даже не важно на каком)
Да, так. В принципе исходное $X$ даже не обязано быть случайной величиной, достаточно распределения.
Combat Zone в сообщении #1594293 писал(а):
Пусть бросается кубик с несмещенным центром тяжести. X - число очков, выпавших при одном бросании
Если требовать максимальной строгости, то так говорить нельзя. Что вообще такое $X$ у вас получается - функция? Откуда куда?
ElfDante в сообщении #1594302 писал(а):
Но из того, что написали выше, я правильно понимаю, что если, например, исходная случайная величина $X$ в примере с кубиком - это функция, принимающая значения от 1 до 6, то с.в. $X_n$, стоящие в выборке, это тоже функции, принимающие значения от 1 до 6, но, возможно, в другом порядке?
Они ещё и на другом пространстве определены. Если мы кидаем кубик, то удобно взять пространство, в котором элементарный исход - это весь протокол бросаний. А величины, соответственно, просто последовательные его компоненты.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 10:50 
Аватара пользователя


22/11/22
682
mihaild в сообщении #1594310 писал(а):
Если требовать максимальной строгости, то так говорить нельзя. Что вообще такое $X$ у вас получается - функция? Откуда куда?

Если требовать максимальной строгости, то надо выбросить все задачники по терверу, где такого сорта формулировок - до черта.
И да, в такого сорта задачах, как правило, речь, по факту идет о распределении с.в., а не о ней самой.

... Мне кажется, глазам будет проще, если в теме станет одной нянькой меньше. Я о себе, конечно. И последний пост ТС оставлю без внимания - тут много народу, кто может его уделить.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 11:08 


31/01/23
27
mihaild в сообщении #1594310 писал(а):
Они ещё и на другом пространстве определены. Если мы кидаем кубик, то удобно взять пространство, в котором элементарный исход - это весь протокол бросаний. А величины, соответственно, просто последовательные его компоненты.

Я Вас понял. В этом же случае не возникает проблем с независимостью. Спасибо Вам большое!
Combat Zone
И Вам спасибо за мысли!

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 11:09 
Аватара пользователя


22/11/22
682
Пожалуйста. Чего от меня тут не было - так это именно мыслей.

 Профиль  
                  
 
 Re: О выборке
Сообщение18.05.2023, 14:09 


27/06/20
337
ElfDante в сообщении #1594277 писал(а):
Пусть $\Omega = [0,1]$, случайная величина $\xi(\omega) = \sin(2 \pi \omega)$,
ElfDante в сообщении #1594292 писал(а):
Почему? Просто вектор-функция, определенная в одной точке.
Это так, я просто не увидел в примерах вектор-функции. А осмысление $\Omega$ как $\left[ 0,\ 1 \right]$ для функции выдающее целое векторное пространство $X: \left[ 0,\ 1 \right] \to \mathbb{R}^n $ или $X: \left[ 0,\ 1 \right] \to \left[ -1,\ 1 \right]^n $ :| Если бы ещё это была не выборка, а вектор с зависимыми элементами...

 Профиль  
                  
 
 Re: О выборке
Сообщение22.05.2023, 12:33 
Заслуженный участник
Аватара пользователя


11/03/08
10007
Москва
ElfDante в сообщении #1594271 писал(а):
Я правильно понимаю, что реализация выборки проводится на одном и том же элементе $\omega$ из исходного вероятностного пространства, то есть $X (\omega) = (X_1 (\omega), X_2 (\omega),...,X_n (\omega))$?


Э, а с чего это один и тот же элемент, то есть исход испытания? Если бы был одна и та же омега, то были бы одни и те же иксы. Разные элементы одного и того же вероятностного пространства. Кидаем монетку, чтобы по выборке выяснить, честная ли она. Каждый бросок - новая омега.

 Профиль  
                  
 
 Re: О выборке
Сообщение22.05.2023, 12:46 
Заслуженный участник
Аватара пользователя


16/07/14
9219
Цюрих
Евгений Машеров в сообщении #1594732 писал(а):
Каждый бросок - новая омега
Как при таком подходе определяется, например, состоятельность?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 17 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group