2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Аналог частной ковариации для средних значений
Сообщение21.02.2020, 19:47 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Добрый день.
Прошу прощения за очередной глупый вопрос.

Когда у нас имеются две случайные величны $X$ и $Y$, которые как-то зависят от третьей величины $I$, то можно вычислить "исправленную" ковариацию между этими величинами, частную ковариацию (честно говоря я русский термин не знаю, но по английски это partial covariance):
$\mathrm{pcov}(X,Y) = \mathrm{cov}(X,Y) - \frac{\mathrm{cov}(X,I) \cdot \mathrm{cov}(I,Y)}{\mathrm{var}(I)}$
А есть ли способ посчитать средние значения $X$ и $Y$, откуда исключена зависимость от $I$?

Пытался читать учебники по статистике, но математический язык для меня всё больше и больше напоминает китайский. Поэтому надеюсь, что кто-то может по-инженерному дать простой ответ на эту проблемку?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение21.02.2020, 22:05 


09/11/19
146
В Вашей задаче матожидания случайных величин $X$ и $Y$ зависят от $I$?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение21.02.2020, 23:01 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Да.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 10:24 


09/11/19
146
Полагаю, имеет смысл считать среднее значение $X$ только при заданных значениях $Y$ и $I$. В частности, можно рассмотреть случай, когда матожидание $I$ равно нулю и матожидание $Y$ тоже чему-то равно. Возможно, это Вам и нужно.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 15:32 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
igor_ivanov в сообщении #1440819 писал(а):
Возможно, это Вам и нужно.

Нет, это, очевидно, не то, что мне нужно.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 16:19 
Заслуженный участник


14/10/14
1220
Может быть, вам нужно условное математическое ожидание $\mathrm E(X|I)$? Это случайная величина. В крайних случаях она ведёт себя следующим образом: она равна $X$, если $X$ есть детерминированная (то есть неслучайная) функция $I$, и равна $\mathrm E(X)$, если $X$ и $I$ независимы.

-- 22.02.2020, 17:41 --

Или, может быть, вам нужна случайная величина $\widehat X(I)=\mathrm E(X)+\dfrac{\mathrm{cov}(X,I)}{\mathrm{var}(I)}(I-\mathrm E(I))$.
С такими обозначениями $\mathrm{pcov}(X,Y|I)=\mathrm{E}\left((X-\widehat X(I))(Y-\widehat Y(I))\right)$.

-- 22.02.2020, 18:13 --

Смысл в этом такой: $E(X|I)$ -- это случайная величина, которая лучше всех приближает $X$ среди детерминированных функций случайной величины $I$. А $\widehat X(I)$ -- это случайная величина, которая лучше всех приближает $X$ среди детерминированных линейных функций от $I$.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 18:36 


09/11/19
146
Slav-27

Правильно ли я понимаю, что $E(X)$ и $E(I)$ – выборочные средние, $cov(X, I)$ – выборочный коэффициент ковариации, $var(I)$ – выборочная дисперсия?

И ещё два вопроса. Формула для $\widehat X(I)$ выписана из условия, что величина $X$ зависит от $I$, но не зависит от $Y$? В каком учебнике можно посмотреть вывод этой формулы и примеры её использования?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 18:57 
Заслуженный участник


27/04/09
28128
igor_ivanov в сообщении #1440884 писал(а):
Правильно ли я понимаю, что $E(X)$ и $E(I)$ – выборочные средние, $cov(X, I)$ – выборочный коэффициент ковариации, $var(I)$ – выборочная дисперсия?
Зачем выборочные, обычные сойдут, теоретико-вероятностные. И ТС изначально говорит «случайные величины», то есть не задано никаких выборок, чтобы было от чего считать выборочные величины.

А с зависимостью $X$ от $Y$ видимо madschumacher не очень удачно составил вопрос: он привёл в пример ковариацию, которая (обычная) требует двух величин для своего определения, но матожидание-то (обычное) требует одну. Потом в дело входит $I$, но $Y$ от этого в рассмотрении матожидания не появится.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 19:37 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Согласна со Slav-27, только поскольку ковариация не зависит от сдвигов, можно взять проще:
$${\tilde X}=X-\dfrac{\mathrm{cov}(X,I)}{\mathrm{var}(I)}I,\quad
{\tilde Y}=Y-\dfrac{\mathrm{cov}(Y,I)}{\mathrm{var}(I)}I$$

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 20:19 


09/11/19
146
arseniiv в сообщении #1440888 писал(а):
Зачем выборочные, обычные сойдут, теоретико-вероятностные... Потом в дело входит $I$, но $Y$ от этого в рассмотрении матожидания не появится.

Получается, что $E(X)$ и $E(I)$ – матожидания, $cov(X, I)$ – теоретическая ковариация, $var(I)$ – генеральная дисперсия, а $X$ зависит только от $I$?

А если теоретико-вероятностные величины неизвестны, а известны их оценки (выборочные средние и т.п.), как тогда рассчитать величину $\widehat X(I)$?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 21:41 
Заслуженный участник


27/04/09
28128
igor_ivanov в сообщении #1440897 писал(а):
а $X$ зависит только от $I$?
По-моему, не важно даже чтобы $X$ зависела от $I$, и наоборот нет никакого значение, с какими-ещё величинами $X$ не независима — раз они не появляются нигде.

igor_ivanov в сообщении #1440897 писал(а):
А если теоретико-вероятностные величины неизвестны, а известны их оценки (выборочные средние и т.п.), как тогда рассчитать величину $\widehat X(I)$?
Ну это по идее отдельный вопрос, которого ТС не спрашивал. Вообще же с одной стороны задача простая, с другой сложная. Например нужна ли нам обязательно несмещённая оценка (ср. несмещённую выборочную дисперсию против обычной — и это уже в простом случае дисперсии). С другой стороны если просто заменить все матожидания и дисперсии выборочными аналогами, может вполне получиться то что надо и в сложном случае (но может быть может получиться и ерунда — я в теорвере не разбираюсь на должном уровне). Вот сейчас вам люди разбирающиеся скажут.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение23.02.2020, 09:31 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
alisa-lebovski в сообщении #1440893 писал(а):
можно взять проще:
$${\tilde X}=X-\dfrac{\mathrm{cov}(X,I)}{\mathrm{var}(I)}I,\quad
{\tilde Y}=Y-\dfrac{\mathrm{cov}(Y,I)}{\mathrm{var}(I)}I$$

Спасибо большое, Slav-27, alisa-lebovski - - это, по ходу, именно то, что я искал.
В связи с этим у меня два уточняющих вопроса:
1. Получается, что pcov работает только для линейной зависимости от $X(I), Y(I) $? Просто в физической литературе эта конструкция представляется как панацея от всего возможного.
2. Есть ли какое-то название у этого выражения для исправленной величины, и куда можно на него сослаться?
Ещё раз спасибо!

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение23.02.2020, 14:40 
Заслуженный участник
Аватара пользователя


11/03/08
10043
Москва
Ковариация связана с регрессией. А регрессия есть условное математическое ожидание. То есть если мы изучаем ковариации или корреляции двух величин, то неявно работаем с их условными матожиданиями. Ну, а если строим частные ковариации/корреляции - то нас интересует влияние одной величины на условное матожидание другой при том, что зафиксировано значение третьей. Если же просто говорим о матожидании - то исследуемая величина существует сама по себе, безотносительно второй и третьей.
То есть мне постановка задачи представляется бессмысленной. А осмысленная постановка могла бы выглядеть, скажем, так:
Есть величина Y, матожидание которой интересует, и есть основания полагать, что оно зависит от измеряемой нами величины X. Это задача построения регрессии. Но тут появляется ещё и величина I, влияющая как на Y, так и на X. И нам хочется определить влияние той части изменения X, которая не зависит от I. Мы строим регрессии Y на I и X на I, отыскиваем остатки от регрессии, и уже между ними корреляции/ковариации. Применительно к задаче построения оценки матожидания у нас будет регрессия остатка игреков на остаток иксов. Она покажет нам завимость необъяснимой через I части Y от таковой же части X Для известного I и X можно найти оценку необъяснённой через I части X, подставить в полученное уравнение, получить оценку аналогичной части Y, а затем прибавить её к оценке Y через I.
Нужно ли это? Не знаю, если бы меня интересовал прогноз Y по известным X,I - я бы использовал множественную регрессию.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение23.02.2020, 20:44 
Заслуженный участник


14/10/14
1220
madschumacher в сообщении #1440996 писал(а):
2. Есть ли какое-то название у этого выражения для исправленной величины, и куда можно на него сослаться?
Ещё раз спасибо!
$\widehat X(I)$ -- оптимальный линейный прогноз (optimal linear predictor, best linear predictor). Когда его используют, говорят, что применяется модель линейной регрессии (насчёт терминологии я не очень уверен и куда сослаться, не знаю).

madschumacher в сообщении #1440996 писал(а):
1. Получается, что pcov работает только для линейной зависимости от $X(I), Y(I) $? Просто в физической литературе эта конструкция представляется как панацея от всего возможного.
$X$ и $Y$ могут быть 1) условно независимы относительно $I$, 2) иметь нулевую условную корреляцию относительно $I$, 3) иметь нулевую частичную корреляцию относительно $I$. Отношения между этими условиями такие: 1 влечёт 2, а остальные 5 импликаций могут быть неверны (в частности, может быть даже, что $X$ и $Y$ условно независимы относительно $I$, а их частичная корреляция всё-таки ненулевая). Проблема с частичной корреляцией в том, что она рассчитывается через оптимальный линейный прогноз -- но никто не гарантирует, что линейный прогноз будет хорошим, на самом деле он может быть плохим. Однако ж в некоторых случаях он обязательно хороший; например, если откуда-то известно, что совместное распределение $X,Y,I$ нормально, то 1, 2 и 3 равносильны.

С условной корреляцией такой проблемы нет, потому что она считается через настоящий (необязательно линейный) оптимальный прогноз (то есть условное математическое ожидание). Но считать её сложнее.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение24.02.2020, 23:23 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Slav-27, спасибо большое, Вы мне очень помогли.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 15 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: talash


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group