2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Аналог частной ковариации для средних значений
Сообщение21.02.2020, 19:47 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Добрый день.
Прошу прощения за очередной глупый вопрос.

Когда у нас имеются две случайные величны $X$ и $Y$, которые как-то зависят от третьей величины $I$, то можно вычислить "исправленную" ковариацию между этими величинами, частную ковариацию (честно говоря я русский термин не знаю, но по английски это partial covariance):
$\mathrm{pcov}(X,Y) = \mathrm{cov}(X,Y) - \frac{\mathrm{cov}(X,I) \cdot \mathrm{cov}(I,Y)}{\mathrm{var}(I)}$
А есть ли способ посчитать средние значения $X$ и $Y$, откуда исключена зависимость от $I$?

Пытался читать учебники по статистике, но математический язык для меня всё больше и больше напоминает китайский. Поэтому надеюсь, что кто-то может по-инженерному дать простой ответ на эту проблемку?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение21.02.2020, 22:05 


09/11/19
146
В Вашей задаче матожидания случайных величин $X$ и $Y$ зависят от $I$?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение21.02.2020, 23:01 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Да.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 10:24 


09/11/19
146
Полагаю, имеет смысл считать среднее значение $X$ только при заданных значениях $Y$ и $I$. В частности, можно рассмотреть случай, когда матожидание $I$ равно нулю и матожидание $Y$ тоже чему-то равно. Возможно, это Вам и нужно.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 15:32 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
igor_ivanov в сообщении #1440819 писал(а):
Возможно, это Вам и нужно.

Нет, это, очевидно, не то, что мне нужно.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 16:19 
Заслуженный участник


14/10/14
1220
Может быть, вам нужно условное математическое ожидание $\mathrm E(X|I)$? Это случайная величина. В крайних случаях она ведёт себя следующим образом: она равна $X$, если $X$ есть детерминированная (то есть неслучайная) функция $I$, и равна $\mathrm E(X)$, если $X$ и $I$ независимы.

-- 22.02.2020, 17:41 --

Или, может быть, вам нужна случайная величина $\widehat X(I)=\mathrm E(X)+\dfrac{\mathrm{cov}(X,I)}{\mathrm{var}(I)}(I-\mathrm E(I))$.
С такими обозначениями $\mathrm{pcov}(X,Y|I)=\mathrm{E}\left((X-\widehat X(I))(Y-\widehat Y(I))\right)$.

-- 22.02.2020, 18:13 --

Смысл в этом такой: $E(X|I)$ -- это случайная величина, которая лучше всех приближает $X$ среди детерминированных функций случайной величины $I$. А $\widehat X(I)$ -- это случайная величина, которая лучше всех приближает $X$ среди детерминированных линейных функций от $I$.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 18:36 


09/11/19
146
Slav-27

Правильно ли я понимаю, что $E(X)$ и $E(I)$ – выборочные средние, $cov(X, I)$ – выборочный коэффициент ковариации, $var(I)$ – выборочная дисперсия?

И ещё два вопроса. Формула для $\widehat X(I)$ выписана из условия, что величина $X$ зависит от $I$, но не зависит от $Y$? В каком учебнике можно посмотреть вывод этой формулы и примеры её использования?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 18:57 
Заслуженный участник


27/04/09
28128
igor_ivanov в сообщении #1440884 писал(а):
Правильно ли я понимаю, что $E(X)$ и $E(I)$ – выборочные средние, $cov(X, I)$ – выборочный коэффициент ковариации, $var(I)$ – выборочная дисперсия?
Зачем выборочные, обычные сойдут, теоретико-вероятностные. И ТС изначально говорит «случайные величины», то есть не задано никаких выборок, чтобы было от чего считать выборочные величины.

А с зависимостью $X$ от $Y$ видимо madschumacher не очень удачно составил вопрос: он привёл в пример ковариацию, которая (обычная) требует двух величин для своего определения, но матожидание-то (обычное) требует одну. Потом в дело входит $I$, но $Y$ от этого в рассмотрении матожидания не появится.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 19:37 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Согласна со Slav-27, только поскольку ковариация не зависит от сдвигов, можно взять проще:
$${\tilde X}=X-\dfrac{\mathrm{cov}(X,I)}{\mathrm{var}(I)}I,\quad
{\tilde Y}=Y-\dfrac{\mathrm{cov}(Y,I)}{\mathrm{var}(I)}I$$

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 20:19 


09/11/19
146
arseniiv в сообщении #1440888 писал(а):
Зачем выборочные, обычные сойдут, теоретико-вероятностные... Потом в дело входит $I$, но $Y$ от этого в рассмотрении матожидания не появится.

Получается, что $E(X)$ и $E(I)$ – матожидания, $cov(X, I)$ – теоретическая ковариация, $var(I)$ – генеральная дисперсия, а $X$ зависит только от $I$?

А если теоретико-вероятностные величины неизвестны, а известны их оценки (выборочные средние и т.п.), как тогда рассчитать величину $\widehat X(I)$?

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение22.02.2020, 21:41 
Заслуженный участник


27/04/09
28128
igor_ivanov в сообщении #1440897 писал(а):
а $X$ зависит только от $I$?
По-моему, не важно даже чтобы $X$ зависела от $I$, и наоборот нет никакого значение, с какими-ещё величинами $X$ не независима — раз они не появляются нигде.

igor_ivanov в сообщении #1440897 писал(а):
А если теоретико-вероятностные величины неизвестны, а известны их оценки (выборочные средние и т.п.), как тогда рассчитать величину $\widehat X(I)$?
Ну это по идее отдельный вопрос, которого ТС не спрашивал. Вообще же с одной стороны задача простая, с другой сложная. Например нужна ли нам обязательно несмещённая оценка (ср. несмещённую выборочную дисперсию против обычной — и это уже в простом случае дисперсии). С другой стороны если просто заменить все матожидания и дисперсии выборочными аналогами, может вполне получиться то что надо и в сложном случае (но может быть может получиться и ерунда — я в теорвере не разбираюсь на должном уровне). Вот сейчас вам люди разбирающиеся скажут.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение23.02.2020, 09:31 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
alisa-lebovski в сообщении #1440893 писал(а):
можно взять проще:
$${\tilde X}=X-\dfrac{\mathrm{cov}(X,I)}{\mathrm{var}(I)}I,\quad
{\tilde Y}=Y-\dfrac{\mathrm{cov}(Y,I)}{\mathrm{var}(I)}I$$

Спасибо большое, Slav-27, alisa-lebovski - - это, по ходу, именно то, что я искал.
В связи с этим у меня два уточняющих вопроса:
1. Получается, что pcov работает только для линейной зависимости от $X(I), Y(I) $? Просто в физической литературе эта конструкция представляется как панацея от всего возможного.
2. Есть ли какое-то название у этого выражения для исправленной величины, и куда можно на него сослаться?
Ещё раз спасибо!

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение23.02.2020, 14:40 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Ковариация связана с регрессией. А регрессия есть условное математическое ожидание. То есть если мы изучаем ковариации или корреляции двух величин, то неявно работаем с их условными матожиданиями. Ну, а если строим частные ковариации/корреляции - то нас интересует влияние одной величины на условное матожидание другой при том, что зафиксировано значение третьей. Если же просто говорим о матожидании - то исследуемая величина существует сама по себе, безотносительно второй и третьей.
То есть мне постановка задачи представляется бессмысленной. А осмысленная постановка могла бы выглядеть, скажем, так:
Есть величина Y, матожидание которой интересует, и есть основания полагать, что оно зависит от измеряемой нами величины X. Это задача построения регрессии. Но тут появляется ещё и величина I, влияющая как на Y, так и на X. И нам хочется определить влияние той части изменения X, которая не зависит от I. Мы строим регрессии Y на I и X на I, отыскиваем остатки от регрессии, и уже между ними корреляции/ковариации. Применительно к задаче построения оценки матожидания у нас будет регрессия остатка игреков на остаток иксов. Она покажет нам завимость необъяснимой через I части Y от таковой же части X Для известного I и X можно найти оценку необъяснённой через I части X, подставить в полученное уравнение, получить оценку аналогичной части Y, а затем прибавить её к оценке Y через I.
Нужно ли это? Не знаю, если бы меня интересовал прогноз Y по известным X,I - я бы использовал множественную регрессию.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение23.02.2020, 20:44 
Заслуженный участник


14/10/14
1220
madschumacher в сообщении #1440996 писал(а):
2. Есть ли какое-то название у этого выражения для исправленной величины, и куда можно на него сослаться?
Ещё раз спасибо!
$\widehat X(I)$ -- оптимальный линейный прогноз (optimal linear predictor, best linear predictor). Когда его используют, говорят, что применяется модель линейной регрессии (насчёт терминологии я не очень уверен и куда сослаться, не знаю).

madschumacher в сообщении #1440996 писал(а):
1. Получается, что pcov работает только для линейной зависимости от $X(I), Y(I) $? Просто в физической литературе эта конструкция представляется как панацея от всего возможного.
$X$ и $Y$ могут быть 1) условно независимы относительно $I$, 2) иметь нулевую условную корреляцию относительно $I$, 3) иметь нулевую частичную корреляцию относительно $I$. Отношения между этими условиями такие: 1 влечёт 2, а остальные 5 импликаций могут быть неверны (в частности, может быть даже, что $X$ и $Y$ условно независимы относительно $I$, а их частичная корреляция всё-таки ненулевая). Проблема с частичной корреляцией в том, что она рассчитывается через оптимальный линейный прогноз -- но никто не гарантирует, что линейный прогноз будет хорошим, на самом деле он может быть плохим. Однако ж в некоторых случаях он обязательно хороший; например, если откуда-то известно, что совместное распределение $X,Y,I$ нормально, то 1, 2 и 3 равносильны.

С условной корреляцией такой проблемы нет, потому что она считается через настоящий (необязательно линейный) оптимальный прогноз (то есть условное математическое ожидание). Но считать её сложнее.

 Профиль  
                  
 
 Re: Аналог частной ковариации для средних значений
Сообщение24.02.2020, 23:23 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Slav-27, спасибо большое, Вы мне очень помогли.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 15 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group