2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 задача по линейной регрессии с несколькими наборами Y
Сообщение16.07.2013, 11:29 
В условии задачи дано: набор $X_1...X_n$ и несколько наборов $Y:$ $Y_1^{(1)}...Y_n^{(1)}$, ..., $Y_1^{(m)}...Y_n^{(m)}$
(например, лекарство в дозах $X_1...X_n$ тестировали на $m=5$ пациентах).
Требуется найти коэффициенты линейной регрессии $E(Y) = a+bX$.
Я могу найти для каждого из наборов коэффициенты регрессии $a^{(1)},..., a^{(m)}, b^{(1)},..., b^{(m)}$. Получаются разные (и даже не всегда близкие) коэффициенты. И что делать дальше?
Или надо решать задачу вообще другим путем?

 
 
 
 Re: задача по линейной регрессии с несколькими наборами Y
Сообщение16.07.2013, 12:19 
Аватара пользователя
Ну, наверно, надо начинать с содержательной постановки, а потом уж прибегать к математике. Для начала - а что нужно исследовать? Различия в индивидуальных реакциях на дозу препарата? Тогда, возможно, есть смысл в построении отдельных регрессий для разных пациентов, и сравнении полученных коэффициентов.
Или реакцию на препарат вообще? Тогда набор данных у Вас один. В простейшем случае Вы вообще пренебрегаете тем, что это разные испытуемые, и строите одну модель с коэффициентами a и b. Без индексов. Возможно, модель требует учёта как дозы, так и индивидуальности пациента, и у Вас будет множественная регрессия, в которую добавлены искусственные переменные соответственно пациентам. Ещё вариант - тут не регрессионный, а дисперсионный анализ.
И вопрос не математический, а исключительно по содержательной постановке.

 
 
 
 Re: задача по линейной регрессии с несколькими наборами Y
Сообщение16.07.2013, 20:07 
Ок, уточняю постановку задачи - требуется исследовать реакцию на препарат вообще.
Я не очень понимаю, как учесть все наборы $Y$ при подсчете коэффициентов.

При одном наборе наблюдений я смотрю, в каких значениях достигает минимума функция $F(a,b)  =  \sum_{i = 1}^{n}(Y_i - (a+bX_i))$. Тогда при $m$ наблюдениях я буду искать argmin функции $F(a,b)  =  \sum_{k = 1}^m \sum_{i = 1}^{n}(Y_i^{(k)} - (a+bX_i))$, так?

 
 
 
 Re: задача по линейной регрессии с несколькими наборами Y
Сообщение16.07.2013, 21:37 
Аватара пользователя
Для начала - тупо объединить выборки по пациентам в одну.

 
 
 
 Re: задача по линейной регрессии с несколькими наборами Y
Сообщение17.07.2013, 06:47 
Аватара пользователя
Что такое $Y$ и $E(Y)$?

 
 
 
 Re: задача по линейной регрессии с несколькими наборами Y
Сообщение17.07.2013, 07:30 
karatuk в сообщении #746580 писал(а):
Тогда при $m$ наблюдениях я буду искать argmin функции $F(a,b)  =  \sum_{k = 1}^m \sum_{i = 1}^{n}(Y_i^{(k)} - (a+bX_i))$, так?

Именно так (если, конечно, добавить квадраты). Технически это сводится просто к тому, что у Вас есть набор из $nm$ отсчётов, в котором некоторые иксы совпадают; ну и пусть себе совпадают, на схеме решения это никак не сказывается.

 
 
 
 Re: задача по линейной регрессии с несколькими наборами Y
Сообщение23.07.2013, 13:41 
Спасибо всем огромное за помощь! Все, вроде, получилось.

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group