2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему На страницу Пред.  1 ... 10, 11, 12, 13, 14
 
 Re: Линейная регрессия
Сообщение13.02.2014, 20:32 
Заблокирован


30/12/13

254
ИСН
Речь идет о гладкой функции. Я недаром оценку сделал 50 - она реальна с точки зрения интуиции (построил в крупном масштабе точки и провел оптимальную, эстетически приятную кривую). В подобных упражнениях редко ошибаюсь, так как опыт-с.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение13.02.2014, 21:44 
Заблокирован


30/12/13

254
Я решу успешно задачу, если удастся найти простую формулу для такого:

Изображение

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 01:25 
Аватара пользователя


21/01/09
3926
Дивногорск
tatkuz1990 в сообщении #825954 писал(а):
Просто требуется искать, искать и искать оптимальную структуру аппроксимирующего выражения.

Ну пусть даже найдёте. Это будет функцией распределения конкретной выборки. А она нам не интересна, мы её уже получили и очень точно в табличном виде. Возьмёте другую выборку у вас всё поменяется и параметры и вид функции. А какое распределение у генеральной совокупности вы так и не сможете сказать. А ведь выборочное исследование в этом и заключается.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 01:42 
Заблокирован


30/12/13

254
Александрович, Вы говорите о глобальной задаче статистических исследований. Я же решаю локальную задачу: допустим, нам позарез нужно найти в явном виде функцию плотности вероятности.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 02:06 
Аватара пользователя


21/01/09
3926
Дивногорск
Она логнормальная. Найти функцию значить определить ее параметры.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 09:03 
Заслуженный участник
Аватара пользователя


18/05/06
13438
с Территории
Так и у меня речь идёт о гладкой функции. Можно взять столько же параметров, сколько точек, и получить гладкую функцию с отклонением 0.000.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 09:15 
Аватара пользователя


21/01/09
3926
Дивногорск
Поэтому стремятся не к минимуму суммы отклонений, а к минимуму остаточной дисперсии.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 13:57 


07/03/11
690

(Оффтоп)

Можно глупый вопрос к знатокам?
Пусть у нас есть выборка $X=(X_1, X_2, \ldots ,X_n)$. Мы разбиваем её на $m$ подвыборок (например, на две: четные и нечетные номера) и оцениваем параметры каждой отдельно. В зависимости от корреляции параметров с параметрами из других групп, присваиваем каждой группе вес. В качестве истинного значения параметров выбираем среднее взвешенное.
Такой подход имеет смысл или оценки получатся плохими?

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 14:09 
Аватара пользователя


21/01/09
3926
Дивногорск
vlad_light в сообщении #826304 писал(а):
Пусть у нас есть выборка $X=(X_1, X_2, \ldots ,X_n)$. Мы разбиваем её на $m$ подвыборок (например, на две: четные и нечетные номера) и оцениваем параметры каждой отдельно. В зависимости от корреляции параметров с параметрами из других групп, присваиваем каждой группе вес.

О какой корреляции вы говорите?

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 15:24 


07/03/11
690
Пусть мы разбили выборку на $m$ подвыборок: $X=\bigsqcup _i X^{(i)}$. Предполагаем, что выборка подчиняется закону $f_\theta (i)\approx X_i$, где $\theta $ -- параметры функции $f$, которые мы хотим оценить. Пусть также мы выбрали способ оценивания: $\hat \theta =g(X)$. Построим оценку по каждой подвыборке: $\hat \theta ^{(i)}=g(X^{(i)})$ и получим вектор $(\hat \theta ^{(1)}, \hat \theta ^{(2)}, \ldots ,\hat \theta ^{(m)})$.

(Оффтоп)

Под корреляцией я подразумевал: $$\hat \theta ^{cor}=(\sum _{j \neq 1}|cov(\hat \theta ^{(1)}, \hat \theta ^{(j)})|, \sum _{j\neq 2}|cov(\hat \theta ^{(2)}, \hat \theta ^{(j)})|, \ldots ,\sum _{j\neq m} |cov(\hat \theta ^{(m)}, \hat \theta ^{(j)})|)$$но сейчас подумал, что это неправильно.
Считаем отклонения:$$\hat \theta ^{dist}=(\sum _{j\neq 1}\|\hat \theta ^{(1)} - \hat \theta ^{(j)}\|, \sum _{j\neq 2}\|\hat \theta ^{(2)} - \hat \theta ^{(j)}\|, \ldots ,\sum _{j\neq m}\|\hat \theta ^{(m)} - \hat \theta ^{(j)}\|)$$Далее получаем веса из $w=\frac {inv(\hat \theta ^{dist})}{\|\hat \theta ^{dist}\|}$ и считаем $\hat \theta =\sum _i\hat\theta ^{(i)}w_i$.

(Оффтоп)

Писал на интуитивном уровне, сильно не бейте :oops: Ход мыслей был таким: если выборка подчиняется какому-то закону, то и каждая её подвыборка должна подчиняться ему же. Дробим выборку на маленькие кусочки и приоритет в общей оценке отдаем тем параметрам, которые мало отличаются от аналогичных в других подвыборках.

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 15:42 
Аватара пользователя


21/01/09
3926
Дивногорск
Если выборку разделили на две, что с чем коррелирует?

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение14.02.2014, 15:45 


07/03/11
690

(Оффтоп)

Александрович в сообщении #826349 писал(а):
Если выборку разделили на две, что с чем коррелирует?

$\hat \theta ^{cor } = (|cov(\hat \theta ^{(1)}, \hat \theta ^{(2)})|, |cov(\hat \theta ^{(2)}, \hat \theta ^{(1)})|)$. Но я уже не уверен в "разумности" корреляции.
Что по оценке с нормой скажите?

 Профиль  
                  
 
 Re: Линейная регрессия
Сообщение15.02.2014, 14:52 
Заслуженный участник
Аватара пользователя


11/03/08
9983
Москва
Для оценки параметров нормального распределения заведомо хуже, полагаю, для любых однородных выборок это будет так же. Однако некий смысл есть, если существуют подозрения на неоднородность. Разумеется, на подвыборки делить надо не механически и не случайно, а сообразно их происхождению. Скажем, объединяются данные из разных лабораторий, и подвыборка определяется тем, из какой лаборатории.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 208 ]  На страницу Пред.  1 ... 10, 11, 12, 13, 14

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group