2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 "Строгая" литература по машинному обучению.
Сообщение03.07.2018, 22:19 


22/01/13
89
Moscow
Очень часто в книгах по машинному обучению используют примерно такие вещи: $\mathbb{P}[Y = c|X]$ (условная вероятность того, что надо классифицировать как $c$, если дано, что пронаблюдали $X$) или $\mathbb{E}[Y|X]$. Что это всё означает, учитывая, что $X$ чаще всего - не-дискретная случайная величина? Почему никогда никто не пишет, на каком вероятностном пространстве всё рассматривается, не пишут про УМО, почему его можно брать и т.д.? Есть ли литература по машинному обучению, в которой всё это разжевывается (для дураков) -- в каком вероятностном пространстве работаем, по чему усредняем и т.д. и т.п., короче говоря, такая же строгая, как и обычные книги по терверу и матстатистике?

 Профиль  
                  
 
 Re: "Строгая" литература по машинному обучению.
Сообщение03.07.2018, 23:07 


10/03/16
4444
Aeroport
kirill94 в сообщении #1324239 писал(а):
Есть ли литература по машинному обучению, в которой всё это разжевывается (для дураков) -- в каком вероятностном пространстве работаем, по чему усредняем и т.д. и т.п., короче говоря, такая же строгая, как и обычные книги по терверу и матстатистике?


Нет. Почему? Потому что, во-первых, книги по ML чаще пишутся людьми весьма далекими от теоретических измышлений. Они знают на какую кнопку нажать где какое API покатит. В книжке им кажется недостаточным выдать просто набор мнемонических рецептов, и они начинают набивать текст заученными/загугленными фразами об условном матожидании, возможно при этом до конца не понимая на каком вероятностном пространстве определена совместная плотность. Во вторых, если в книжку добавить обоснование, ее объём вырастет на столько, что вы её из магазина не унесёте )

Что делать? Взять листочек и ручку, и самим всё выводить и до всего доходить. В плане понимания материала это чрезвычайно полезно.

 Профиль  
                  
 
 Re: "Строгая" литература по машинному обучению.
Сообщение04.07.2018, 00:39 


07/10/15

2400
Это всего лишь формальная запись результатов работы классификатора, или аппроксиматора.
В первом случае, на вход классификатора подаётся вектор информативных признаков классифицируемого наблюдения $X \in R^n$, а на выходе, алгоритм классификатора формирует несколько результативных переменных $\mathbb{P}[Y = a|X]$, $\mathbb{P}[Y = b|X]$, $\mathbb{P}[Y = c|X]$, каждая из них определяет вероятность принадлежности наблюдения соответствующему классу. Сравнивая их можно определить наиболее вероятный класс наблюдения и вероятность ошибки. (Это так в идеале, на практике такой классификатор построить не просто, в том смысле, что вычисляемые вероятности оказываются далёкими от действительности. Многие алгоритмы вообще не позволяют оценить вероятности, а сразу выдают ответ, например в виде бинарной переменной).

Во втором случае решается задача регрессии. На вход аппроксиматора, так же, подаётся вектор информативных признаков, а на выходе, алгоритм вычисляет прогноз $\mathbb{E}[Y|X]$. Чаще всего это именно условное мат. ожидание, так как для нормально распределённых остатков это будет ММП-оценка прогноза. В этом случае, по хорошему, желательно оценить ещё и дисперсию прогноза, но это не всегда получается.

Смысл всего этого в том, что истинный класс наблюдения неизвестен, классификатор позволяет оценить только его вероятность принадлежности к заданному классу. Так же и истинное значение объясняемой переменной $Y$ не известно. Аппроксиматор даёт лишь прогноз её значения, с некоторой точностью.

Условные вероятности рассматриваются в мат. статистике. Там прямо про них и читайте, зачем пытаться найти их где то ещё.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 3 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group