2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Посоветуйте русскоязычные сайты/книги по DataMining.
Сообщение22.11.2015, 23:21 
Можно и англоязычные, но лучше русскоязычные.

И ещё: слышал, что имеются алгоритмы классификации с числом параметров большим, чем число образцов. Где про такие почитать?

 
 
 
 Re: Посоветуйте русскоязычные сайты/книги по DataMining.
Сообщение23.11.2015, 00:37 
Поискать можно для указанного случая
* Случайные леса
* Регуляризация

Ну и там
* python Data Mining
* r Data Mining
Есть руководства и ссылки на примеры и софт

 
 
 
 Re: Посоветуйте русскоязычные сайты/книги по DataMining.
Сообщение23.11.2015, 10:28 
Прочёл вашу ссылку. Как находят признак разделения на узле: только подбором гиперплоскостей?
Цитата:
На первой итерации мы строим все возможные (в дискретном смысле) гиперплоскости, которые разбивали бы наше пространство на два. Для каждого такого разбиения пространства считается количество наблюдений в каждом из подпространств разных классов. В результате выбирается такое разбиение, которое максимально выделило в одном из подпространств наблюдения одного из классов. Соответственно, это разбиение будет нашим корнем дерева принятия решений, а листами на данной итерации будет два разбиения.
На следующих итерациях мы берем один худший (в смысле отношения количества наблюдений разных классов) лист и проводим ту же операцию по разбиению его. В результате этот лист становится узлом с каким-то разбиением, и двумя листами.


Есть ли другой способ получения признаков, кроме гиперплоскостей?

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group