2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Random forest classification
Сообщение16.01.2019, 19:58 
Всем привет!
В общем мне необходимо изучить classification random forest.
Вроде бы по методу частично понятно. А как быть с данными. Они должны быть изначально разбиты на классы, или на классы разбиваются самостоятельно? Тогда по какому алгоритму? И какое количество классов оптимально? А если брать данные уже разбитые, где их можно взять?

 
 
 
 Re: Random forest classification
Сообщение16.01.2019, 21:07 
Данные не разбиваются на классы, а объекты размечаются (каждый объект соотносится к определенному классу). Для методов классификации и регрессии требуются размеченные данные.

Кажется вы просто не прочитали первый параграф учебника по машинному обучению. Буквально 2 страницы. Сначала прочитайте, потом возвращайтесь с вопросами.

Где взять размеченные данные - вопрос, мне кажется, простой: либо разметить самостоятельно, либо отдать в аутсорсинг, можно применить краудфайндинг, можно найти готовые размеченные данные в открытом доступе, например, на kaggle.com.

 
 
 
 Re: Random forest classification
Сообщение17.01.2019, 01:23 
Если задача стоит изучить, то далеко ходить думаю не стоит.
Начните с встроенных дата сетов, например:
Код:
from sklearn.datasets import load_iris

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group