| Здарвствуйте , я работаю в компании , занимающейся продажей брендовых вещей.У меня появилась проблема , связанная с кластеризацией поисковых запросов пользователей.
 Мне дали выборку из 60 тыс. строк (где пользователий чаще всего искали бренд или наименование товара ) сказали провести кластеризацию по следующим группам:
 бренд/товар/бренд-товар/наличием ключевых слова ( например купить) + указать правильное название бренда.
 Подскажите пожалуйста , какой алгоритм может подходить для решения данной проблемы (сам я работаю в R) склоняюсь к тому , что это будет алгоритим машинного обучения.
 В принципе имеются списке брендов магазина и список товаров , однако выборка содержит большое количество неточностей + поисковый запрос может быть представлен длинной фразой.
 
 Заранее спасибо.
 
 |