Здарвствуйте , я работаю в компании , занимающейся продажей брендовых вещей. У меня появилась проблема , связанная с кластеризацией поисковых запросов пользователей. Мне дали выборку из 60 тыс. строк (где пользователий чаще всего искали бренд или наименование товара ) сказали провести кластеризацию по следующим группам: бренд/товар/бренд-товар/наличием ключевых слова ( например купить) + указать правильное название бренда. Подскажите пожалуйста , какой алгоритм может подходить для решения данной проблемы (сам я работаю в R) склоняюсь к тому , что это будет алгоритим машинного обучения. В принципе имеются списке брендов магазина и список товаров , однако выборка содержит большое количество неточностей + поисковый запрос может быть представлен длинной фразой.
Заранее спасибо.
|