2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Что можно придумать на неструктурированных данных?
Сообщение03.02.2017, 22:01 
Подскажите пожалуйста, а строятся ли модели прогнозирования на основе неструктурированных данных (данные с переменной длиной и структурой сообщений, когда записи имеет разную длину, разный текст)?
Что можно придумать, почитать?

 
 
 
 Re: Что можно придумать на неструктурированных данных?
Сообщение03.02.2017, 23:37 
Аватара пользователя
Да хоть персональные рекламные предложения гугла

 
 
 
 Re: Что можно придумать на неструктурированных данных?
Сообщение04.02.2017, 00:57 
см. здесь - задача по тестам для 8-го грейда
https://www.kaggle.com/c/the-allen-ai-science-challenge

конкурс состоял в том, чтобы создать программу, выбирающую один из 4-х вариантов ответов на (текстовый) вопрос.

Если случайный выбор, то вероятность будет 0.25. Если все ответы правильные, то будет 1
Был достигнут уровень 0.59308:
https://www.kaggle.com/c/the-allen-ai-s ... eaderboard
Поэтому, ответ, да, эффективное использование неструктурированной информации "переменной длины" вполне возможно уже сегодня.

Но для погружения в тему потребуется сильно напрячься.

По тому же конкурсу, в разделе обсуждений есть и готовые решения, и обсуждения, и множество ссылок на полезные ресурсы.
Например, здесь тема со ссылками на внешние репозитории (Wiki, толковые словари, и т.д.).
https://www.kaggle.com/c/the-allen-ai-s ... sion/16877
Оттуда же множества ссылок, в том числе, припоминаю, на майкрософт, где они описывают использование толковых словарей для поиска.

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group