см. здесь - задача по тестам для 8-го грейда
https://www.kaggle.com/c/the-allen-ai-science-challengeконкурс состоял в том, чтобы создать программу, выбирающую один из 4-х вариантов ответов на (текстовый) вопрос.
Если случайный выбор, то вероятность будет 0.25. Если все ответы правильные, то будет 1
Был достигнут уровень 0.59308:
https://www.kaggle.com/c/the-allen-ai-s ... eaderboardПоэтому, ответ, да, эффективное использование неструктурированной информации "переменной длины" вполне возможно уже сегодня.
Но для погружения в тему потребуется сильно напрячься.
По тому же конкурсу, в разделе обсуждений есть и готовые решения, и обсуждения, и множество ссылок на полезные ресурсы.
Например, здесь тема со ссылками на внешние репозитории (Wiki, толковые словари, и т.д.).
https://www.kaggle.com/c/the-allen-ai-s ... sion/16877Оттуда же множества ссылок, в том числе, припоминаю, на майкрософт, где они описывают использование толковых словарей для поиска.