Я не очень уверен. Поисковики работают не семантически, для них в
дочь генерала -- "
генер-ал-а" суть глагол прошедшего времени женского роду. Вероятно, "
дочь" любит/может "
генерать".
Приемлемость подобных фишек зависит от точки зрения. Для поисковика это приемлемо, теория состоит в том, что следует искать все потенциальные словоформы словоформ запроса. Поэтому поисковик строит множество всех нормализаций слов запроса и ищет любую из них. (С точки зрения поисковика, нельзя различить существительное
горе и глагол
гореть по словоформе
горя - существительное или деепричастие? и следует искать оба)
Я как-то любопытсва ради (тестировал характеристики деревьев поиска) считал словоформы в King James Bible (текст XVII века, коли не ошибаюсь). Там - нетрадиционные для современного англицкого местоимения, глагольные формы третьего лица типа "
doeth", "
hath", et cetera. Словарь-то (с лингвистическими пометами) откуда взять - под рукой не было (wordnet тогда не был публично доступен). Я пошел путем наименьшего сопротивления -- если словоформа есть без окончания, то словоформа с окончанием рассматривается как видоизменение первой словоформы. Нарисовал набор правил (типа
-fe ->
-ives [wife -> wives]). И стал смотреть. И обнаружил глагол
you ! (эта словоформа, очевидно, встречается, и встречается словоформа
youth -- применяем глагольное окончание). Очевидно, что для моих целей такая неразборчивость была непремлема.
Нетривиальность этой темы подчеркивают "проверяльщики" орфографии (для меня, по крайней мере, подчеркивают). В англицком, с его зачаточым словоизменением эта проблема, казалось бы, проста. И действительно, пока слово из словаря, все в порядке. Но если мы не дай Бог добавим свое слово - мы должны добавлять все словоформы скучно и муторно.
~~~
Похоже, для части лингвистов сейчас разработка подобных алгорифмов (хороших, разумеется) -- насущный хлеб, и, при заключении договора на разработку (тем, кому нужна проверка орфографии) они соглашаются на конфиденциальность. Я видел очень нетривиальные и очень непростые алгорифмы переноса (по секрету, разумеется -- с обещанием не использовать). Жаль, я ничего не слышал об аналоге WordNet для русского языка.