Но компьютеру-то для синтаксического разбора предложения даются без указания того, какой смысл вкладывается в каждое из слов?!
Эта проблема называется
разрешение лексической многозначности. Кроме неё, придётся разрешать и
синтаксическую многозначность. Вот тут эти вещи описаны в картинках:
Л.Л. Иомдин Уроки машинного перевода для детей и взрослых. // Лингвистика для всех. Зимняя лингвистическая школа-2004Цитата:
Какие основания есть для того, чтобы начинать именно с синтаксиса? Мне интересны Ваши аргументы/мысли по этому поводу и я уверен, что они у Вас есть.
Понятно, что в полноценной системе должны быть и морфология (словоизменение/словообразование), и синтаксис (модели управления, правила
трансформации) и семантика (онтология, база знаний, правила разрешения неоднозначностей анализа/синтеза). К тому же все три уровня достаточно переплетены друг с другом. Разница в том, что технологии морфологических словарей и баз знаний уже относительно хорошо разработаны и опробованы на практике, а вот пригодность тех или иных синтаксических формализмов не так очевидна. Да и оценка этой пригодности часто требует определённой подготовки.
Цитата:
Могу ошибаться, но вроде бы слышал, что чисто комбинаторная оценка соответствует тому, что количество комбинаций слов, которые ребёнок должен услышать, чтобы научиться (на основе этого прослушивания) правильно их соединять такова, что он должен был бы в течении 30 лет постоянно слушать эти комбинации. (30 наобум ставлю, не помню точно, но она немаленькая). И что естественный механизм, по-видимому, другой.
Конечно, он ведь не в сферическом вакууме эти слова слушает. Он их параллельно соотносит с сигналами других органов чувств. Семантика многих понятий ("мама/папа", "сидеть/лежать", "горячо/холодно" и т.д.) завязана на эти чувства. А когда ребёнок осваивает морфологию и синтаксис, он старается проговаривать каждое своё действие ("я игрушку беру"), с тем чтобы знающие товарищи поправили, если что не так с грамматикой. Кроме того, не исключено, что наиболее
общие черты языка заложены в младенца изначально (коэволюция мозга и языка), и ему остаётся лишь подкрутить некоторые параметры своей
универсальной грамматики для конкретного родного языка. Как-то так.
Компьютерная семантика, конечно, ущербна в том смысле, что в ней понятия не наполнены "чувственным" смыслом, а обретают существование лишь за счёт связей с другими понятиями. То, что человек чувствует "мозжечком", пока что придётся выражать аналитически.