Как мы понимаем язык и используем его в речиЯзык как инстинкт / Как мы понимаем язык и используем его в речиСтраница 18
The evidence examined by the lawyer turned out to be unreliable ‘Показания, выяснил адвокат, не вызывают доверия’.
Если обманок помогает избежать здравый смысл, то с этим предложением дела должны обстоять гораздо проще. Показания, в отличие от подзащитных, не могут сами ничего выяснять, поэтому потенциально можно избежать появления неверного дерева, где показания стали бы что-либо выяснять. И люди действительно обходятся без него: глаза испытуемых пробегали по предложению лишь с небольшими задержками и возвратами назад. Конечно, задействованное знание достаточно примитивно (подзащитные могут что-то выяснить, а показания — нет), а соответствующее ему дерево было очень легко найти по сравнению с десятками деревьев, которые может найти компьютер. Поэтому никто не знает, какой именно объем общих знаний человека задействуется в процессе понимания предложений в режиме реального времени; это широкое поле для исследований.
Сами слова тоже могут указать, как нужно производить анализ. Вспомните о том, что каждый глагол предъявляет требования к составляющим глагольной группы (например, вы не можете просто devour, вы должны devour something ‘пожирать что-либо’; вы не можете dine something, вы можете просто dine ‘ужинать’). Самая распространенная словарная статья для глагола как будто подталкивает синтаксический анализатор к поиску ролевых исполнителей, которые требуются глаголу. Трусвелл и Танненхаус изучали движение глаз добровольных участников эксперимента в то время, как те читали:
The student forgot the solution was in the back of the book ‘Студент забыл о решении в конце учебника’.
Дойдя до слова was взгляд участников эксперимента задерживался на нем, а потом прыгал обратно, поскольку люди неправильно истолковывали предложение, как говорившее о студенте, забывшем решение, точка. Очевидно, слово forget ‘забывать’ в голове у людей говорило синтаксическому анализатору: «Немедленно найди мне дополнение!» Другое предложение было таким:
The student hoped the solution was in the back of the book ‘Студент надеялся, (что) решение в конце учебника’.
На сей раз проблем не было, потому что слово hope ‘надеяться’ вместо этого говорило: «Найди мне придаточное предложение!», и предложение было тут как тут.
Слова могут также помочь грамматическому анализатору, подсказывая, какие именно другие слова, как правило, появляются вместе с ними в составе определенной синтаксической группы. Хотя вероятностные переходы от слова к слову недостаточны для понимания предложения (глава 4), они могут оказаться полезны: когда синтаксический анализатор снабжен хорошей статистикой, то выбирая между двух возможных деревьев, допускаемых грамматикой, он может остановиться на той структуре, которая наверняка и имелась в виду. Синтаксический анализатор, похоже, проявляет чувствительность к вероятности образования пары слов: многие обманки особенно легко направляют по ложному следу, поскольку в них имеются такие распространенные пары слов, как cotton clothing ‘одежда из хлопка’, fat people ‘толстые люди’ и prime number ‘простое число’. Выигрывает мозг от языковой статистики или нет, но компьютеры выигрывают точно. В лабораториях AT&T и IBM компьютеры заносят в таблицы миллионы слов текста из таких источников как «Уолл-стрит джорнал» и «Ассошиэйтед пресс». Инженеры надеются, что если они снабдят свои синтаксические анализаторы сведениями о частотности сочетаемости слов и групп слов друг с другом, то синтаксические анализаторы смогут разумно избежать двусмысленностей.
Смотрите также
ВЫМЕРШИЕ ГИГАНТЫ СЕВЕРА
Создание мамонтов было неудавшейся попыткой, предшествовавшей сотворению Высшего
существа. Изготовляя столь огромное животное, божественные силы не учли ни размеров
Земли, ни ее покрытия. Оказалос ...
Методы очистки сточных вод НПЗ
Механическая очистка
Механическая очистка
является одним из основных и самым распространенным методом обработки сточных
вод нефтеперерабатывающих заводов. Механическую очистку осуществляют в
пес ...