Библиотека

Теология

Конфессии

Иностранные языки

Другие проекты







Ваш комментарий о книге

Величковский Б. Когнитивная наука: Основы психологии познания

ОГЛАВЛЕНИЕ

ГЛАВА 7. КОММУНИКАЦИЯ И РЕЧЕВАЯ АКТИВНОСТЬ

7.1        Восприятие и порождение речи

  1. Фонологическое восприятие

  2. Развитие языка и речевых действий

  3. Нейропсихологические синдромы и модели
    порождения

7.2        Анализ процессов чтения

  1. Развитие навыков чтения

  2. Модели и нейропсихология чтения

  3. Движения глаз при чтении

7.3        Когнитивные исследования грамматики

  1. Проверка трансформационной модели

  2. От глубинной семантики к когнитивной
    грамматике

  3. Современные модели и данные
    нейролингвистики

7.4       Прагматика коммуникативных ситуаций

  1. Принцип кооперативности и понимание

  2. Несовпадение значения и смысла

  3. Технологические применения прагматики

94

Речь — это способность, которая традиционно и вполне обоснованно считается наиболее ярким отличительным признаком биологического вида Homosapienssapiens. Различные направления в психологии и за ее пределами расходятся в оценке отдельных фактов, но едины в Тгризна-нии критической роли языка, речи и письменности в качестве катализаторов специфически человеческих познавательных достижений. Для функционалистского анализа речь — это основное средство социальной координации и даже центральное звено произвольного управления действиями, например в случае «переформатирования» познавательных процессов, вызванного необходимостью изменения цели и переключения внимания с решения одной задачи на решение другой. С точки зрения анализа структуры психофизиологических механизмов речь не менее интересна, как ярко выраженная «вертикальная» способность, включающая несколько иерархических уровней организации. Наконец, в отношении фило- и онтогенеза это действительно центральная проблема для ряда альтернативных подходов, в частности, типичный пример врожденных модулярных механизмов не только для Фодора, но и значительно ранее для Хомского. Но так ли изолированы в действительности механизмы речи от других форм познавательной активности? Насколько врожденны эти механизмы? Насколько однозначна их мозговая локализация? Наконец, в какой мере когнитивные аспекты речевой активности исчерпываются синтаксисом и семантикой — двумя полюсами большинства психологических и лингвистических дискуссий?
Данная глава пытается дать предварительный ответ на эти и некоторые другие вопросы. Судя по результатам многочисленных исследований, современный вариант модулярной френологии не учитывает ряд существенных особенностей развития и функционирования речи. Она не только имеет длительную филогенетическую предысторию, но и опирается в своем актуальном функционировании на структурированное культурным образом окружение и процессы взаимодействия с другими людьми. Кроме того, мозговые механизмы речи оказываются весьма пластичны, особенно в раннем возрасте, когда формируется, по словам А.Р. Лурия, «неслучайная мозаика» обеспечивающих ее работу функциональных систем. В этой главе обсуждаются процессы порождения, восприятия и понимания речи, а также их зависимость от общих принципов организации общения.

7.1  Восприятие и порождение речи
7.1.1 Фонологическое восприятие

французский врач Поль Брока (1824—1880) первым описал в 1861 году участок коры передней части левого полушария (с тех пор зона Брока), поражения которого у взрослых людей ведут к нарушениям артикуляции и синтаксиса речи. Несколько позднее немецкий невролог Карл Вернике (1848—1905) обнаружил второй регион левого полушария, явно участвующий в восприятии звуков речи и понимании слов. Зона Вернике расположена в задней трети верхней височной доли и непосредственно примыкает сзади к кортикальным механизмам слухового анализа. Анатомические и физиологические исследования свидетельствуют о том, что этот регион служит основой восприятия речи уже в раннем онтогенезе. Так, вызванные потенциалы мозга в ответ на предъявление фонем, слогов и слов более выражены у новорожденных в области левой височной доли, чем правой. В случае неречевых звуков наблюдается обратная зависимость. Более того, разница в интенсивности ответов височных долей левого и правого полушарий новорожденных на речевые звуки служит хорошим предиктором развития речевых навыков в возрасте трех лет (Bornstein, 1996).
Биологические предпосылки восприятия речи едины для всех представителей вида Homosapienssapiens(то есть человека современного биологического вида, предположительно появившегося примерно 100 тысяч лет назад) и связаны, прежде всего, с восприятием фонем — наименьших смыслоразличительных единиц потока речевых звуков. Сравнительные лингвистические работы показывают, что различные языки используют ограниченный репертуар хорошо отличающихся друг от друга смыслоразличительных звуков. Например, полинезийские языки имеют лишь 15 фонем, тогда как в отдельных европейских и азиатских языках их число может превышать 60 (как в случае абхазского языка). В русском и английском насчитывается порядка 40 фонем. Судя по всему, имеются универсальные или почти универсальные фонологические признаки, присутствующие в большом числе языков. К числу таких признаков относятся звонкость, например /б/ или /п/, и место артикуляции согласных. Последний признак связан с местом перекрытия арти-куляторного тракта при произнесении звука: подъемом задней части языка к мягкому нёбу, прикосновением языка к зубам и твердому нёбу или соединением губ, как, скажем, при произнесении звонких согласных /г/, /д/ и /б/.
Многие фонологические признаки, однако, не являются универсальными. Англичане, например, не способны различать некоторые фонемы довольно насыщенного согласными звуками чешского языка. Проблематичен, даже для ближайших географических соседей, голланд-
95

ский язык1, а европейцы в целом не слышат некоторых смыслоразли-чительных признаков фонем тайского языка и не способны правильно управлять ими в собственной речи, что, как утверждают, приводило к дипломатическим недоразумениям. Хорошо известны трудности восприятия и порождения согласных /р/ и /л/ носителями японского языка, в котором нет соответствующего фонологического различия. Во многих языках Восточной и Юго-Восточной Азии (таких как стандартный китайский, вьетнамский и другие) смыслоразличительным признаком является и высота тона.
Доказательство восприятия собственно фонем, а не просто отдельных признаков, связано с существованием эффекта категориалъности. Если предъявить слушателям в лабораторных условиях искусственные звуки, градуально превращающие, скажем, звонкое /ба/ в глухое /па/, то существует некоторое промежуточное значение, при котором люди начинают слышать другую, в данном случае глухую фонему. Это значение физической стимуляции называется границей категории. Оказалось, что положение границы категории на континууме физических стимулов предопределяет успешность различения пар звуков. Два близких по физическим параметрам звука различаются легко, если они попадают по разные стороны границы соответствующих фонологических категорий. Напротив, сравнительно сильно отличающиеся звуки могут идентифицироваться как одинаковые, когда они расположены по одну сторону границы.
Замечательный результат этой линии исследований, установленный первоначально американцем Питером Эймасом, состоит в том, что младенцы демонстрируют при предъявлении синтезируемых искусственно фонем такие же категориальные эффекты, как и взрослые. Об этом можно судить по динамике изменения ориентировочной реакции: ее возникновение свидетельствует о различении двух звуков, отсутствие — о том, что они обрабатываются как представители одной категории. Интересно, что категориальное восприятие младенцев распространяется на фонемы, не воспринимающиеся их родителями. Так, японские младенцы легко различают /р/ и /л/, а европейские дети — неразличимые для взрослых европейцев фонемы тайского языка. Если это действительно так, то фундаментальная проблема соотношения врожденного и приобретенного может получить здесь неожиданное решение: биогенетически ребенку предоставлены максимальные возможности для развития, но культурная (в данном случае, языковая) среда эти возможности ограни-
1 Сразу после освобождения Нидерландов союзниками в 1945 году местное население
идентифицировало переодетых немецких солдат, предлагая им произнести название сто
лицы своего государства. То, что известно нам как «Гаага», произносится носителями гол
ландского языка с использованием гортанно-хрипящего звука, отсутствующего в других
96            языках и для иностранцев обычно невоспроизводимого.

чивает (в действительности, эта проблема не имеет однозначного общего решения — см. 9.4.2).
Не исключено, правда, что категориальность — это какой-то элементарный эффект, связанный лишь с анатомией слухового аппарата млекопитающих и не доказывающий врожденность восприятия фонем. Имеются данные о южноамериканских крысах шиншиллах, которые в экспериментах с выработкой условных рефлексов обнаружили категориальное различение звуков на континууме звонкости /ба-па/, причем с аналогичным положением границы категорий, как и у людей. Поскольку трудно предположить, что шиншилле может понадобиться врожденный механизм восприятия звуков человеческой речи, эти результаты затрудняют объяснение эффекта категориальное™ и у человека. Совершенно другой аргумент относится к особенностям восприятия взрослых людей. Категориальность восприятия фонем оказалась зависящей от того, относятся ли слушатели к ним, как к звукам речи или шумовым сигналам. Если бы эти механизмы были чем-то вроде врожденного модуля, то субъективная установка слушателя не влияла бы на их работу. Таким образом, эффекты категориального восприятия не столь автоматичны, как этого требуют известные критерии выделения когнитивных модулей, сформулированные Фодором (см. 2.3.2).
Против узкой специализации механизмов восприятия речевых звуков, предполагаемой гипотезой врожденного лингвистического модуля, также говорят данные о существовании целого ряда интермодальных, зрительно-слуховых эффектов. Так, ученица Найссера и Элеоноры Гиб-сон Элизабет Спелке одной из первых и, надо сказать, весьма элегантным образом продемонстрировала раннюю предрасположенность детей к восприятию речи в координации со зрительно воспринимаемыми событиями. В ее экспериментах младенцам в возрасте примерно 5 месяцев на разных экранах одновременно показывались два обычных, «взрослых» фильма с большой долей диалогов, причем лишь один из фильмом озвучивался из динамика, расположенного строго между экранами. Анализ движений глаз детей показал, что они преимущественно смотрели на экран с озвучивавшимся фильмом.
Самым известным примером интермодальных взаимодействий при восприятии фонем взрослыми нормально слышащими людьми является так называемый эффект ???,-Гурка (по имени описавшего его американского психолога — см., например, McGurk & MacDonald, 1976). Если испытуемый слышит одну фонему, но при этом видит по движениям губ, что произносится другая, то фонологические признаки «видимой речи» включаются в процесс слухового восприятия с тем результатом, что слышаться начинает третья фонема, комбинирующая акустические и зрительные признаки. Так, если акустически предъявляется звук /ба/, а движения губ соответствуют слогу /га/, то слышится звук /да/. Для приведенной и некоторых других комбинаций слогов данный эффект выражен весьма отчетливо и, подобно всем перцептивным иллюзиям (см. 2.3.2), не зависит от знания реального положения дел. Закрытие глаз ведет к его исчезновению, а открытие — к немедленному восстановлению. Эффект Мак-Гурка сохраняется даже тогда, когда вводится рассогласование слы-

шимого и видимого пола говорящего, например, испытуемый видит изображение говорящей женщины, но слышит мужской голос2.
Анализ фонем в контексте живой речи, а не при их изолированном предъявлении связан с некоторыми техническими осложнениями, которые даже побуждают отдельных авторов сомневаться в существовании фонем как реальных единиц восприятия и порождения речи. Дело в том, что акустические признаки фонем сильно зависят от контекста: предшествующих, а также непосредственно следующих сегментов речевого потока. Поэтому некоторые авторы считают, что единицей речевого сообщения является не фонема, а слог3. Совершенно очевидно, однако, что и сами слоги не являются полностью инвариантными единицами. Как и слова, они связаны с общим, в том числе смысловым контекстом сообщения. Попытки выделить элементарные компоненты восприятия, таким образом, рано или поздно приводят к проблеме распознавания значения.
Исторически первой теорией, предназначенной для объяснения устойчивого восприятия речи в условиях неустойчивости акустических признаков фонем, была моторная теория восприятия (Lieberman & Blumstein, 1988). Сторонники этой теории пытались объяснить инвариантное восприятие меняющихся в зависимости от контекста фонем встречной артикуляцией соответствующих сегментов речи по ходу их восприятия. Действительно, при осложнении условий восприятия мы часто повторяем услышанное, но, возможно, это лишь проявление общей стратегии перепроверки полученной в процессе нарушенного общения информации, а не специализированный моторный механизм, встроенный в само восприятие. У моторной теории мало доказательств «за» и много аргументов «против». В частности, против предположения о существенной роли артикуляции говорят данные о возможности нормального восприятия в случае паралича речевой мускулатуры и при затруднениях артикуляции. Об этом же говорит анализ синхронного перевода. Последний действительно может быть практически «синхронным», то есть настолько близким к одновременному прослушиванию языка-источника и произнесению слов в целевом языке, что ни о какой проме-
2 С нейрофизиологической точки зрения, этот эффект достаточно неожиданен, так как
кортикальные вызванные потенциалы на акустические события всегда примерно на 40 мс
опережают зрительные. Иными словами, чтобы добиться одновременной регистрации
зрительных и слуховых событий кортикальными механизмами сенсорной обработки слу
шателя, говорящего нужно было бы отодвинуть на расстояние, примерно равное 10 м.
3 О. критической роли слогов в восприятии речи мог бы говорить тот факт, что дли
тельность типичного слога, примерно равная 250 мс, совпадает со средней оценкой
продолжительности сохранения акустической информации в слуховом сенсорном ре
гистре — эхоической памяти (см. 3.2.2). Типичный слог представляет собой движение от
закрытого положения рта к открытому (гласному звуку) и вновь к относительно закрыто
му, соответствующему либо конечной согласной данного слога, либо первой согласной
следующего. Существует предположение, что в основе слоговой организации устной речи
98            может лежать древняя синергия жевательных движений.

жуточной артикуляции слов языка-источника, якобы необходимой для его восприятия, не может быть и речи.
Психолингвист из английского Кэмбриджа Уильям Марслен-Уилсон (например, Marslen-Wilson, 1990) разработал когортную модель восприятия слов, согласно которой детальный фонологический анализ вообще не имеет места. На основании когнитивных ожиданий, генерируемых из контекста, и общего анализа первых звуков слова активируется предварительный список слов-кандидатов, называемый когортой. Любая последующая информация, как акустическая, так и семантико-синтаксическая, используется для удаления из когорты неподходящих слов. Обработка прерывается при удалении всех кандидатов, кроме одного. Достижение «точки узнавания», таким образом, является результатом параллельной обработки информации на нескольких уровнях. Под влиянием экспериментальных данных в последних версиях когортной модели предположение о полной параллельности обработки было изменено: влияние семантического и синтаксического контекста сильнее сказывается в них на относительно поздних стадиях восприятия слова. Предсказания этой теории, в целом достаточно успешные, в настоящее время продолжают , проверяться. Конкуренцию ей составляют только коннекционистские модели.
Как мы отмечали выше (см. 2.3.3), коннекционистские модели восходят к ранним моделям распознавания конфигураций, перцептронам. Эти модели допускают возможность любых коммутаций источников сведений, тем самым объясняя также интермодальные эффекты в восприятии речи. С помощью относительно простых алгоритмов обучения они способны усваивать нерегулярные, чисто ассоциативные переходы, для которых нет соответствующих правил, например, «man—>men» или «go->went». Помимо этого, они способны аппроксимировать то, что описывается в генеративной грамматике как примеры применения абстрактных правил, например, постепенно моделировать — при восприятии и порождении — регулярные синтаксические эффекты, типа выявления множественного числа английских существительных на основе окончания «s» или прошедшего времени глаголов по «ed». Данные о развитии речи и о статистическом соотношении регулярных и нерегулярных эффектов в отдельных языках оставляют пока открытым вопрос воз- ' можной коннекционистской природы синтаксической компетентности в целом, свидетельствуя скорее о различиях в механизмах обработки регулярных и нерегулярных грамматических переходов (Pinker, 2000)4.
В современных лингвистике и психолингвистике часто используются гибридные архитектуры, когда, например, нейросетевые компоненты вводятся в качестве адаптивного модуля в модели символического типа. Это позволяет обеспечить настройку на индивидуальные характеристики голоса или (в моделях чтения) на особенности движений глаз пользователя. Смешанную архитектуру предполагает теория оптимальности
4 Например, при образовании множественного числа существительных в немецком
языке более частотными оказываются нерегулярные переходы и, естественно, возникает
вопрос, как нейронная сеть может путем чисто ассоциативного обучения выделить соот
ветствующее правило, если ей чаще приходиться сталкиваться с отклонениями от него.                  99

100

наиболее влиятельная на сегодняшний день модель восприятия и порождения фонологических аспектов речи (Prince & Smolensky, 1997; Smolensky, 2005). Она относится к классу влиятельных моделей удовлетворения множественных ограничений, позволяющих описывать нахождение решения, которое оптимальным образом удовлетворяет нескольким различным правилам, таким как правила чередования согласных и гласных звуков, а также варьирования тона в тональных языках (таких как китайский). Коннекционистские модели также находят применение в задачах распознавания слов из заранее фиксированного и относительно небольшого набора команд. В этом качестве они начинают использоваться при речевом взаимодействии с различными техническими устройствами. Некоторые из подобных прикладных разработок будут рассмотрены нами в конце данной главы (см. 7.4.3).
Огромный интерес представляет восприятие глобальных акустических признаков, характеризующих сегменты речи, более крупные, чем отдельные фонемы, слоги и слова. Так, повышение тона голоса к концу фразы обычно означает вопрос, то есть то, что говорящий с высокой степенью вероятности хочет что-то от вас услышать (хотя вопрос вполне может быть и риторическим, не предполагающим ответа — см. 7.1.2 и 7.4.1). Подобные интонационные, или просодические, признаки оказываются более инвариантными, чем акустические признаки отдельных фонем, как с точки зрения возможного влияния актуального речевого контекста, так и в отношении межъязыковых различий.
К сожалению, эти аспекты восприятия речи стали интенсивно изучаться лишь сравнительно недавно (Кодзасов, 2004). В одном из исследований (Ishii, Reyes & Kitayama, 2003) было проверено и получило экспериментальное подтверждение давнее предположение, что в восточных культурах (в данной работе, в Японии и на Филиппинах) именно интонация, а не содержание речи, как это характерно для Европы или Северной Америки, спонтанно привлекает внимание слушателя. Смена языка, а именно переход испытуемыми-билингвами на английский язык, ничего не меняла в этой базовой направленности внимания. Итак, оказавшись в Японии или Китае и получив в ответ на прямой вопрос, казалось бы, положительный ответ «да», нам следует очень внимательно отследить тональность голоса собеседника! Имеющиеся нейропсихологичес -кие данные говорят о том, что подобные формы восприятия, равно как и процессы восприятия эмоциональных характеристик речи, преимущественно вовлекают правое полушарие мозга, а следовательно, заведомо не классические речевые зоны Брока и Вернике, локализованные в левом полушарии.

7.1.2 Развитие языка и речевых действий

В настоящее время в литературе по когнитивным исследованиям представлены, как минимум, четыре основные точки зрения на возникновение и природу развития языковых способностей. Первая и наиболее влиятельная из них представлена работами Хомского и Фодора и, по сути дела, для начала отрицает сам факт развития речи (см. 1.3.3 и 2.3.2). Для этих авторов и их многочисленных последователей в лингвистике и за ее пределами языковая компетентность, как некоторый внутренний потенциал обработки символической информации, является врожденной и неизменной способностью. По признанию самого Хомского, им предложена «модель мгновенного усвоения языка», а Фодор полагает, что психология преувеличивает роль когнитивного развития. Развернутый во времени процесс возникновения речи при этом не обсуждается, лишь иногда говорится о возможно имевшей место в филогенезе мгновенной супермутации, или, как шутят критики этой концепции, «мутации волшебной пули».

Если отставить шутки в сторону, то следует признать, что в пользу этой точки зрения говорит внушительный список фактов:

  1. зависимость речевого развития от сохранности биогенетических ме
    ханизмов, в частности, от гена FOXP2 хромосомы 7 человека — спе
    цифическую, не встречающуюся у других животных форму этот ген
    приобрел в результате мутации, произошедшей примерно 100 000 лет
    назад (Enard et al., 2002);
  2. хорошо известный факт существования сенситивного периода для
    успешного освоения первого и второго языков;
  3. трудности в обучении высших обезьян даже рудиментарному языку,
    несмотря на интенсивную поддержку со стороны психологов;
  4. характерная мозговая локализация речевых функций, с определен
    ным набором возникающих при их нарушении расстройств речи —
    афазий;
  5. сходство формальных характеристик грамматик устной речи и языка
    жестов у глухонемых;
  6. существование разнообразных (хотя и не совсем понятных в отноше
    нии причин и следствий) генетических влияний на речевые функции;
  7. возникновение грамматически вполне полноценных, так называе
    мых креольских языков уже во втором поколении сообществ детей раз
    ноязычных иммигрантов;
  8. описанный недавно случай спонтанного создания нового языка жес
    тов группой впервые оказавшихся вместе глухонемых детей (Kegl et
    al., 1999).

Некоторые из этих феноменов, впрочем, могут быть объяснены и в рамках альтернативных представлений.
Картезианской (или нативистской) позиции сторонников Хомского противостоит несколько диффузное допущение, что, быть может, язык все-таки относительно градуально, на базе ассоциативных связей       101

вырастает из интермодального восприятия, сенсомоторных координации, памяти и примитивных форм коммуникации. Эта точка зрения, исторически восходящая к философии эмпиризма и, казалось бы, навсегда исчезнувшая после критики Хомским бихевиористских теорий языкового научения (см. 1.3.3), начинает поддерживаться в последние годы представителями ряда новых направлений. Наиболее влиятельным из них является моделирование речи и познавательных механизмов с помощью нейронных сетей (см. 2.3.2). В этом контексте такой яркий пример возможной врожденности языковой компетентности, как наличие сенситивного периода в развитии речи ребенка, объясняется просто более быстрым изменением параметров нейронных сетей в начале процесса обучения, когда весовые коэффициенты узлов сети еще не определены5.
Нетривиальную точку зрения защищает известный специалист по эволюционной генетике и нейролингвистике Терренс Дикон (Deacon, 1997). Он считает, что язык, безусловно, развивается, но развивается не благодаря, а вопреки ассоциативным связям перцептивных категорий. В противном случае возникновение языка в филогенезе не было бы таким уникальным событием, каким оно, очевидно, является (Deacon, 1996). Возникновение языка связано, по мнению Дикона, с постепенным становлением префронтальных механизмов коры, которые способны подавлять поверхностные перцептивные ассоциации и чисто эмоциональные вокализации, превращая их в контролируемые процессы понятийного обучения и общения посредством понятий (символов)6. Генеративный характер грамматики языка считается одним из побочных следствий комбинаторного и иерархического характера семантических репрезентаций (см. также 6.1.1). Развитие языка в этой концепции осуществляется как бы «сверху вниз», из сферы мышления и других мета-когнитивных координации (а не «снизу вверх», из восприятия). В известной степени эта теория напоминает мнение Л.С. Выготского о том, что речь возникает в результате слияния двух первоначально независимых линий развития, связанных, соответственно, с доречевой коммуникацией и образным мышлением.
Непосредственно к работам Бюлера и Выготского восходит четвертая точка зрения, согласно которой язык и речь вырастают из сферы
5  Значительно более сложным с этой точки зрения должно быть объяснение синдрома
Уильямса
— успешного онтогенеза речи на фоне чрезвычайно замедленного развития об
щего и в особенности невербального интеллекта. Этот загадочный феномен, безусловно,
имеет генетическую составляющую (см. 2.3.2 и 9 4.2).
6  Интересно, что, подчеркивая роль метакогнитивного КОНТРОЛЯ, Дикон не так
далек от позиции Хомского, для которого критическим признаком, отличающим язык
человека от коммуникации животных, является использование РЕКУРСИИ (см. 1.3.3).
Однако Хомский считает появление языка специализированным (модулярным) дости
жением и не рассматривает рекурсию как относительно общую, метакогнитивную опера-
102        цию (см. 8.1.3).

социальных, в широком смысле слова, отношений. Объяснительный потенциал этого предположения состоит в том, что раннее социальное взаимодействие ребенка со взрослым по поводу предметов носит практически универсальный характер. Данное предположение имеет фило-и онтогенетический аспекты. Несколько подробнее разработан онтогенетический. Его суть состоит в том, что интериоризация формирующихся в течение первого года жизни схем совместных со взрослым предметных действий образует основу универсальной протограмматики речи, с такими ее компонентами, как S (субъект), V (глагол/действие) и О (объект). Конкретная последовательность этих компонентов и правила их согласования в типичной фразе приобретают затем специфические формы в зависимости от доминирующего языкового окружения.
В когнитивной психологии эту гипотезу первым сформулировал в 1970-е годы Джером Брунер. Видным сторонником данной точки зрения в настоящее время является работающий в Германии американский психолингвист и приматолог Майкл Томаселло (Tomasello, 1996; 1999b). По его мнению, развитие полноценной взрослой речи происходит в три этапа. На первом, долингвистическом этапе ребенок все более успешно, но «диадически» взаимодействует либо со взрослым, либо с объектами. На втором этапе, примерно с 9 месяцев, ребенок начинает понимать другого как интенционалъного агента, который использует жесты и звуки в целях организации совместных с ним предметных действий. Томаселло даже пишет в связи с этим о «социокультурной революции 9 месяцев». В рамках эпизодов совместного внимания, включающих, по Томаселло, «триаду» компонентов — ребенка, взрослого и объект действия, начинается овладение специфическими для конкретного
Таблица 7.1. Три этапа понимания другого человека и развитие речи (по: Tomasello, 1999b, с дополнениями)


Этапы понима-

Возможная интерпретация

Речевые механизмы

ния и возраст

познания

поведения

интенции

 

Другой как

[взгляд]

движение

[направ-

[непропозициональ-

живое существо

 

 

ление]

ные вокализации]

(до 9 месяцев)

 

 

 

 

Другой как

внимание

действия

цели

Постепенное

интенционалъ-

 

 

 

расширение лекси-

ный агент

 

 

 

кона и развитие

(от 9 месяцев)

 

 

 

грамматики

Другой как

знания

деятель-

желания,

Язык ментальных

ментальный

 

ности

намерения

предикатов, напри-

агент (от 4 лет)

 

 

и интересы

мер, «Я не хочу,

 

 

 

 

чтобы он думал


103

языкового окружения средствами речи. Переход на третий этап связан с появлением (примерно в возрасте 4 лет — см. 5.4.3 и 8.3.2) индивидуальной теории психики, в результате чего управление поведением в целом и использование языка в частности начинают строиться с учетом ментальных состояний, прежде всего возможного различия знаний и интересов говорящего и его контрагентов (см. табл. 7.1).
С этих позиций проводится психологический анализ развития семантики и синтаксиса речи (прежде всего роли глаголов) в онтогенезе (Tomasello, 1999b). Интересно, что представители возникших в последние два десятилетия внутри лингвистики когнитивных направлений (см. 7.3.2) в целом с симпатией относятся к этому кругу идей. Тем самым когнитивная лингвистика также находится в оппозиции к тезисам о - врожденности грамматики (синтаксиса) и о домено-специфичной модулярности речи. В отношении филогенеза эти противостоящие генеративной грамматике направления опираются на данные палеоантропологии и на наблюдения за социальными формами организации жизни современных приматов, в том числе на исследования, демонстрирующие возможность — при условии интенсивной социокультурной поддержки — известного прогресса в обучении человекоподобных обезьян общению с помощью систем условных символов.
Наиболее ярким примером такого социокультурного обучения у приматов служит развитие Канзи, карликового шимпанзе вида Pan paniscus (или бонобо). Канзи смог освоить свыше 200 символов (словарный запас ребенка двух лет), представленных абстрактными зрительными знаками на специальной компьютерной клавиатуре, и, похоже, даже стал спонтанно применять примитивную «грамматику» чередования «существительных» и «глаголов» в своих «высказываниях». Интересно, что эти достижения произошли непреднамеренно, в ходе латентного научения. Исследователи университета штата Джорджия, во главе с Ду-эйном Рамбо и Э. Сэйвидж-Рамбо, первоначально безуспешно пытались научить искусственному языку приемную мать Канзи, который обычно просто сидел у нее на спине во время уроков (Rumbaugh & Savage-Rumbaugh, 1996). Максимальные психолингвистические достижения Канзи, однако, соответствуют лишь концу второго года нормально развивающегося ребенка.
Как выглядят фактические данные об изменениях речевых функций в онтогенезе? Не имея возможности остановиться на этой неисчерпаемой теме сколько-нибудь подробно, отметим лишь общие тенденции такого развития. Наиболее простые в отношении моторного контроля слоги /па/, /да/, /ма/ объясняют до половины первых произносимых младенцами звуков в среде языков столь различных, как французский, русский, английский, японский и суахили. Не случайно сравнительные исследования показывают, что именно эти слоги используются в названиях родителей в примерно 60% из более чем 1000 проанализированных 104

в этом отношении языков мира. Вокализации ребенка сначала приобретают в ходе развития характер «протодиалога» — чередующихся «обращений» и «прислушиваний» к речи взрослого, а к 8 месяцам начинают отражать и специфические особенности языкового окружения, так что эксперты оказываются способными различать китайское или, скажем, арабское окружение лишь на основании записей производимых ребенком звуков.
С относительным постоянством характеристик первых вокализаций ребенка коррелирует универсальный характер и самой обращенной к нему речи. Этот, так называемый «материнский» (Motherese) язык оказывается примерно одним и тем же в разных культурах и языках, кстати, как и воспроизводимый им интонационный рисунок элементарных речевых действий — вопроса или требования. Помимо типичного набора просодических мелодий, «материнский» язык обладает целым рядом других замечательных особенностей — упрощенной семантикой, четкими паузами на синтаксических границах, акцентуацией фонологических признаков и, в особенности, совершенным контролем за проявлениями внимания ребенка. Действительно, если у младенца есть выбор, он отслеживает глазами источники и предметные референты именно «материнского», а не обычного взрослого языка (Bornstein, 1996)7. Подобная социализация внимания осуществляется путем постепенной координации активности ребенка и взрослого за счет формирования состояний совместного внимания {joint attention), о котором писали уже такие исследователи, как Л. С. Выготский и Дж. Брунер.
Социализация внимания, несомненно, является важнейшим психологическим достижением первого года жизни (см. 4.1.1 и 7.4.3). Она открывает путь к усложнению форм взаимодействия ребенка и взрослого, а также делает возможной быстрое развитие лексической семантики (благодаря относительно однозначной номинации объектов) и синтаксиса речи (благодаря выделению «фокуса» ситуации, который со временем становится грамматическим подлежащим — см. 7.1.3). В дальнейшем ребенок стремительно врастает в языковую среду, особенно заметно в течение второго и третьего года жизни. Основными моментами этого процесса являются первые, еще не дифференцированные слова-предложения («голофразы») и постепенный переход к многословным фразам, порождаемым с применением грамматики. Применение определенных синтаксических схем первоначально наблюдается лишь в контексте употребления отдельных глаголов. Этот факт получил название
7 Нельзя не отметить, впрочем, значительных различий внутри одной и той же общей
культурной среды, а равно между культурами с точки зрения степени объема и характера
речевой поддержки детей взрослыми. Согласно исследованию развития детей в традици
онной культуре Самоа (Ochs, 1988), феномен «материнского языка» практически полно
стью отсутствует в этой культуре, что, однако, не мешает нормальному речевому и когни
тивному развитию.                                                                                                                                   105

феномена глагольных островов (см. 7.3.2). Судя по всему, ребенок в этом возрасте еще не использует готовую систему синтаксических правил по отношению к любым глаголам, а скорее усваивает некоторые избранные глаголы с набором типичных грамматических конструкций.
Еще одна общая тенденция — быстрое расширение лексикона, который уже к концу третьего года жизни может достигать объема 3000 слов. Затем появляются все более сложные формы произвольного использования речи, в частности, в целях убеждения или даже намеренного введения других людей в заблуждение. Последнее достижение становится возможным примерно в возрасте 4—5 лет, что, несомненно, связано с появлением индивидуальной теории психики и разнообразных ме-такогнитивных координации (см. 5.4.3 и 8.1.1).
Произвольный контроль является важнейшей особенностью речи, отличающей ее от коммуникации животных и неречевых вокализаций человека, подобных стонам боли или удовольствия. На эту особенность естественных языков одним из первых обратил внимание выдающийся русский лингвист Роман Якобсон (см. 1.4.3). Дело в том, что значительная часть слов и грамматических форм любого языка являются так называемыми шифтерами (от англ. shifter — переключатель): их значение не постоянно и всякий раз должно определяться заново по отношению к конкретной ситуации и целям действия. Например, шифтерами оказываются грамматическая форма прошедшего времени и, скажем, наречие «вчера», так как они указывают на события, предшествовавшие данному коммуникативному эпизоду. Классические шифтеры — это местоимения. В значение местоимений первого лица входит ссылка на автора речевого акта, а в значение второго лица — на адресата, к которому обращен акт речи. В процессе диалога, естественно, происходит обмен высказываниями и постоянное переключение референтных значений местоимений «я—мы» и «ты—вы».
В одной из своих последних публикаций Якобсон еще раз подчерк
нул, что овладение шифтерами освобождает речь от роли непосредствен
ной реакции на внутренние состояния или на происходящие в данный
момент в поле зрения события. В частности, включения грамматическо
го времени в языковой оборот ребенка совпадает с возникновением в его
речи фраз с субъектом и предикатом, позволяющим резко улучшить про
извольный контроль за использования языка — приписывать субъекту
различные предикаты и, наоборот, относить каждый предикат к различ
ным субъектам. «Это нововведение освобождает ребенка, погашает его
зависимость от hic et nunc, то есть от непосредственно данной времен
ной и пространственной обстановки. Отныне он может говорить о том,
что происходит на временном и пространственном отдалении от него, и
с этой переменностью исходных пунктов... в речь ребенка проникает
идея времени, а также идея большей близости или отдаленности: я и ты,
мое и твое, здесь и там, сюда и туда» (Якобсон, 1996, с. 236—237). Похо
жее развитие, опирающееся на представление о непрерывности времен
ной шкалы эпизодов собственной биографии, имеет место в становле-
106                       нии высших форм памяти и мышления (см. 5.4.3 и 8.1.1).

Раннее развитие речи совпадает с массивными изменениями нейрофизиологических механизмов, выходящими за рамки классических речевых зон левого полушария и охватывающих прежде всего передние, префронтальные отделы коры. К 4—5 годам в общих чертах оформляются связи префронтальной коры с другими структурами мозга, а число синапсов и уровень метаболической активности префронтальных нейронов достигают их максимальных прижизненных значений (порядка 180% от взрослого уровня — см. 9.4.2). В ходе дальнейшего развития величина этих нейробиологических параметров сначала постепенно, а после подросткового возраста все быстрее снижается8.
Параллельно с этими изменениями меняется и способность усвоения любого нового языка. В возрасте до 6 лет второй язык (L2) усваивается почти столь же легко, как и первый (L1). От 6 лет до подросткового периода начинаются все более выраженные затруднения. После этого полноценное усвоение языка становится практически невозможным, особенно в отношении грамматики и фонологии, в силу чего «иностранный акцент» обычно сохраняется навсегда. Большинство взрослых останавливается в самом начале или на полпути процесса обучения новому языку, демонстрируя неспособность преодоления типичных ошибок даже при интенсивной, в том числе и профессиональной лингвистической поддержке. Как показывают новейшие исследования, формирование навыков понимания и говорения на втором языке функционально и нейроанатомически базируется на использовании тех же структур мозга, что и первоначальное развитие речи (Perani & Abutalebi, 2005)9.
О существенных изменениях пластичности мозга в онтогенезе говорят не только обширные нейрокогнитивные исследования последних лет, но также и клинические данные. Так, при поражениях и хирургическом удалении речевых зон левого полушария в детском возрасте часто имеет место восстановление и дальнейшее развитие языка (хотя, как показывают психолингвистические тесты, не всегда в полном объеме) с примерно симметричной локализацией соответствующих мозговых механизмов в правом полушарии. Начиная с подросткового возраста, по-
8  Важнейшей предпосылкой быстрой и точной передачи импульсов в центральной
нервной системе является процесс так называемой миелинации аксонов (см. 2.4.3 и 9.4.2).
В случае префронтальных областей процесс миелинации начинается в середине первого
года жизни и продолжается, как минимум, до 20—30 лет. Речевое развитие в этот относи
тельно поздний, но критически важный с биологической и социальной точек зрения пе
риод только начинает изучаться (Locke & Bogin, 2005 in press).
9  Насколько узко все-таки специализированы эти нейрофизиологические механиз
мы? По-видимому, здесь, как и в случае зрительного распознавания (см. 3.3.1), можно
говорить о своеобразной полу специализации. Так, новые исследования вскрывают много
общего в механизмах восприятия речи и музыки. Восприятие синтаксических аспектов
тональной музыки (гомофонно-гармонический стиль) опирается на работу «речевых об
ластей» левого полушария, тогда как просодика — специфическая мелодия речевой фра
зы или музыкального фрагмента — обрабатывается практически совпадающими структу
рами правого полушария (Koelsch, 2005).                                                                                             107

добные анатомические нарушения обычно ведут к постоянной афазии — полному или частичному выпадению речи.
В отличие от восприятия устной и письменной речи, которое мо-
к   -      жет быть относительно пассивным, даже автоматическим процессом,
^        то, что мы говорим, обычно является целенаправленным действием,
'            хотя сами эти цели могут и не осознаваться нами сколько-нибудь от~
четливо. Интенциональные действия лежат в основе речевой активности, и, одновременно, использование речевых механизмов в качестве инструмента организации собственного поведения составляет важнейшее условие стабильности произвольного контроля. Материал,- изложенный в других главах этой книги, свидетельствует о том, что влияние речи распространяется как на восприятие (см. 3.4.4), так и на высшие формы познавательных процессов (см. 8.4.2). В частности, представление интенций в речевой форме позволяет фиксировать цели действия и, что не менее важно, произвольно переходить от одной цели к другой, меняя задачу и обеспечивая быстрое «переформатирование» всей микроструктуры вовлеченных в решение процессов (см. 4.4.2).
Несмотря на очевидное значение действенной трактовки речи для психологии, общие классификации речевых действий, или речевых актов, лучше разработаны в философии и лингвистике. К работам оксфордского философа Джона Остина (1911—1960) восходит выделение трех классов речевых актов. Первый класс — локутивные акты — включает сами действия говорения, а не производства каких-либо других, неречевых звуков. Второй класс речевых действий — иллокутивные акты — это действия, с помощью которых мы пытаемся добиться чего-то посредством речи: мы можем спрашивать, а можем утверждать, объявлять, восклицать или требовать. Особая сложность состоит в том, что непосредственная форма иллокутивных актов может не совпадать с их настоящей целью — интенциональным содержанием. Так, мы можем требовать поторопиться в форме вопроса: «Знаешь ли ты, сколько сейчас времени?» или пообещать нечто в форме утверждения. Наконец, третий класс речевых актов — перлокутивные акты — это предвосхищаемые говорящим ответные действия, которые может, но обычно не обязан осуществлять коммуникативный партнер. Например, после приведенного выше вопроса/ требования и при наличии интерсубъектного знания о грозящем опоздании можно ожидать, что партнер быстрее начнет собираться (см. 7.4.1).
Наиболее разработанным в лингвистике является представление об иллокутивных актах. Их классификация с точки зрения условий успешности осуществления и искренности говорящего дана в табл. 7.2.
Следует подчеркнуть, что в речевых актах на первый план выступает не возможная истинность или ложность, как в случае логических суждений — пропозиций (см. 2.2.3), а практическая, или прагматическая, успешность коммуникативного действия. При этом вполне осмысленными могут стать высказывания, противоречивые с точки зрения анализа 108       значений входящих в него логических пропозиций. Так, вполне осмыс-

Таблица 7.2. Условия успешного осуществления иллокутивных речевых актов: Г — говорящий, С — слушающий, Д — действие, ? — пропозиция (по: Падучева, 1985)

Речевые акты

Условия успешности

 

Предварительные

Условия

Назначение

 

и существенные

искренности

 

 

условия

 

 

Акт утверждения

/ Г имеет основания

Г считает,

Сообщение о дейст-

(сообщения, конста-

считать ? истинным

что ?

вительном положе-

тации, настоятель-

2. Для Г не очевидно,

 

нии вещей (утверж-

ные утверждения)

что С знает, что ?

 

дение ? вводится в

 

 

 

фокус внимания Г и С)

Акт обязательства

]. Г в состоянии

Г собирается

Обязательство со

(обещания)

совершить Д

совершить Д

стороны Г совершить

 

2. Г считает Д

 

Д

 

полезным для С

 

 

 

3. Г и С считают, что

 

 

 

Д не относится к

 

 

 

категории событий,

 

 

 

которые очевидно

 

 

 

произойдут сами собой

 

 

Акт побуждения

1. Г считает, что С в

Г хочет,

Попытка Г добить-

(просьба, приказ

состоянии совершить Д

чтобы С

ся, чтобы С совершил

и пр.)

2. Ни для Г, ни для С

совершил Д

Д

 

не очевидно, что С сам

 

 

 

по себе совершит Д

 

 

 

3. Состояние, которое

 

 

 

является результатом

 

 

 

Д, не имеет места

 

 

Акт вопроса

1. Г не знает ответа

Г хочет

Попытка Г получить

 

2. Ни для Г, ни для С

иметь

информацию от С

 

не очевидно, что С сам

информацию

 

 

сообщит нужную

 

 

 

информацию, не

 

 

 

будучи спрошен

 

 


ленным оказывается высказывание «Иванов попросил жену остаться дома, так как хотел, чтобы она уехала», если предположить, что Иванов мог просто воспользоваться известным ему упрямством жены. Работа с подобными предположениями («презумпциями») и контрпредположениями, рефлексивный учет знаний, интересов и намерений социальных партнеров составляет основу не только речевой коммуникации, но и ряда других, специфически человеческих форм мышления.

109

Анализом человеческих действий в социальном контексте и, более специально, проблемами интерпретации речевых высказываний в конкретных коммуникативных эпизодах занимается прагматика — научная дисциплина и область исследований на границе логики, философии, лингвистики, психологии и нейронаук. Представление о прагматике наиболее разработанно в современной лингвистике, где к ней относят также исследование оценочных компонентов речи. Такие оценки могут относиться к участникам общения, реальным или воображаемым ситуациям и, наконец, процессам самого общения, то есть они обычно имеют метакоммуникативный и метакогнитивный характер10. Мы- будем неоднократно обращаться к понятиям прагматики и соответствующим, в том числе прикладным, исследованиям на протяжении данной главы (см. 7.1.3 и 7.4.1). В следующей главе будет рассмотрен относительно новый материал о существенном влиянии коммуникативной прагматики на процессы умозаключений, решение задач и принятие решений (см. 8.4.2 и 9.4.1).

7.1.3 Нейропсихологические синдромы и модели порождения

В этом подразделе мы рассмотрим несколько подробнее процессы и структуры, участвующие в порождении устной речи. Новые экспериментальные результаты, теоретические соображения и, в особенности, анализ клинических синдромов привели в последние десятилетия к выделению целого ряда механизмов, участвующих в реализации простейших речевых задач, таких как повторение вслух только что услышанного слова. В следующих разделах мы остановимся и на более сложных формах подобных нарушений — афазиях, в частности, в варианте дислексии, вторичных нарушений навыков чтения (см. 7.2.2), а здесь кратко рассмотрим только этот простейший случай11. Английские нейропси-хологи Джон Эллис и Эндрю Янг (Ellis & Young, 1988) описали пять относительно автономных механизмов, обеспечивающих немедленное
10 Примерно эту же междисциплинарную область исследований иногда называют анализом дискурса (от лат. discursus — движение вперед и назад, диалог, беседа, разговор). При этом исследуется как само речевое поведение, так и его результаты — взаимодействие участников общение и порождаемые ими тексты, в самом широком смысле этого термина (A.A. Кибрик, 2003).
1 ' Создание общей, построенной на единых основаниях классификации афазий остается нерешенной задачей (Kolb & Wishaw, 2003). Дело в том, что основной массив данных афазиологии связан с инсультами, нарушениями мозгового кровообращения, которые могут одновременно вовлекать весьма различные области мозга. Кроме того, нейропсихологические представления о механизмах речи в основном еще базируются на модели Вернике и Лихтхайма 1874 (!) года, жестко разделяющей процессы понимания и порождения (соответственно задние и передние речевые зоны левого полушария — см. 7.3.4). При принятых в настоящее время классификациях до 20% афазических нарушений так и 110        не удается однозначно отнести к какой-либо категории.


Слышимое слово

Речь Рис. 7.1. Трехуровневая модель понимания и порождения слов (по: Ellis & Young, 1988).
повторение воспринятых на слух слов. Селективное нарушение в работе этих механизмов приводит к возникновению типичных синдромов нарушения процессов понимания и порождения слов в процессах устной речи. Обнаруженные механизмы образуют, по мнению Эллиса и Янга, трехуровневую иерархическую структуру (рис. 7.1).
На первом, наиболее низком уровне расположены два механизма: система аудиторного анализа на входе и система фонологического ответа на выходе. Аудиторный (фонологического) анализ необходим для выделения различительных признаков фонем, после чего эта информация может быть подана непосредственно на выход — для конвертирования услышанных речевых звуков в программы артикуляций, но может также поступить на следующий, второй уровень обработки, занимающийся распознаванием слов как некоторых знакомых паттернов. В пользу существования механизмов первого уровня, а также прямой связи между ними говорят клинические случаи, свидетельствующие о возможности селективного нарушения восприятия речевых или, напротив, неречевых звуков (обычно при поражениях задневисочных структур левого и соответственно правого полушарий). При так называемой слуховой фонологической агнозии пациенты, напротив, испытывают трудности в восприятий и проговаривании только незнакомых слов и произносимых неслов (псевдослов), но нормально воспринимают и повторяют знакомые слова.

111

Эти же пациенты способны правильно вслух читать неслова, что говорит о специфике процессов зрительного восприятия вербального материала, которые обсуждаются в следующем разделе этой главы.
С точки зрения авторов модели, второй уровень включает два механизма: аудиторный лексикон входа и речевой лексикон выхода. Существенной особенностью этих механизмов является то, что они работают со словом как со знакомым, но лишенным значения стимулом. Для понимания и анализа значения слова процесс обработки должен перейти на третий уровень модели, где расположен последний постулируемый Эллисом и Янгом механизм — семантическая система. Если исключить из рассмотрения семантическую систему (она подробно обсуждалась нами в предыдущей главе), то вопрос состоит в том, на каких основаниях вводятся лексиконы входа и выхода. Они должны обеспечивать возможность узнавания и повторения знакомых слов даже без понимания их значения. Нечто подобное действительно происходит при довольно редком нарушении речевых функций, которое называется глухота к значению слова. Интересно, что и в этом случае понимание тех же слов при чтении может быть сохранным, возможно, в результате опоры на еще одну систему специализированных лексических признаков, активируемых зрительным обликом слова.
Одной из центральных общепсихологических проблем является рассмотрение процессов порождения высказываний. Выготский посвятил ее анализу специальную главу своей книги «Мышление и речь» 1934 года. В этой работе его интересовала, главным образом, роль языковых значений в качестве инструмента амплификации процессов мышления («становление мысли в слове») и в меньшей степени скорее технические вопросы говорения12. Мы рассмотрим в этом подразделе в качестве примера две современные модели «движения от мысли к слову» — коннек-ционистскую (или, точнее, гибридную — см. 2.3.3) модель распространения активации Гари Делла и несколько более традиционную модель, разработанную сотрудниками Института психолингвистики общества Макса Планка под руководством Виллема Левелта. Обе описывают порождение речи как многоуровневый процесс, постулируя при этом в общем-то похожие глобальные стадии обработки информации: от семантики и синтаксиса до морфологии и артикуляционных команд. Однако в деталях эти модели различаются довольно значительно.
12 Исследования речи как средства организации собственного мышления и/или поведения — так сказать, психопрагматика в отличие от коммуникативной социопрагма-тики — до сих пор носят фрагментарный характер. Чаще всего они описываются в общих философских терминах или с помощью поэтических метафор, как это делали Выготский и А.Н. Леонтьев, цитировавшие (не совсем, впрочем, точно) Мандельштама: «Я слово позабыл, что я хотел сказать... И мысль бесплотная в чертог теней вернется»... Некоторые релевантные работы рассматриваются нами в более ранних главах (см. 4.4.2 и 5.4.1), а 112        также в следующей главе, посвященной метапознанию.

Модель Делла основана почти исключительно на данных об ошибках, возникающих при произнесении слов и коротких фраз. Обыденный опыт показывает, что подобные ошибки достаточно легко могут быть отнесены к различным категориям. Иногда речь идет просто о подмене или перестановке звуков (фонем), например, когда покупатель, обращаясь к продавцу, говорит: «Дайте мне, пожалуйста, лачку иасла». На другом полюсе находятся парасемантические замены слова в целом и даже настоящие смысловые оговорки — «вырвалось» не то, что должен был при данных обстоятельствах сказать, а то, что подумал. Модель включает четыре уровня обработки: семантический, синтаксический, морфологический и фонологический. На каждом из уровней имеются свои правила, ограничивающие выбор категории соответствующих элементов. Кроме того, все уровни объединены в интерактивную сеть. При планировании речи комбинация максимальной активации некоторого узла сети и ограничения, накладываемые правилами, определяют выбор элемента и его включение в план высказывания. Так, если правила синтаксического уровня предписывают выбор глагола, то глагол, представленный максимально активированным узлом сети, выбирается для последующей спецификации в отношении морфологического и фонологического состава и вероятного произнесения. После выбора активация этого узла падает до базового значения.
Разумеется, в подобной интерактивной сети существует множество возможностей чисто ассоциативного, в том числе и ошибочного «затекания» активации. Делл и его коллеги (Dell, Chang & Griffin, 1999) специально попытались проанализировать два класса ошибок речи: ошибки антиципации, когда слова или звуки начинают произноситься преждевременно, и ошибки персеверации, когда слова или звуки произносятся позже, чем надо (часто с элементами повтора). Основное предположение авторов состоит в том, что баланс этих двух классов ошибок динамичен и может меняться в зависимости от степени знако-мости текста, наличия четкого плана высказывания, функциональных и органических нарушений речи. Действительно, любые осложняющие говорение обстоятельства увеличивают общее количество ошибок, в особенности ошибок второго, персевераторного типа.
Левелт, Рёловс и Майер (Levelt, Roelofs & Meyer, 1999) предлагают еще
более простую архитектуру модели порождения речи. В общем случае в
ней допускается лишь однонаправленное движение информации «сверху
вниз», последовательно вовлекающее 6 различных стадий. Первая стадия
связана с концептуальной подготовкой — активацией потенциально под-
ходяших понятий. Затем следует стадия лексического выбора, причем,
согласно авторам, здесь выбирается абстрактная форма слова, так назы
ваемая «лемма», которая приобретает конкретные морфологические очер
тания (то есть становится «лексемой») лишь на следующей, третьей ста
дии. Следующие три стадии связаны с описанием послоговой структуры
слова, его фонемного состава и программированием артикуляций. Кро
ме того, вводятся две петли обратной связи, используемые говорящим
для самоконтроля: первая петля использует послоговый образ слова во
внутренней речи (на выходе стадии 4), а вторая — произносимые и не
посредственно слышимые звуки речи.                                                                                    „
110

Легко видеть, что данная модель описывает порождение отдельных слов, прежде всего существительных, а отнюдь не связной речи. Тем не менее модель выполняет важную функцию, демонстрируя, каким образом, хотя бы в принципе, может быть преодолена «пропасть между значением и словом». В качестве доказательства существования наиболее спорной в данной модели стадии абстрактных репрезентаций слова (стадия «лемм») авторы приводят классический феномен «на кончике языка» (см. 2.2.2).
Почему возникает это странное состояние, когда слово как бы известно (иногда вплоть до правильного описания отдельных его грамматических и семантических характеристик), но не может быть названо? Одно из объяснений состоит в том, что искомое, обычно низкочастотное слово по морфофонологическому рисунку похоже на другие слова, совершенно не подходящие по значению. Мониторинг внутренней речи обнаруживает грозящее семантическое несоответствие и ведет к блокировке (торможению) всего набора параметров потенциально ошибочных слов. Часть блокируемых таким образом параметров совпадает с признаками искомого слова — поэтому чем старательнее мы его ищем, тем меньше нам это удается. В последние годы получила распространение иная точка зрения, согласно которой «на кончике языка» застревают относительно непохожие на другие слова-экзоты, такие как «секстант» или «нектар». По мнению Левелта и его коллег, это может означать, что проблема состоит не в генерализованном торможении, а в отсутствии привычных — «проторенных» — путей активации морфологического состава, а затем и фонологического рисунка подобных слов. Подобная интерпретация, видимо, еще далеко «не последнее слово» в изучении этого интересного феномена.
Оживленные дискуссии ведутся сегодня в связи с вопросом о лингвистической либо нелингвистической природе самой первой в рассмотренных моделях порождения, концептуальной стадии (см. в 8.1.2 обсуждение «принципа лингвистической относительности»), а также вокруг предположения о строгой последовательности переходов с одной стадии на другую. В частности, если задача состоит в назывании изображения предмета, то анализ прайминг-эффектов свидетельствует о латентной фонологической подготовке не только доминантного («ракета»), но и второстепенных вариантов («снаряд») ответа, то есть фонологическая обработка, похоже, может начинаться еще до окончания семантической. Дальнейшее развитие наших представлений о процессах порождения речи должно учитывать возможность одновременной работы целого ряда механизмов, как внутри отдельных уровней, так и между уровнями. Это развитие, безусловно, будет опираться и на данные о закономерностях коммуникативного взаимодействия, то есть прагматики общения (см. 7.1.2), например, о необходимости постепенного введения новых для слушателя сведений, осуществляемого в контексте и на базе уже известного знания, а также о взаимном согласовании, своеобразной перекрестной настройке используемых участниками общения речевых ...       средств и смысловых контекстов (см. 7.4.1 ).

В лингвистике сосуществует несколько частично синонимичных понятий, призванных описать подвижные взаимоотношения между когнитивно «данным» — тем, что уже известно собеседнику, скажем, в качестве относительно общего контекста (здесь также могут использоваться понятия «тема» или «топик»), и тем новым и специфическим, что сообщается в конкретном предложении (соответственно «новое», «рема» или «комментарий»). В течение нескольких последних десятилетий были сформулированы различные гипотезы о том, как эти ситуативно-прагматические категории могут определять более традиционные грамматические характеристики, прежде всего порядок слов в предложении и выбор подлежащего.
Достаточно явная тенденция, заставляющая многих авторов предположить действие некоторой универсальной когнитивной закономерности переработки и интерпретации сообщений, состоит в развертывании предложения по интуитивно понятному принципу «данное ("тема", "топик") вначале». В ряде исследований вскоре было показано, что иногда может наблюдаться также раннее положение «нового», а не «данного». При этом, правда, «новое» практически всегда было еще и «наиболее существенным», выделяемым особым интонационным ударением. Кроме того, на выбор порядка слов влияло множество других внелингвистичес-ких факторов: индивидуальные знания участников беседы, развитие беседы до возникновения критического предложения, видимое окружение в момент его порождения, наличие или отсутствие временных ограничений и т.д.
Американский лингвист Расселл Томлин (Tomlin, 1997) попытался разрубить этот гордиев узел, обратившись к понятийному аппарату когнитивной психологии и методологии хронометрического эксперимента. По его мнению, выбор грамматического подлежащего определяется тем, что именно в момент формулирования высказывания находится в фокусе внимания говорящего. При прочих равных условиях, такое «подлежащее-фокус» занимает в предложении раннее положение. Это предположение Томлин проверил и частично подтвердил в психологических экспериментах, подробно рассмотренных нами в одном из следующих разделов данной главы (см. 7.3.2). Использование экспериментальных манипуляций для проверки тех или иных гипотез пока является относительно редким примером для этой родственной дисциплины, поскольку в методическом отношении лингвистика чаще всего просто ограничивается обращением к интроспекции носителя языка.
В своей критике традиционных представлений, исключавших из рассмотрения когнитивные процессы, некоторые лингвисты идут еще дальше, например, ставя под сомнение безусловную полезность грамматической категории «предложение». Так, один из пионеров когнитивной лингвистики Уоллас Чейф (Chafe, 1994) считает предложение единицей, релевантной скорее для письменной, а не для базовой устной речи. Детально проанализировав пересказ испытуемыми коротких

115

фильмов и другие примеры повседневной речевой активности, он пришел к выводу, что процесс речепорождения имеет квантовую природу, а именно осуществляется порциями по три-четыре слова. Существенно, что объем действительно нового в каждой такой выделяемой интонацией «единице» предельно ограничен — не более, но и не менее чем один новый референт или событие. Выявленная закономерность «Один элемент новой информации в интонационной единице» напоминает ограничения зрительной рабочей памяти, часто сводящиеся лишь к одному объекту за фиксацию (см. 3.2.1 и 4.2.3). Теоретические понятия, вводимые в этой связи, не имеют характера прежних дихотомий типа «данное»—«новое». Сам Чейф использует триаду понятий «данное», «доступное», «новое», трактуемых им как корреляты разных степеней активации репрезентаций референтов в сознании говорящего. «Данному» соответствует при этом более высокая степень активации, чем «доступному» и в особенности «новому»13.
В последнее время наметилось другое интересное развитие исследований речи в естественных условиях, ставящее под сомнение традиционные модели порождения речи как последовательное, строго монологическое движение «от мысли к слову» в голове говорящего. Как оказалось, при беседе двух лиц до 30% всех высказываний включают компоненты — слова и словосочетания, произносимые другим человеком (Pickering & Garrod, 2004). Кроме того, в диалогах исключительно высока доля повторов (до 80%), причем не только собственных слов и словосочетаний, но и тех, которые первоначально были введены в разговор собеседником. Очевидно, развитие диалога происходит в условиях мощных прайминг-эффектов. В результате подобной, отчасти автоматической имитации, во-первых, частично снимается задача постоянного принятия решений, а само оформление высказывания резко облегчается по сравнению с монологическими условиями (которые, собственно, и рассматривались до сих пор в большинстве моделей общения). Во-вторых, происходит взаимная настройка и сближение ситуативных репрезентаций собеседников на всех уровнях регуляции речи.
Наблюдения говорят о том, что в диалоге имеет место быстрая настройка на акцент, темп и другие фонологические особенности речи собеседника. На материале английского языка экспериментально доказана настройка на синтаксические особенности речи, так что, на-
13 Основной областью применения этих представлений служат данные о сокращенной референции (называемой в лингвистике «анафорой»), например замене в процессе развертывания речевого взаимодействия полных названий и имен местоимениями. Предполагается, что степень сокращения референции соответствует степени активации репрезентаций референтов в сознании или, быть может, в рабочей памяти (см. 8.1.2). При таком использовании психофизиологических понятий возникает некоторая опасность порочного круга, когда лингвистические эффекты будут объясняться «активацией», а само 116        это понятие будет определяться наблюдаемыми лингвистическими эффектами.


пример, использование пассивного залога одним из собеседников увеличивает вероятность его применения другим (это может быть связано с эффектами совместного внимания, joint attention — см. 7.3.2). В контексте определенного эпизода общения вполне возможно возникновение новых лексических единиц с их повторным использованием. Когда некоторое понятие может быть выражено несколькими терминами, то для устной речи ожидаемым является использование одного из них, если только партнеры не стремятся подчеркнуть различия своих точек зрения. Здесь следует отметить, что сходство отдельных параметров репрезентаций, конечно, не означает идентичности мнений. Важно, чтобы собеседники могли с помощью рассмотренных механизмов быстрее согласовать понимание референтов (например, обсуждая политические события, понять, что имеется в виду под «либералами» или кто такой «Иванов»). Имплицитная настройка распространяется и на невербальную прагматику, влияя, в частности, на пространственное структурирование ситуации общения. Так, если на некотором собрании выступающие должны выходить вперед, обращаясь к аудитории, то в зависимости от того, где встанет первый выступающий, с высокой вероятностью будут останавливаться и все последующие14.

7.2 Анализ процессов чтения
7.2.1  Развитие навыков чтения

Обучение и социокультурное развитие означают овладение системами кодирования и категоризации информации, выделение в ней типического при абстрагировании от многих вариативных деталей. Только что рассмотренные данные о специфике механизмов диалога свидетельствуют о том, что речевые функции нельзя рассматривать как заключенные в голове одного человека. Это тем более справедливо в случае чтения и письма, которые опираются на системы закрепленных на физических носителях (от глиняных табличек до современных магнитных и оптических сред) визуальных знаков. Постоянный доступ к фиксированному в письменном виде опыту снимает текущие ограничения внимания и памяти, делая принципиально возможными разнообразные трансформации текста в режиме off-line от изменения падежных окончаний и перестановки слов до стилистических манипуляций с предложениями, абзацами и
14 Приведенное наблюдение принадлежит А.Н. Леонтьеву. В качестве декана факуль
тета психологии МГУ он должен был в первой половине 1970-х годов открывать разнооб
разные собрания коллектива сотрудников и иногда использовал эту утомительную обя
занность для проведения небольших социально-психологических экспериментов по не
вербальной прагматике. Эти вопросы будут подробнее рассмотрены в конце данной гла
вы (см. 7.4.1).                                                                                                                                            117

текстом в целом. Не случайно письменная речь характеризуется значительно более сложным синтаксисом, чем устная15.
Возможно, что письменная культура играет еще более фундаментальную роль, влияя на устную речь и на ее нейрофизиологические механизмы. Так, вежливый американец, представившись по телефону, уточнит спеллинг своего имени, а образованный китаец, общаясь с жителем отдаленной провинции своей страны или японцем, может начертить в воздухе пару иероглифов, поскольку при фонетических различиях между диалектами и языками этого региона иероглифическая письменность оказывается главной основой понимания. Один из пионеров когнитивной науки Эккардт Шерер (Scheerer, 1996) даже высказал предположение, что грамматика устной речи становится полностью генеративной лишь на относительно поздних стадиях развития языка, а именно в его письменной фазе. Как полагал Шерер, объяснение ге-неративности нужно искать не в биогенетике (школа Хомского), а в специфике письменности. Для проверки этой смелой гипотезы нужны обширные исследования речи и ее нейропсихологических нарушений в сопоставимых группах грамотных и неграмотных испытуемых.
Для большинства взрослых чтение — это чрезвычайно легкий, субъективно практически автоматический процесс. Однако далеко не для всех. Даже в относительно благополучных с точки зрения массового образования странах мира около 10% населения так и не может освоить чтение. Учитывая некоторые особенности визуального кодирования акустических признаков речи и специфические трудности, с которыми сталкивается ребенок, начинающий учиться читать, удивляться приходится не столько тому, что каждый десятый ребенок не может полностью овладеть этим важнейшим культурным навыком, а тому, что остальные могут.
В самом деле, имеется ряд существенных различий в ситуациях непосредственного вербального общения и чтения. Хотя устная речь с необходимостью предъявляет более высокие требования к нагрузке на некоторую разновидность оперативной, или рабочей, памяти (см. 5.2.3), следует учесть, что в живом общении мы обычно довольно чувствительны к затруднениям, испытываемым нашими собеседниками. Объем, темп, форма и содержание сообщений гибко подстраиваются под постоянно отслеживаемые когнитивные и коммуникативные возможности партнера (Velichkovsky, 1995). Для этого в общении имеется множество средств. Очень важной является возможность вербального и невербального (жест, направление линии взора) указания (так называемый дейк-сис) на присутствующие в ситуации предметные референты. Непо-
15 Как показал в исследовании языка индейцев мавахо A.A. Кибрик (2003), относительная синтаксическая сложность характерна также для младописьменных языков, прак-
118        тически не имеющих традиций письменной культуры.

средственная речь обычно включает и множество дополнительных указаний на грамматическую организацию предложений, коммуници-руемое значение и прагматическое отношение говорящего к различным аспектам ситуации, например, посредством интонации и других просодических признаков. Письменная речь лишена такой поддержки, поскольку графемы и пунктуационные знаки не столь информативны и не ситуативны16.
Одна из трудностей овладения чтением состоит в необходимости расчленения единого зрительного образа слова, выделения в его составе отдельных графем и их фонологического кодирования. Но буквы, по крайней мере, существуют в стабильной, экстериоризированной форме. Поэтому еще более серьезной является задача когнитивного расчленения постоянно меняющегося акустического образа слова и эксплицитная дифференциация фонем с их последующей записью при помощи букв.
Разумеется, эти проблемы возникают лишь в культурах с алфавитными (алфавитно-фонетическими) формами письменности. Алфавит впервые появился примерно в 8-м веке до н.э. в Древней Греции и представлял собой модификацию знаков финикийской письменности, кодирующей лишь согласные звуки (см. также 8.4.2)17. В логографтеских письменностях, где один знак, грубо говоря, соответствует слову в целом, проблема состоит в необходимости заучивания визуального множества из нескольких тысяч логограмм. Эта проблема, впрочем, несколько упрощается тем обстоятельством, что в некоторых случаях сохраняется возможность увидеть в составе знака первоначальную комбинацию более простых, иконических элементов (см. 5.4.2). Так, в возникшей свыше 4 тысяч лет назад в долине реки Янцзы китайской письменности (она легла затем в основу японской логографики, известной как канжи или кандзи), иероглиф «шум» состоит из трех знаков вида «н», в отдельности означающих слово «повозка» — легко видеть, что это иконический знак, напоминающий два колеса и ось. Абстрактное понятие «дух» в значении «нематериальная сила» передается в канжи иероглифом, стилизирован-но изображающим рис (прототипическое растение) и поднимающиеся над ним волны пара (рис. 7.2).
По отношению к алфавитным культурам письменности, включающим все европейские языки, Юта Фриз (Frith, 1980) выделила три последовательные стадии в развитии навыков чтения: логографическую,
16    Несколько особое положение занимает здесь «язык Интернета», для которого ха
рактерно использование большого количества визуальных неологизмов, выражающих раз
нообразные ситуативно-прагматические моменты — правда, часто за счет правильности
использования более традиционных знаков препинания :-).
17    Финикийская письменность отличалась от строго силлабической (то есть слого
вой) устойчивым кодированием отдельных (а именно согласных) фонем. В таких силла
бических системах письменности, как японские кана и корейский хангул, графические
элементы обозначают слог в целом. Иначе говоря, графемы для, скажем, «со» и «са» мо
гут не иметь между собой ничего общего.                                                                                             119


Рис. 7.2. Иероглиф канжи, обозначающий понятие «дух» («энергия», «воздух»).
алфавитную и орфографическую. На первой стадии отдельные, наиболее хорошо известные ребенку слова могут узнаваться в целом или по глобальным отличительным признакам как сложные идеосинкретические картинки. К числу «читаемых» таким образом слов почти всегда относится имя ребенка и такие частотные слова, как АПТЕКА или, скажем, COCA COLA. В последнем случае необходимым элементом слова может оказаться и фирменная красно-белая окраска. Интересно, что первые написанные ребенком слова обнаруживают наряду с известной свободой в порядке следования букв выраженную нечувствительность к лево-правой ориентации как отдельных знаков, так и слова в целом. Такая нечувствительность является характерной особенностью именно зрительной памяти на картинный материал (Зинченко, Величковский, Ву-четич, 1980).
Следующая, алфавитная стадия включает две фазы, отличающиеся их отношением к семантике слова. Суть первой состоит в том, что ребенок при помощи взрослых (и еще не вполне понятным для психологов образом) оказывается способным вычленять в целостных репрезентациях слов отдельные графемы и устанавливать примерные правила гра-фемно-фонемного и фонемно-графемного переходов18. Признаком совершившегося открытия является побуквенное чтение, направленное на расчленение слова, но первоначально независимое от узнавания слова как целого. Характерны наблюдения, когда ребенок, правильно прочитав слова вслух, тут же просит взрослого: «А теперь прочти ты, чтобы было понятно». На второй фазе развития алфавитного чтения оно
18 Споры ведутся вокруг возможной роли метаязыкового компонента «фонологическое осознание», тестируемого с помощью задач на подсчет звуков в слове, вычитание или перестановки фонем и т.д. Предположение о том, что этот компонент играет критическую роль в формировании готовности к чтению, привлекательно с учетом возрастного совпадения перехода к алфавитному чтению и появления метапознавательных способностей. По некоторым данным (полученным, правда, при изучении детей с синдромом Дауна, у которых ослаблен вербальный интеллект — см. 2.3.2), правильное чтение вслух возможно и без соответствующего развития «фонологического осознания» (Cossu, Rossini & 120        Marshall, 1992).

начинает сопровождаться узнаванием, но ребенок продолжает демонстрировать трудности при прочтении нерегулярных слов. Такие слова особенно широко представлены в английском языке, но часто встречаются и в более регулярных системах письма (например, в виде аббревиатур типа BMW). Постепенно алфавитное чтение сменяется тем, что можно условно назвать стадией орфографического чтения, то есть чтения, учитывающего характерные сочетания букв и морфологию слова, а в перспективе — синтаксис предложений и, наконец, также прагматику текста (чтение «с выражением»).
Интересно, что целостное узнавание слова не исчезает в ходе развития, а, напротив, продолжает играть важную, возможно, даже усиливающуюся роль. Об этом, в частности, свидетельствуют исследования классического эффекта превосходства слова, то есть улучшения восприятия букв в контексте слова по сравнению с контекстом случайных последовательностей тех же букв. Этот эффект был обнаружен в лаборатории Вундта еще Джеймсом Кеттелом (см. 1.2.2). Несколько позднее было установлено, что узнавание слов возможно в таких условиях, когда отдельные буквы не могут быть идентифицированы (скажем, из-за малых угловых размеров букв при увеличении расстояния до страницы). Хотя эти результаты, казалось бы, свидетельствуют о существовании единиц восприятия более крупных, чем буквы и слоги, долгое время объяснение состояло в том, что в контексте слова испытуемый догадывается о незамеченных буквах по тем, которые он сумел разглядеть. В 1969 году Райхер (Reicher, 1969) показал, что эта гипотеза, ее можно назвать гипотезой постперцептивного угадывания, по-видимому, неверна. Используя пример из русской лексики, его данные можно описать следующим образом: при тахистоскопическом показе с последующей маскировкой испытуемые легче различают буквы «н» и «с» в контексте «коле-о», чем при изолированном предъявлении. Этот контекст полностью избыточен, дополняется обеими буквами до осмысленного слова примерно одинаковой частоты и, следовательно, не облегчает угадывание.
Дэвид Румелхарт (Rumelhart, 1977) предложил более сложную гипотезу угадывания по признакам, согласно которой испытуемый на основании нескольких увиденных признаков буквы догадывается, какой из возможных для данного контекста букв они могут принадлежать. Но и это объяснение ставится под сомнение тем фактом (Johnston, 1978), что степень влияния контекста на время идентификации буквы совершенно не зависит от количества букв, которые могли бы дополнить этот контекст до осмысленного слова. Соответствующие русскоязычные примеры могли бы выглядеть следующим образом:
«дух, пух»,
«куб, дуб, зуб, чуб»,
«том, дом, лом, ком, ром, сом».
Если бы речь шла об угадывании, то время операции выбора должно было бы возрастать с увеличением числа альтернатив.
Эффект превосходства слова может возникать на материале русской лексики и орфографии, причем не только при маскировке, но и в задачах

121

Таблица 7.3. Среднее время поиска (в секундах) буквы в зависимости от контекста (по: Величковский, 19826)

Условия поиска

Слова

Псевдослова

Неслова

Обычный шрифт

21 ± 0,6

24 ± 0,5

27 ± 1,2

Искаженные общие очертания

24 ± 0,8

24 ± 0,9

27 ± 1,1

зрительного поиска, более похожих на естественный, развернутый во времени процесс чтения (см. Величковский, 19826). В экспериментах, проведенных нами совместно с В.Н. Каптелининым, испытуемые должны были искать критическую букву в матрицах, составленных из 1) знакомых слов; 2) орфографически упорядоченных псевдослов и 3) неслов — случайных последовательностей букв, нарушавших правила произношения. Результаты, представленные в табл. 7.3, показывают, что в случае привычного шрифта эффект превосходства слова распадается на два примерно равных по выраженности компонента: эффект орфографической упорядоченности и эффект знакомости, разделяющих неслова и псевдослова и, соответственно, псевдослова и слова. Особый интерес представляет эффект знакомости — более быстрый поиск буквы в словах по сравнению со столь же хорошо произносимыми, но незнакомыми псевдословами. Для анализа эффекта знакомости эксперимент был повторен, но только на этот раз весь материал печатался в случайном порядке большими и маленькими буквами, что нарушало привычные очертания слов и делало текст визуально необычным. Как следует из приведенных в таблице данных, такая процедура привела к селективному исчезновению именно эффекта знакомости при сохранении эффекта орфографической упорядоченности.
Приведенные результаты свидетельствуют о том, что знакомость слова при чтении — это, прежде всего, качество имплицитной зрительной памяти. По-видимому, в результате продолжающейся годами «тренировки» мы не только приобретаем процедурное знание об общих очертаниях высокочастотных слов родного языка, но и эффективно используем его для стабилизации и ускорения процессов восприятия отдельных фрагментов слова19. О чрезвычайной устойчивости сформировавшихся навыков чтения говорят и некоторые другие результаты. Например, как уже упоминалось при обсуждении механизмов имплицитной памяти (см. 5.1.3), выработанное в результате нескольких недель тренировки

122

19 Против этой интерпретации свидетельствуют новые данные о зрительном узнавании: хотя нарушение привычных очертаний слов и влияет на скорость узнавания, это влияние не зависит от их общей частотности (Регеа & Rosa, 2002). Возможно, быстрая зрительная обработка привычных очертаний взаимодействует с фонологическим кодированием несколько более дробных, чем слово, морфологических единиц. В связи с этим было бы интересно сопоставить характер влияния частотности слова с влиянием частотности его морфем (например, корневой морфемы) на скорость поиска букв и на выраженность имплицитных прайминг-эффектов в задаче дополнения фрагмента слова (см. 5.1.3).

умение читать инвертированный текст полностью сохраняется после годичного перерыва. Выработанный подобным образом навык чтения сохраняется даже у пациентов с амнестическим синдромом, забывающих сообщенную им информацию и то, что с ними происходило, менее чем через минуту!

В более глобальной перспективе развитие навыков чтения происходит в последние десятилетия на фоне резкого роста информационных нагрузок (см. 4.4.1). Доминирующей становится тенденция к упрощению письменной речи и даже ее замене или, по крайней мере, дублированию иконическими средствами коммуникации, как это имеет место в международных аэропортах и в графическом оформлении современных компьютерных интерфейсов. Вместе с тем, распространение новых информационных технологий не обязательно чревато исчезновением традиционной письменной культуры. Особенность актуальной ситуации состоит в том, что как раз компьютерные технологии позволяют облегчить некоторые из проблем, препятствующих формированию навыков чтения. Так, например, сочетание весьма упрощенной письменной и сложной, предметно организованной зрительной информации в компьютерных играх, похоже, облегчает овладение элементарными навыками чтения. Современные текстовые редакторы также обеспечивают автоматическую поддержку правописания и перевода (см. 4.4.3).

7.2.2 Модели и нейропсихология чтения
Данные о многообразии стадий овладения письменной речью заметно повлияли на теоретические схемы восприятия слов в процессе чтения. В конце 1960-х годов англичанин Дж. Мортон предложил так называемую «логогенную модель» (рис 7.ЗА), согласно которой каждая лексическая единица репрезентирована в долговременной памяти человека в форме особой структуры — логогена. Логогены характеризуются определенными пороговыми значениями и могут активироваться как зрительной, так и акустической информацией. В этом смысле логогены должны были гомогенизировать различия между модальностями. Картина зависимости узнавания слова от различных факторов оказалась в действительности значительно более сложной. Это демонстрирует один из последующих вариантов логогенной модели Мортона (рис. 7.3Б). Наряду с отдельными системами логогенов (или лексиконов, см. 7.1.3) для зрительного и слухового входа, а также для фонологического выхода эта модель включает разветвленные структуры синтаксического и семантического анализа.
Но, по-видимому, даже эта модифицированная модель не совсем полна. Так, следует допустить более тесное взаимодействие зрительного и фонологического анализа на входе системы. В самом деле, согласно       ,„„



Рис. 7.3. Логогенная модель Дж. Мортона (по: Morton, 1980): А. Первоначальный вариант; Б. Одна из последующих модификаций.

124

данным А.Р. Лурия, подтвержденным и дополненным в последние годы, понимание сложных научно-технических текстов, по-видимому, требует участия артикуляционного и фонологического анализа — вводившиеся специально затруднения артикуляции нарушали понимание именно сложных текстов. Фонологический анализ играет ведущую роль и на самых ранних этапах формирования чтения, а также, например, при изучении математики.
Приведенные результаты демонстрируют возможность сосуществования у взрослого человека нескольких механизмов, или «путей»,

чтения. Эта проблема интенсивно обсуждается в последние десятилетия в связи с попытками моделирования процессов чтения и, в особенности, интерпретацией различных форм дислексии — синдромов вторичного нарушения чтения, возникающих в результате локальных поражений мозга (например, Jackson & Coltheart, 2001). Как оказалось, существуют выраженные межкультурные различия в локализации и способах работы подобных механизмов (см. также 1.4.3). Исследования выявили, в частности, разную кортикальную локализацию механизмов чтения двух одновременно используемых в японской культуре вариантов письменности — логографического (преимущественно правополушарного) кан-жи и слоговых (левополушарных) хирагана и катакана (Sasanuma, 1994). Но и в культурах с единственной, алфавитной письменностью насчитывается не менее трех различных «путей» от текста к звуку. Это доказывается существованием нескольких закономерно отличающихся друг от друга нейропсихологических синдромов.
Эти синдромы обычно возникают при поражениях задних отделов коры, причем характер нарушений зависит также и от латерализации, степени оносительной вовлеченности структур левого и правого полушарий. Например, при поверхностной дислексии на первый план выступает побуквенное, алфавитное чтение (английское «very much» читается пациентом, знавкомым лишь с латинским алфавитом, как «вери мух»). Возникающие при этом селективные затруднения чтения нерегулярных слов свидетельствуют о сохранности графемно-фонемного кодирования при нарушении контактов со зрительными компонентами внутреннего лексикона и с семантической памятью. При фонологической дислексии наблюдается достаточно сохранное чтение не только регулярных, но и нерегулярных знакомых слов на фоне значительных затруднений при произношении малознакомых слов и неслов.
Едва ли не самым загадочным синдромом когнитивной нейропсихологии является глубокая дислексия, которая возникает при поражениях левых височно-затылочных областей. По профилю затруднений она напоминает фонологическую дислексию, однако чтение знакомых слов здесь часто сопровождается парасемантическими ошибками, например, при предъявлении слова «Голландия» пациентка старательно читает «Бельгия», а при показе имени ее мужа внезапно говорит, что видит что-то, похожее на мужской галстук — «как у моего мужа». По-видимому, в этом случае нарушены не только графемно-фонемные преобразования, но и в некоторой степени связи между внутренним лексиконом, репрезентирующим форму слова, и собственно концептуальными структурами. Наконец, весьма редко встречаются пациенты, у которых могут наблюдаться случаи нарушения доступа к семантической памяти при сохранности всех других перечисленных выше механизмов — пациент правильно читает любые, как регулярные, так и нерегулярные слова, но совершенно не понимает их смысла.

125

Столь сложная микроструктура должна содержать множество автоматических компонентов, иначе она просто не могла бы функционировать. В самом деле, психология чтения представляет собой идеальную область для изучения перцептивных и когнитивных автоматизмов. Уоррен (Warren, 1974) в варианте задачи Струпа (см. 4.3.1) зачитывал испытуемым на слух некоторое слово, а затем предъявлял зрительно любое другое слово, напечатанное цветной краской. Оказалось, что в случае прямой ассоциативной связи между первым и вторым словом латентное время реакции называния цвета букв увеличивается. При этом испытуемые не имеют никакого намерения читать слова, устанавливать семантические связи между словами, запоминать или воспроизводить их. Этот факт считается одним из доказательств существования автоматизмов восприятия знакомых слов: семантический прайминг ускоряет чтение тестового слова, что ведет к интерференции с процессами называния цвета букв. С другой стороны, несомненно, что программы координации орфографической и фонологической обработок отчасти находятся под произвольным контролем, так как их использование зависит от сознательной установки читателя: одно и то же слово будет читаться различным образом в зависимости от того, считаем ли мы его словом английского или, скажем, немецкого языка20.
Экспериментальное выделение и анализ особенностей автоматических компонентов чтения позволили подойти к решению такой крупной психолингвистической проблемы, как проблема снятия лексической многозначности. Наличие у слов естественного языка нескольких альтернативных значений, так называемая омонимия, представляет собой чрезвычайно распространенное, можно сказать, типичное явление (многозначность положительно коррелирует с частотностью слова), и вопрос состоит в том, как в таком случае может быть организован процесс понимания.
В самом первом из релевантных экспериментов Конрад (Conrad, 1978) предъявляла испытуемым предложение, которое кончалось многозначным словом (например, словом «bank», имеющим в английском языке четыре различных значения). Контекст предложения жестко определял восприятие лишь одного из возможных значений. Вслед за этим показывалось напечатанное в цвете слово. Как и в экспериментах Уоррена, было установлено, что время называния цвета букв возрастает при наличии ассоциативной связи между двумя словами. Такое влияние оказывало каждое из значений многозначного слова независимо от того, соответствовало оно контексту предложения или нет. На материале русской лексики хорошим примером служит слово «ключ». В контексте
20 О том, что на поздних этапах формирования навыка чтения фонологическое кодирование обычно играет лишь вспомогательную роль, свидетельствуют трудности пони-126        мания следующей фонологически хорошо известной фразы: «Two bee oar knot too bee».

«На столе лежал ключ» оно примерно в одинаковой степени интерферирует с оценкой цвета слов «дверь» и «ручей». Поскольку контекст делает понимание этого слова однозначным и ассоциативный переход «ключ» (в значении «источник») — «ручей» совершенно не осознается испытуемым, можно сделать вывод, что непроизвольно и неосознанно (то есть автоматически — см. 4.3.2) осуществляется активация ряда областей внутреннего лексикона, соответствующих также не выявляемым данным контекстом латентным значениям слова21.
Близкие результаты были получены в ряде ситуаций, предполагающих более непосредственную работу испытуемого со словом, например, в задачах называния слов и лексического решения. В последнем случае испытуемые должны были как можно быстрее определить, является ли предъявленная им последовательность букв словом (см. 4.1.2). Основной особенностью результатов этих экспериментов была выраженная зависимость динамики пред настройки от времени, прошедшего после предъявления предложения с многозначной лексической единицей: уже через 300—400 мс широкая активация автоматического типа сменяется здесь строго локальными эффектами, соответствующими лишь тому значению, которое выявляется контекстом предложения (см. 4.3.2 и 7.4.2). Эти данные свидетельствуют о том, что ранняя автоматическая активация в процессах чтения напоминает знаменитый принцип начального периода китайской культурной революции 1960-х годов — «Пусть расцветают 100 цветов», но точно так же заканчивается «массовыми репрессиями», направленными на выявление «единственно правильной» интерпретации.
7.2.3 Движения глаз при чтении
Очевидным недостатком практически всех обсуждавшихся выше исследований зрительной обработки лингвистической информации является крайне искусственная ситуация разового (обычно очень непродолжительного, тахистоскопического) предъявления отдельных предложений или даже просто изолированных слов. Чтение, как развернутая во времени активность, давно изучается в психологии и физиологии с помощью разнообразных методик регистрации движений глаз (см. 2.4.2). Уже в начале 20-го века с помощью простейших из числа таких методик были установлены некоторые фундаментальные факты.
Так, прежде всего оказалось, что движения глаз при чтении (как, впрочем, и при рассматривании любой статичной сцены) представляют собой чередование неподвижных фиксаций, продолжительностью от
21 Проведенный недавно метаанализ около двух десятков более поздних эксперимен
тов данного типа подтвердил описанные результаты, выявив, однако, слабую тенденцию
в направлении значения, соответствующего контексту предложения (Lucas, 1999).                        127



Рис. 7.4. Типичная картина движений глаз при чтении.
100 до 2000 мс, и чрезвычайно быстрых, порядка 500°/с и выше, сакка-дических скачков (см. подробнее 3.4.1). Скорость саккад настолько велика, что практически всякая рецепция зрительной информации в этот короткий отрезок времени (а также непосредственно перед и после сак-кады) отсутствует. Далее, для чтения характерен пилообразный узор последовательного сканирования текста слева направо и сверху вниз — либо в противоположном направлении, как в некоторых восточных культурах. При чтении обычно наблюдаются возвраты глаз к уже прочитанным местам, называемые регрессиями. Подобные регрессии могут составлять до 10% всех саккад, причем их число положительно коррелирует с субъективной сложностью текста. Другой фундаментальный факт состоит в существовании определенного опережения глазом голоса (eye-voice span) при чтении вслух: в то время когда мы читаем некоторое слово, наши глаза находятся на несколько слов дальше. Во временном выражении это опережение может достигать более 500 мс22.
Современные  методики исследования позволяют практически мгновенно менять текст в зависимости от параметров движений глаз,

128

22 Опережение глазом (и, по-видимому, зрительным вниманием) локуса текущей сознательной активности соответствует правилу «сознание медленное внимание быстрое» (см. 4.3.3). Оно наблюдается и в ряде других случаев, например, при словесном описании предметной сцены или при игре на скрипке «с листа». Интересно, что это опережение характерно лишь для беспроблемной обработки — оно сокращается и даже совсем исчезает, если при описании сцены говорящим и/или при понимании такого описания слушателем возникают затруднения (Velichkovsky, Pomplun & Rieser, 1996).

например, от положения точки фиксации или момента начала саккади-ческого скачка. С помощью таких зависимых от положения взора изменений удалось установить, что при чтении область внимания или, по крайней мере, зона детекции зрительных событий — «функциональное зрительное поле» — распределяется относительно точки фиксации не симметрично, а со сдвигом в сторону привычного направления сканирования текста: если в экспериментах одна из букв вдруг начинала вращаться на своей позиции, то такие изменения замечались на расстоянии четырех позиций слева и 14 (!) справа от точки фиксации (Rayner & Sereno, 1994). Исследования также выявили связь продолжительности зрительных фиксаций с общей частотностью слов в языке, трудностями их понимания и соответствием семантическому и синтаксическому контексту. Наконец, существенные результаты были получены с помощью подмены некоторого периферического слова в процессе «полета» глаза в его направлении. Оказалось, что только зрительное и фонологическое, но не семантическое сходство нового слова с подмененным сокращают, при прочих равных условиях, длительность следующей за саккадичес-ким скачком фиксации. Таким образом, в периферическом зрении процессы обработки слова, по-видимому, остаются относительно поверхностными, не достигающими семантического уровня анализа.
Значительную часть известных на сегодня фактов объединяет модель E-Z Reader (от фонетического образа первого буквосочетания, произносимого как «easy» = англ. «легкий» и «reader» = англ. «читатель»), разработанная американскими психологами Э. Ричли, К. Рейнером и А. Полацеком (Reichte, Rayner & Polatsek, 2003). Эта постоянно модифицируемая авторами модель существует уже в 5-м поколении. Она, прежде всего, призвана объяснить следующие экспериментально установленные эффекты:

  1. более продолжительную фиксацию редких (низкочастотных) слов;
  2. частый пропуск высокочастотных, коротких и предсказуемых слов;
  3. более продолжительную фиксацию слов, следующих за редким сло
    вом, — так называемый «эффект перелива».

Модель постулирует целый ряд процессов во время фиксации, часть из которых осуществляется параллельно, а часть — строго последовательно. Обработка слова при его фиксации начинается, согласно модели, с фазы глобальной оценки его знакомости. Эта оценка осуществляется быстрее для частотных слов и ведет к последствиям двоякого рода. С одной стороны, ее завершение запускает процесс программирования следующей саккады, на который уходит порядка 150 мс. С другой стороны, обработка самого слова переходит в фазу более детального орфографического и фонологического анализа, ведущего к активации соответствующего узла внутреннего лексикона. Эта фаза обработки слова также протекает быстрее для частотных слов. Ее завершение — практически всегда до скачка глаза — инициирует сдвиг внимания и начало обработки (с оценки знакомости) следующего слова, пока еще находящегося в периферии зрения. То, что происходит дальше, целиком зависит от со-        ..п


СИСТЕМА ИДЕНТИФИКАЦИИ СЛОВ

СИСТЕМА ВНИМАНИЯ                        ОКУЛОМОТОРНАЯ СИСТЕМА
Рис. 7.5. Функциональная архитектура модели E-Z Reader.
отношения частотностей, а также от предсказуемости актуально фиксируемого и нового слова.
Допустим, что фиксируемое слово редкое, тогда практически все время фиксации уйдет на его обработку и работа с новым словом должна будет осуществляться по полной программе, а следовательно, в течение относительно продолжительного времени. Ясно, что в этом случае будет наблюдаться эффект «перелива». Предположим, что первое и особенно второе слово высокочастотные и легко предсказуемые, как в случае служебных слов: предлогов, артиклей и связок. Обработка второго слова тогда может быть завершена до скачка и необходимость фиксации этого слова отпадает. Действительно, лри чтении фиксируется лишь около 20% служебных слов23. Кроме частотности и предсказуемости, вероятность фиксации определяется также зрительным фактором длины слова: чем короче слово, тем больше вероятность, что оно будет пропущено. Этот фактор, очевидно, дополнительно ухудшает шансы служебных слов (обычно очень коротких) на фокальную обработку. С точки зрения общей архитектуры, данная модель предполагает взаимодействие трех уровней обработки, как это показано на рис. 7.5. Каждому из этих уровней, кстати, можно дать нейрофизиологическую интерпретацию (Price & Mechelli, 2005).
Недостатком этой наиболее детальной сегодня модели движений глаз при чтении пока еще является отсутствие интегрированных модулей,

130

23 Это можно проиллюстрировать и без регистрации движений глаз, предложив испытуемым определить количество букв «F» в следующей фразе'
FINISHED FILES ARE THE RESULTS OF YEARS OF SCIENTIFIC STUDIES COMBINED WITH EXPERIENCE OF YEARS.
Наблюдения показывают, что чем лучше читатель знает английский язык, тем хуже он справляется с этой простой задачей — количество найденных букв оказывается заниженным. Ошибки возникают в силу автоматизации обработки служебных слов и отсутствия зрительных фиксаций на них при беглом чтении

позволяющих предсказывать эффекты семантической организации текста. Споры вызывает также вывод авторов модели о невозможности восприятия семантики в периферии поля зрения. Быть может, как раз при достаточно полноценной обработке семантики слова периферическим зрением некоторое слово с относительно высокой вероятностью пропускается, что ведет к искажению статистики параметров фиксаций, так как эта статистика учитывает, главным образом, те случаи, когда слово фиксируется глазом. Значительно лучше обстоит дело с пониманием влияния синтаксических факторов. Так, в предложении «Though Peter often jogs a mile seems like a long distance» глаза англоязычного читателя надолго останавливаются на глаголе «seems», поскольку присутствие этого слова противоречит типичному объединению расположенных рядом слов «jogs» и «a mile» в одну синтаксическую группу при первом прочтении24.

В ближайшем будущем следует ожидать расширения сферы действия подобных моделей, в основном еще центрированных на чтении отдельных слов, на фразы и связный текст, а также их соединения с уже существующими программами, имитирующими движения глаз человека (такие программы начинают использоваться в роботике — см. 9.2.3). Это приведет к появлению значительно более детальных моделей движения глаз при чтении у человека. Важное практическое значение может иметь и другая линия исследований. Речь идет о возникающих в настоящее время принципиально новых системах поддержки пользователя компьютерных систем, интеллектуальных или адаптивных интерфейсах. Эти интерфейсы, в частности, могут использовать знания о характере движений глаз при нормальном чтении и при возникновении трудностей понимания для обеспечения дозированной и своевременной подсказки (см. 7.4.3). Можно надеяться, что при дальнейшем развитии этого подхода обучение чтению на родном и даже неродном языке перестанет быть такой большой проблемой, как сегодня.

7.3 Когнитивные исследования грамматики
7.3.1 Проверка трансформационной модели

«В течение более чем трех десятилетий главным препятствием на пути изучения психологических аспектов речевой компетентности была генеративная грамматика. В течение всего этого времени сторонники генеративной грамматики утверждали, а многие психологи им верили, что
24 Данное предложение является одним из примеров многозначных «предложений са
довой дорожки» (от английской идиомы to lead down the garden path «вести в тупик»,
«вводить в заблуждение»). Описание так называемой «теории садовой дорожки» (garden-
path theory), частично объясняющей данный эффект, приводится в следующем разделе
этой главы (см. 7 3 3).                                                                                                                               131

единственно интересным аспектом языка является синтаксис и что синтаксическая структура целиком определяется математическими алгоритмами, независимыми от значения, коммуникативных интенций и других психологических процессов» (Tomasello, 1996, р. 275). Это признание Майкла Томаселло — одного из представителей когнитивной психолингвистики, хорошо известного своими работами по развитию речи ребенка, свидетельствует о, по крайней мере, неоднозначной оценке вклада лингвистической школы Хомского в когнитивные исследования онтогенеза речевых процессов.
Действительно, гипотезой, определившей на десятилетия вперед тематику и проблемы исследований в этой области, была гипотеза Хомского—Миллера о том, что понимание предполагает переход от поверхностной к глубинной структуре, или так называемой «ядерной репрезентации». Под ядерной репрезентацией предложения понималась его простая, утвердительная, активная и повествовательная форма (см. 1.3.3). Иными словами, понимание включает две более или менее последовательные фазы. Сущность первой, синтаксической фазы составляет применение правил трансформационной грамматики и построение репрезентаций, состоящих из дискретных логических утверждений — пропозиций. Возможная проверка истинности или ложности этих пропозиций есть суть более поздней, семантической фазы понимания25.
На протяжении последних десятилетий Хомский неоднократно модифицировал свою теорию, в результате чего она, во многих отношениях, изменилась до неузнаваемости. Так, на смену единому списку грамматических трансформаций пришло описание нескольких модулярных субтеорий, а само понятие трансформации было заменено понятиями принципов, то есть правил универсальной грамматики, и параметров — специфических особенностей данного конкретного языка (Chomsky, 1981; 1986). Еще более радикальное изменение во взглядах Хомского произошло примерно 10 лет назад (Chomsky, 1995), когда он выступил с так называемой минималистской программой изучения языка, в которой фактически отказался от представления о глубинной и поверхностной структуре26. Вместе с тем, неизменным осталось предположение о центральной роли синтаксиса. Вокруг данного предположения и развернулись основные дискуссии. В этом разделе мы сначала рассмотрим эксперименты, направленные на выяснение сравнительной роли синтаксиса и семантики в понимании предложений, а затем
25    Одним из аргументов в пользу автономии синтаксиса служит существование син
таксически корректных и семантически бессмысленных предложений типа знаменитого
примера Хомского «Бесцветные зеленые идеи яростно спят». Подобные конструкции,
однако, не встречаются в обычной речи. Напротив, повседневные ситуации общения со
держат массу примеров фраз, сомнительных с точки зрения синтаксиса, но, очевидно,
вполне приемлемых в семантико-прагматическом отношении.
26    Краткое изложение этого развития на русском языке может быть найдено в обзоре
132        дж. Бейлина (2002).

обратимся к данным о возможном существовании специализированного модуля синтаксической обработки и проблеме его нейроанатомичес-кой локализации.
По схеме хронометрических опытов Дондерса в 1960-е годы было проведено множество работ, призванных показать, что постулируемые генеративной грамматикой трансформации требуют дополнительного времени переработки предложений. Две другие линии исследований в рамках данной гипотезы были связаны с изучением локализации внешнего звукового стимула — щелчка — относительно элементов предложения по ходу его восприятия, а также с анализом запоминания поверхностных и глубинных форм языкового материала. Но как попытки выявить хронометрические эффекты синтаксических трансформаций, так и эксперименты с локализацией щелчка не дали однозначных результатов. Данные о систематическом изменении времени в зависимости от синтаксических переменных реакции были получены только в искусственных условиях, когда предложения были лишены осмысленного контекста, а их компоновка и инструкция буквально навязывали испытуемым осуществление таких трансформаций.
Эксперименты показали, что в некоторых ситуациях сложность понимания отрицательных высказываний уменьшается или исчезает. Существуют как бы «естественные» отрицательные высказывания, которые обрабатываются быстрее, чем утвердительные. Одна из соответствующих ситуаций очень напоминает ситуацию вьщеления фигуры из фона: если в поле зрения есть восемь мячей — семь синих и один красный, то высказывание «Третий мяч не синий» подтверждается быстрее, чем высказывание «Третий мяч красный». С такой же легкостью, как и утвердительные конструкции, понимаются «отрицательные формы в контексте вероятного отрицания», примером которых может быть высказывание «Я не хочу пить» в ответ на предложение воды. Предложения, отрицательные в их поверхностной форме, но положительные по содержанию («Не открыть ли окно?»), воспринимаются за то же время, что и утвердительные предложения. Напротив, положительные по форме, но отрицательные по содержанию высказывания понимаются с некоторой задержкой.
В целом ряде прикладных работ по когнитивной эргономике анализировалась зависимость понимания инструкций (типа «Не снимать крышку, не убедившись в отключенности питания») от контекста, числа и характера отрицаний, модальности и задержки возникновения события, на которое нужно было адекватно инструкции реагировать. При этом была выявлена столь сложная картина взаимодействия факторов, что авторы ограничились выводом о необходимости эксплицитного включения ситуации и задачи в психолингвистические объяснительные схемы. Этот вывод ставит под сомнение универсальную применимость синтаксических моделей. Аналогичное развитие имело место и в отно-
133

134

шении оценки психологической реальности других трансформаций, например, перехода от пассивной к активной форме.
Исследования локализации щелчка по ходу восприятия предложения, начатые Т. Бевером и Дж. Фодором, показали,'что феноменально, с точки зрения испытуемого, щелчок смещается в сторону ближайшей границы между единицами организации глубинной структуры: процессы синтаксической группировки «вытесняют» посторонние события. Однако последующие работы выявили ряд осложняющих обстоятельств. Обычно сдвиг локализации наблюдается только тогда, когда испытуемые должны записывать предложение после прослушивания и отмечать положение щелчка. Если же им заранее даются бланки с текстом, то вместе с нагрузкой на память исчезают и сдвиги в локализации щелчка. Первоначальные результаты можно объяснить в терминах семантической, а не синтаксической группировки: «Щелчки, которые объективно предшествуют окончанию восприятия единицы значения, задерживаются, пока слушатель не разберется в ней, а щелчки, которые объективно следуют за началом некоторой смысловой структуры, воспринимаются раньше, в то время как слушатель накапливает информацию о ее значении» (McNeil, 1979, р. 20).
Во многих работах характер внутренних репрезентаций изучался с помощью задач на запоминание. В исследовании Ж. Закс (Sachs, 1967) испытуемым зачитывался текст, за которым следовало тестовое предложение. Оно было либо идентичным одному из предложений текста, либо представляло собой трансформацию его поверхностной или глубинной структуры. Например, если в тексте была фраза «Письмо об этом он послал Галилею, великому итальянскому ученому», то тестовое предложение в отрицательных пробах могло звучать так: «Он послал Галилею, великому итальянскому ученому, письмо об этом» либо «Письмо об этом ему послал Галилей, великий итальянский ученый». Когда число слогов, расположенных между исходным и тестовым предложением, становилось больше 80—100, испытуемые практически переставали замечать поверхностные грамматические изменения, хотя сразу же отмечали подмену глубинной структуры. Сам по себе этот результат еще не позволяет развести подходы, ориентированные на синтаксис или на семантику, так как глубинные изменения в данной работе также всегда меняли смысл фразы.
Свидетельства анализа и запоминания глубинной структуры были получены Левелтом (Levelt, 1974), просившим испытуемых оценить степень связи пар слов в предложении. В простейшем случае предложение «Анна берет учебники и идет в школу» должно было бы на этапе глубинной репрезентации превратиться в два более элементарных высказывания «Анна берет учебники» и «Анна идет в школу». Испытуемые устойчиво отмечали, что «Анна» и «берет» связаны между собой в исходном предложении так же, как «Анна» и «идет», хотя в терминах поверхностной близости во втором случае связь должна быть менее выраженной.

Используя аналогичные соображения, Ваннер (Wanner, 1974) показал, что эффективность слова в качестве подсказки зависит от того, сколько раз оно входит в глубинную структуру. Два из предложений были следующими: «Губернатор попросил детектива прекратить пьянство» и «Губернатор попросил детектива предотвратить пьянство». В первом из этих предложений слово «детектив» входит в три различные глубинные пропозиции, а во втором — только в две27. Как и ожидалось, в первом случае это слово было более эффективной подсказкой, чем во втором (39% правильных воспроизведений против 30%). Эффективность слова «губернатор» в этих случаях не различалась (соответственно 27 и 25%)
Близкие результаты были получены и другими авторами, однако вскоре были выявлены осложняющие эту картину моменты. Так, Ааронсон (Aaronson, 1980) обнаружила различия в репрезентации текста в зависимости от характера задачи. Испытуемые получали задачи понимания или запоминания текста, скорость предъявления которого на экране монитора они сами произвольно, слово за словом, контролировали. При установке на запоминание чтение действительно отражало синтаксическую организацию предложений и сопровождалось продолжительными остановками на границах отдельных грамматических групп. В задаче понимания время чтения возрастало только при появлении важных в семантическом отношении слов и уменьшалось при росте общей смысловой избыточности текста. Очевидно, испытуемые опираются на грамматический каркас при запоминании предложений, но в задаче понимания могут использовать и другие формы репрезентации, например зрительные представления.
Гипотеза, подчеркивающая роль зрительных образов в понимании предложений, была выдвинута Аланом Паивио. В соответствии с концепцией двойного кодирования (см. 5.3.1), он предположил, что предложения могут запоминаться как в вербальной, так и в образной форме. Конкретные предложения типа «Мальчишка бросил камень в бездомную собаку» будут обрабатываться скорее в рамках образной системы, и в памяти сохранится сконструированный зрительный образ. Хотя значение предложения при этом будет в целом передано правильно, попытки восстановить точную словесную форму приведут к большому числу ошибок. Абстрактные предложения — «Эта теория обладает предсказующей силой» — будут запоминаться как последовательности вербальных единиц. Отсюда следует, что в конкретных предложениях значение должно запоминаться лучше, чем словесная форма, тогда как в случае абстрактных предложений будет наблюдаться противоположная тенденция. Паивио и Бегг (Paivio & Begg, 1981) подтвердили данное предположение в экспери-
27 Эти пропозиции можно записать следующим образом — (ПРОСИТЬ, ГУБЕРНА
ТОР, ДЕТЕКТИВ (ПРЕКРАТИТЬ, ДЕТЕКТИВ (ПИТЬ, ДЕТЕКТИВ))) и (ПРОСИТЬ,
ГУБЕРНАТОР, ДЕТЕКТИВ (ПРЕДОТВРАТИТЬ, ДЕТЕКТИВ (ПИТЬ, КТО-ТО))).                  135

ментах с узнаванием предложений, которые подвергались синтаксическим и семантическим трансформациям. Конкретные предложения в этой работе, правда, были более понятными, чем абстрактные. Испытуемые могли не замечать изменения семантики абстрактных предложений, поскольку с самого начала плохо их понимали.
Интересная возможность выявления осуществляемых при понимании преобразований заключается в использовании селективной зрительной или вербальной интерференции. Например, процессы понимания предложений можно анализировать на фоне выполнения испытуемым задачи зрительного слежения. Согласно результатам Майкла Айзенка (Eysenck, 1977), подобная зрительная интерференция особенно сильно сказывается на понимании грамматически искаженных предложений, то есть предложений, для обработки которых с самого начала было трудно использовать синтаксические алгоритмы. Таким образом, несмотря на некоторые противоречия, накопленные данные говорят скорее о многообразии средств репрезентации значения и о существующем между ними «разделении труда». Близкий вывод можно сделать и на основании результатов исследований процессов сравнения предложений и картинок.
Первым исследованием в данной области стала работа Кларка и Чейза (Clark & Chase, 1972). Они создали ситуацию, в которой испытуемый должен был верифицировать правильность предложений в качестве описаний изображений. Те и другие были крайне просты. В одном из вариантов экспериментов испытуемым показывалось сначала утвердительное или отрицательное предложение типа «Плюс не выше звезды». После истечения определенного интервала времени предложение заменялось простым изображением, включающим плюс и звезду. Задача состояла в том, чтобы как можно быстрее дать положительный (при совпадении значения предложения и картинки) или отрицательный (при их несовпадении) ответ. Среди варьируемых факторов были временные, синтаксические и семантический фактор маркированность наречий28.
Хронометрический анализ показал, что все эти факторы влияют, причем, как правило, аддитивно, на время верификации предложений. Модель, предложенная Кларком, обнаруживает сильное влияние трансформационной модели порождающей грамматики: сначала происходит перевод поверхностной вербальной и невербальной информации в
28 Маркированные и немаркированные прилагательные (наречия) могут различаться по следующим основаниям. Во-первых, лишь немаркированный член пары может использоваться в нейтральном вопросе. Так, всегда можно спросить «Как велика ваша квартира?», но вопрос «Как мала ваша квартира?» уже предполагает, что она мала. Во-вторых, общее название соответствующего измерения (свойства) строится на основе немаркированного члена: мы говорим о «высоте», «ширине», «доброте» и т.д. В более широком исследовательском контексте маркированность, то есть выделение слова или словосочетания за счет использования специальных средств языка, сигнализирует отклонение от когнитивно нормального, ожидаемого «по умолчанию» варианта описания, поэтому она чрез-136        вычайно интересна с точки зрения анализа отношений речи и мышления (см. 8.1.2).

пропозициональную форму, а затем осуществляется поэлементное сравнение соответствующих глубинных репрезентаций. Предположим, что испытуемый сравнивает предложение «Звезда не выше плюса» с изображением плюса над звездой. Сначала кодируется предложение (ЛОЖНО (ВЫШЕ, ЗВЕЗДА, ПЛЮС)), затем изображение - (ВЕРНО (ВЫШЕ, ПЛЮС, ЗВЕЗДА)). Первыми сравниваются центральные пропозиции. Поскольку они не совпадают, то выбирается индекс ответа «ложно». После этого сравнивается содержание внешних скобок глубинных репрезентаций: (ЛОЖНО (ХХХХ)) и (ВЕРНО (ХХХХ)). Поскольку они также не совпадают, то происходит смена индекса, и испытуемый дает положительный ответ. Путем подбора параметров удалось добиться хорошего описания зависимости времени реакции от времени кодирования предложений и изображений, а также количества изменений знака индекса ответа. Предложения, содержащие маркированные термины, верифицируются медленнее, чем содержащие немаркированные, а отрицательные предложения — медленнее, чем утвердительные.
Развитием модели Кларка стала модель, разработанная его учениками Карпентер и Джастом (Carpenter & Just, 1976). Ее считают «наиболее полной» и даже «наиболее элегантной» из всех имеющихся моделей верификации. В основу этой модели положены уже привычные предположения о пропозициональных кодах и их поэлементном сравнении. Процесс сравнения осуществляется последовательно до тех пор, пока не происходит рассогласование. Несовпадающий компонент отмечается, и весь процесс повторяется с самого начала, причем на этот раз отмеченный компонент считается совпадающим. Если регистрируется одно несовпадение, то дается отрицательный ответ, если два (или вообще четное число), то предложение оценивается как правильное описание картинки. Время верификации определяется общим числом таких сравнений.
Табл. 7.4 иллюстрирует работу модели на примере верификации описаний цвета объектов. Объекты могут быть либо красными, либо черными; предложения, их описывающие, — «Объекты красные» и «Объекты не красные». Рассмотрим сначала случаи правильных утвердительных предложений. Процесс сравнения фиксирует совпадение предиката и аргумента (аргумент ОБЪЕКТЫ ради простоты в таблице опущен) пропозициональных репрезентаций (первый «+») в таблице, после чего фиксируется также второе совпадение в смысле отсутствия отрицания двух пропозиций. Испытуемый дает быстрый положительный ответ. Общее число выполненных в этом случае операций обозначается через к. Верификация ошибочных утвердительных предложений прежде всего ведет к регистрации несовпадения пропозиций (КРАСНЫЕ, ОБЪЕКТЫ) и (ЧЕРНЫЕ, ОБЪЕКТЫ). Это рассогласование отмечается выбором отрицательного индекса ответа. Затем процесс повторяется вновь, причем отмеченное рассогласование считается совпадением. Общее количество операций оказывается равным к+1. В случае ошибочных отрицательных предложений сначала фиксируется совпадение пропозиций, но затем процесс сравнения наталкивается на несовпадающие компоненты, так как предложения содержат отрицание. Это ведет к изменению индекса и повторному сканированию. После к+2 операций дается отрицательный ответ. Наконец, в случае правильных отрицательных

137

Таблица 7.4. Модель верификации предложений Карпентер и Джаста (по: Carpenter & Just, 1976)

Тип предложения

Правильное утвердительное

Ошибочное утвердительное

Ошибочное отрицательное

Правильное отрицательное

Репрезентация предложения

(КРАСНЫЕ)

(КРАСНЫЕ)

(ЛОЖНО (КРАСНЫЕ))

(ЛОЖНО (КРАСНЫЕ))

Репрезентация изображения

(КРАСНЫЕ)

(ЧЕРНЫЕ)

(КРАСНЫЕ)

(ЧЕРНЫЕ)

Сравнения

+- +

—+ +

— + ++

- - ++ +

Число сравнений

к

к+1

к+2

к+3

Ответ

«верно»

«ложно»

«ложно»

«верно»

Среднее время ответов, мс

1040

1260

1480

1710

предложений просмотр пропозиций должен повториться три раза, и число операций оказывается равным к+3. Хронометрические зависимости говорят о том, что каждый из повторных циклов продолжается примерно 220 мс. Модель допускает расширение на фразы типа «Не верно, что объекты красные», требующие до пяти дополнительных просмотров.
Несмотря на количественное подтверждение предсказаний моделей верификации изображений по их словесному описанию, тезис о единой пропозициональной форме внутреннего кода противоречит результатам других исследований. Так, Барбара Тверски (Tversky, 1969) пришла к выводу, что в задачах сравнения предложений и картинок как зрительная, так и лингвистическая информация могут кодироваться в образной форме. Свидетельством этого было влияние геометрических характеристик изображений и иррелевантность синтаксических и лексических отношений, например, той же маркированности29. В одной из последующих работ (Hunt, 1978) эксперименты Карпентер и Джаста были повторены на более широкой выборке испытуемых, причем модель объяснила около 90% дисперсии. В то же время анализ индивидуальных данных показал, что корреляция между ними и предсказаниями

138

29 Уже Кларк и Чейз (Clark & Chase, 1972) обнаружили, что влияние этого фактора неустойчиво и зависит от пространственного распределения внимания — можно получить более быстрые ответы на предложения с маркированным наречием «ниже», просто дав испытуемому инструкцию фиксировать нижнюю часть изображения (см. 7.1.2 и 7.3.2).


модели меняется в диапазоне от 0,998 до —0,887! Эти результаты вновь свидетельствуют о множестве используемых средств понимания, допускающих как словестное описание сцены, так и пространственное пред-ставЛтание содержания высказывания (см. 8.1.1 и 8.1.3).

7.3.2 От глубинной семантики к когнитивной грамматике

В логическом отношении подход Хомского продолжает традиционный анализ суждения, основанный на абстракции его субъектно-предикат-ной структуры. Как мы только что видели, выбор синтаксической формы предложения может быть связан с семантическими и внелингвисти-ческими факторами. Поэтому в последние два-три десятилетия в лингвистике и за ее пределами возрастает влияние альтернативных подходов, представители которых критикуют типичный для последователей Хомского в лингвистике и психолингвистике «синтаксоцентризм» — движение от синтаксиса как основы глубинной репрезентации к семантике и фонологии. На трактовку проблем грамматики в когнитивной психологии и лингвистике особенно большое влияние оказала теория падежной грамматики, предложенная американским лингвистом Чарльзом Филлмором в 1968 году (Fillmore, 1968)30.
Главное отличие падежной грамматики от подхода Хомского состоит в интерпретации глубинной структуры. Она не выводится из правил структурирования фразы и не содержит иерархического и вообще упорядоченного набора компонентов типа групп существительного и групп глагола. Глубинная структура падежной грамматики состоит из модального квантора (он определяет наклонение, отрицание и время) и собственно пропозиции. Эта последняя включает глагол как центральный компонент и неорганизованный набор именных групп, выполняющих функцию глубинных семантических ролей. Специальные правила, аналогичные карнаповским постулатам значений (см. 6.1.1), связывают далее с каждым глаголом список падежей, которые он допускает, предполагает или требует. Так, глагол «чинить» требует АГЕНСа, осуществляющего починку, ОБЪЕКТ и ИНСТРУМЕНТ. Другие глаголы могут быть связаны с иным набором глубинных семантических ролей. Предлоги выступают в качестве падежных морфем. Применение правил трансформации позволяет порождать множество поверхностных реализаций одной и той же глубинной структуры. Например, в предложении «Маша открыла дверь ключом», «дверь» играет роль ОБЪЕКТа, а «ключ» — ИН-СТРУМЕНТа. Эти же роли сохраняются за ними и в следующих предло-
•30 Понятие «падеж» было центральным уже в психологии речи Вильгельма Вундта,
который пытался в своих поздних работах проследить изменение падежных ролей, отве
чающих на вопросы «когда?», «где?», «откуда?», «чем?», в ходе культурно-исторического
развития языка.                                                                                                                                        139

жениях: «Дверь была открыта ключом», «Ключ открыл дверь» и даже просто «Дверь открыта».
Поскольку глубинная репрезентация строится в падежной грамматике на основе глагола (предиката), этот подход в целом более отвечает духу современной логики, трактующей пропозиции по аналогии с математическими функциями, имеющими вид предикат{аргумент(ы)) (см. 2.2.3 и 6.1.1). Интересной является и предложенная Филлмором содержательная интерпретация ролей, основанная на метафоре внутреннего театра: «Предположим, что мы рассматриваем идею, выражаемую простым предложением, по аналогии со сценой или актом некоторой пьесы, и предположим, что мы думаем об участниках языкового общения как о драматургах, работающих в рамках определенной театральной традиции, которая ограничивается фиксированным числом типов ролей, с тем дополнительным ограничением, что не более чем одно действующее лицо может выступать в данной роли в любой отдельной сцене» (Fillmore, 1968, р. 383).
Этот подход инициировал ряд работ, направленных на проверку вывода о критическом значении сказуемого по сравнению с подлежащим. Так как в порождающей грамматике падежи являются элементами поверхностной, а не глубинной структуры, Хомский продолжал настаивать, что «нет никакой альтернативы выбору Глаголов в терминах Существительных». Экспериментальные данные скорее говорят об обратном. В экспериментах немецкого психолингвиста X. Хёрманна (Hoermann, 1981) испытуемые заслушивали и тут же повторяли фразы, искаженные белым шумом. По сравнению с другими грамматическими классами восприятие глаголов было особенно трудным. Но правильное восприятие глагола улучшало восприятие субъекта и объекта в большей степени, чем их восприятие улучшало восприятие глагола. В другой работе испытуемые сравнивали содержание некоторой картинки, например, изображающей машину, врезавшуюся в дерево, и простых предложений типа «Поезд врезался в дерево», «Машина объехала дерево», «Машина врезалась в стену» и т.д. Быстрее всего обнаруживалось несоответствие глаголов. Это подтверждает мнение о ключевом положении глагола (предиката) в структуре предложения.
Более детальный анализ глубинных семантических ролей наталкивается, однако, на известные затруднения. С помощью различных вариантов методики классификации были предприняты попытки проверить психологическую реальность таких ролей, как АГЕНС, ИНСТРУМЕНТ, ОБЪЕКТ, и, в некоторых производных от падежной грамматики психолингвистических теориях (Hoermann, 1981), роли ПАЦИЕНС (она может быть представлена ролью Ивана в предложении «Иван страдает от зубной боли»). Лучше всего удавалась классификация АГЕНСов, затем следовали ПАЦИЕНС, ИНСТРУМЕНТ и ОБЪЕКТ. К сожалению, успешность классификации была довольно невысокой, так что данные в 140

целом не подтвердили существования выделенных падежных отношений. Предсказываемое падежной грамматикой сходство между различными группами глаголов не удается обнаружить и с помощью иерархического кластерного анализа. Таким образом, теоретически не удается добиться создания законченной и внутренне уравновешенной концепции. Некоторые падежи оказываются связанными с большинством глаголов, другие — только с некоторыми из них, а естественный вопрос об общем числе ролей до сих пор остается открытым31.
Разумеется, для любого направления, которое, подобно генеративной грамматике, в конечном счете ориентировано на математику, эти результаты были бы серьезным нарушением эстетической эвристики (см. 1.1.1). Опыт использования логико-лингвистических подходов в психологии речи показывает, однако, что успешность этой работы определяется не столько мощностью используемого формального аппарата, сколько учетом особенностей повседневных форм активности. Так, особая семантическая «нагрузка» глаголов объясняется тем, что они позволяют представить мир в терминах целей и действий партнеров общения (этого мнения, в частности, придерживался Карл Бюлер). Полезность такого, несколько нестрогого взгляда может быть проиллюстрирована исследованиями развития речи ребенка. Как отмечалось выше (см. 7.1.2), здесь после однословных «холофраз» и двухсловных конструкций в возрасте примерно двух-трех лет наблюдается фаза так называемых глагольных островов — феномен, демонстрирующий зависимость синтаксических средств от контекста использования тех или иных глаголов32.
Представление о центральном положении глагола используется и в ряде компьютерных моделей процессов понимания (см. 6.4.1 и 8.1.1). Примером служит ранняя модель CDT (по первым буквам английского названия «теория концептуальной зависимости»), разработанная Р. Шенком и Р. Эйбельсоном (Schank & Abelson, 1977; Шенк, 1980), и ее многочисленные последующие модификации. Эти авторы стремятся к возможно более полному описанию знания, выходящему за рамки того, что непосредственно представлено в анализируемом тексте. Прежде всего они пытаются построить падежные схемы глаголов и тем самым свести разнообразные предложения и отрывки текста, имеющие одно и то же значение, к единой глубинной репрезентации. Это достигается благодаря выделению 7 примитивных семантических компонентов глаголов, называемых АСТами (их не следует путать с названием глобальной
31    Серьезным недостатком ориентированной на первичность глаголов падежной грам
матики является порочный круг в логическом обосновании. Некоторый глагол считается
?-местным предикатом, поскольку у него ? дополнений, после чего возможность именно
? дополнений объясняется тем, что данный глагол — ?-местный предикат (Goldberg, 1995).
32    Наиболее детально разработанной лингвистической концепцией, оперирующей
понятием «роль» (или «макророль»), в настоящее время являетсяреференциально-ролевая
грамматика
Р. Ван Валина (например, Van Valin, 1993).                                                                    141

когнитивной модели Дж.Р. Андерсона — см. 6.4.1). Выделяемые на основании интуитивных соображений и описываемые в довольно причудливой графической форме АСТы обозначают действия различного рода — от изменения пространственного положения и отношений владения (PTRANS и ATRANS) до обращения внимания и вокализаций {ATTEND и SPEAK).
Наиболее общей единицей организации знания эти авторы считают' сценарий («скрипт»), под которым понимается связная последовательность событий, ожидаемых актором и включающая его как участника или наблюдателя (см. 6.3.3). Сценарий состоит из так называемых виньеток — вербальных или невербальных репрезентаций событий, актора, его поведения, окружения и т.д. Виньетка рассматривается как набор схем (например, мать кормит ребенка). Каждая схема — КОРМИТЬ (МАТЬ, РЕБЕНОК) — имеет имя и состоит из конфигурации атрибутов, которые группируются вокруг глагола и определяются его глубинными семантическими компонентами. Предполагалось, что построенные на базе CDT программы могут быть использованы для перевода, составления резюме и осуществления выводов из текстуальной информации, однако, как и в случае большинства глобальных когнитивных моделей, технически реализовать эти планы, хотя бы в первом приближении, пока не удалось (см. 6.4.1 и 8.1.1). Возможной причиной этого является недостаточная гибкость модели, опирающейся на ограниченное число фиксированных в памяти семантических заготовок33.
Работы Филлмора последующих двух десятилетий были направлены на создание более гибкого подхода, который позволил бы объединить лингвистические представления о построении высказывания с психологическими данными о практически бесконечном многообразии ситуативно порождаемых значений (Филлмор, 1988; Fillmore, 1982). Этот новый подход получил название фреймовой семантики, что подчеркивает его сходство с работами в области психосемантики и искусственного интеллекта (см. 6.3.1 и 6.4.2). Главное в нем — попытка показать, каким образом ситуативный контекст может формировать значение понятий.
Любое понятие, с этой точки зрения, имеет лишь потенциальные значения, которые раскрываются во взаимодействии с контекстом, или фреймом. Так, понятие РИСКОВАТЬ в качестве фрейма имплицитно содержит целый спектр ролевых валентностей, в число которых, наряду с АГЕНСом и потенциально ПАЦИЕНСом, также входят такие конструкты (или конструкции), как НЕОПРЕДЕЛЕННОСТЬ, ШАНС, ВРЕД, ПОЛЬЗА, ЦЕННОСТЬ, ДЕЙСТВИЕ и т.д. Лишь часть из них актуализируется в конкретном коммуникативном эпизоде. Фреймы, следова-
33 В 1970-е годы И.А. Мельчуком, А.К. Жолковским и Ю.Д. Апресяном была разработана потенциально более интересная модель «Смысл <=> Текст», которая описывала до 30 глубинных семантических ролей и использовалась для автоматизации процессов технического перевода (Мельчук, 1974; 1995). Эта модель успела в те годы оказать влияние на 142        нейролингвистические работы (Лурия, 1975).

тельно, способны продуктивно влиять на семантику возникающего у слушателя/читателя образа ситуации. Зависимость значений от контекста объясняет распространенность явлений полисемии и омонимии (многозначности слов — см. 7.2.2), а также влияние культурного окружения на значение отдельных терминов, осложняющее или даже делающее практически невозможным их перевод. Филлмор рассматривает в качестве фреймов также и ситуации выполнения речевых актов (см. 7.1.2), для понимания которых определяющим является учет намерений говорящего. Эти феномены будут подробнее рассмотрены в последнем разделе главы, в рамках теории «ментальных пространств» (см. 7.4.2).
Работы Филлмора по фреймовой семантике органично вошли в новое научное направление, получившее название когнитивной лингвистики. С конца 1980-х годов все большее число лингвистов идентифицируют себя с этим направлением, общими признаками которого являются, с одной стороны, ментализм (см. 2.2.1 ), а с другой — критическое отношение к гипотезе о центральной роли синтаксиса, характерной для генеративной грамматики. Так, Р. Лангакер (Langacker, 1987; 1991) создал теорию, названную им когнитивной грамматикой. Основное положение этой теории состоит в трактовке речевой коммуникации как процесса концептуализации — воссоздания средствами концептуальных структур (см. 5.3.3) той ситуации, которую имел в виду говорящий или пишущий. Для решения этой задачи используются как семантические, так и синтаксические средства. Синтаксические средства отличаются лишь тем, что имеют относительно фиксированный и часто специфичный для конкретного языка характер. Например, в русском языке различие между выражениями «он кричал» и «он крикнул» состоит в присутствии суффикса «ну», сигнализирующего, что крик раздался только один раз. В английском языке для передачи той же информации приходится использовать особую лексическую единицу: «Не cried (was crying) once».
Лангакер, как и многие другие когнитивные лингвисты, старается построить общую классификацию лингвистических средств, используе-. мых для конструирования образа ситуации. Эти средства можно было бы назвать «операторами конвенционального воображения». Упоминание «конвенциональности» продуктов применения этих средств оттеняет их отличие от средств, используемых в творческом мышлении (в этой книге мы называем последние «метаоператорами воображения» — см. 8.1.3). В табл. 7.5 приведен с некоторыми изменениями и значительными сокращениями перечень лингвистических средств построения образа ситуации из обзорной работы Крофта и Круза (Croft & Cruse, 2004).
Различия между приведенными в этой таблице четырьмя группами механизмов не строги и часто определяются лишь интуитивными соображениями. Мы попытаемся кратко проиллюстрировать каждую группу   , механизмов примерами из русского языка. Эффективное управление вниманием слушателя/читателя имеет в процессах коммуникации едва        < м?

144

Таблица 7.5. Основные группы лингвистических средств управления конвенциональным воображением (по: Croft & Cruse, 2004)

Внимание/ выделение

Сравнение/ оценка

Перспектива/ ориентация

Структурирование/ гештальт

Фокусирование
Распределение/ охват
Динамика во времени

Категоризация Метафоризация
Фигура/фон
(центр/ периферия)

Точка зрения Дейксис/эмпатия
Субъективность/ объективность

Схематизация Уравновешивание
Относительные/ абсолютные-термины

ли не самое главное значение (см. 7.4.3). Такое управление может обеспечиваться за счет варьирования контекстов, прежде всего, посредством выборов подходящего семантического фрейма, как в случае двух следующих предложений:
«Новые Новости» разоблачают коррупционеров,
«Новые Новости» стоят десять рублей.
Первое предложение здесь, очевидно, фиксирует наше внимание на деятельности редактора и журналистов некоторого печатного издания, тогда как второе — на газете как объекте торговли. Фокусирование внимания далее может быть очень узким или же скорее распределенным, охватывающим несколько объектов. Оно также может быть симультанным, как это обычно бывает при использовании групп существительного, или развернутым во времени, что достигается использованием разнообразных глагольных групп.
Вторая группа механизмов рассматривается Лангакером и его коллегами в контексте глобальной когнитивной операции СРАВНЕНИЕ (о значении которой писал еще Кант — см. 1.1.3). Всякое СРАВНЕНИЕ потенциально может становиться ценностной и эмоциональной оценкой. Описывая некоторые события как «народное восстание» или «вооруженный мятеж», мы не только даем им содержательное определение, но одновременно и оцениваем их с точки зрения желательности поддержки или осуждения. Не останавливаясь здесь на МЕТАФО-РИЗАЦИИ, которая обсуждается в следующем разделе, отметим, что в современной лингвистике получили широкое распространение геш-тальтпсихологические понятия фигуры и фона (см. 1.3.1 и 8.1.2). При этом используется тот факт, что один из членов сравнения всегда выполняет функцию фона, или системы отсчета (Talmi, 1978). Так, мы говорим «Дерево рядом с домом», но не «Дом рядом с деревом», если только дерево не является феноменально большим или замечательным в каком-то другом отношении, а дом — совершенно незначительным, скорее домиком или хижиной. Легко видеть (как мы отмечали в предыдущей главе — см. 6.3.1), что, манипулируя в речи отношениями

фигуры и фона, можно внушить слушателю/читателю то или иное представление ситуации34.
Еще одна группа механизмов связана с тем, как индивидуальная позиция участника речевого общения влияет на выбор лингвистических средств. При этом часто, но отнюдь не всегда, доминирует эгоцентрическая перспектива. Как в пространственно-временном, так и в эмоционально-оценочном отношении мы, по выражению Пиаже, способны к известной «децентрации», преодолению эгоцентризма. В некоторых языках мира пространственная лексика вообще имеет абсолютный, эк-зоцентрический характер (см. 6.4.3 и 8.1.2). При понимании повествовательных текстов мы обычно принимаем в нашем воображении перспективу протагониста, так что если в ходе описываемых событий какие-то объекты закрываются в его (героя повествования) «поле зрения», то потом они также труднее припоминаются нами, несмотря на их эксплицитное упоминание в тексте (см. 7.4.1). Наконец, последняя, четвертая группа механизмов, которую мы только упомянем здесь, относится к информационному оформлению ситуации в речи. Ясно, что образ ситуации не должен быть перегружен деталями, поэтому важную роль играет схематизация и организация передаваемых сведений, эффективное описание релевантных признаков и взаимоотношений объектов.
В одной из последних работ Крофт и Круз (Croft & Cruse, 2004) характеризуют когнитивную лингвистику с помощью трех постулатов-гипотез:

  1. Язык не является автономной (модулярной) способностью, отде
    ленной от других когнитивных процессов и способностей.
  2. Грамматика определяется процессами концептуализации.
  3. Языковая компетентность появляется лишь в результате использо
    вания языка.

Легко видеть, что данная исследовательская программа диаметрально противоположна идеям Хомского, под влиянием которых в свое время и произошел когнитивный переворот в психологии и лингвистике (см. 1.3.3). Несмотря на их недоказанность, временами даже явную спорность, эти постулаты-гипотезы объективно открывают возможность более широкого, чем до сих пор, применения понятий и методов из экспериментальной когнитивной психологии, нейропсихологии и нейро-информатики в лингвистических исследованиях.
34 Пример такой манипуляции можно найти в «Повести о Ходже Насреддине» В. Со
ловьева: «"Доходное озеро и принадлежащие к нему сад и дом, — сказал он многозначи
тельным, каким-то вещим голосом и поднял палец. — Очень хорошо, запишем! Запишем
в таком порядке: дом, сад и принадлежащий к ним водоем. Ибо кто может сказать, что
озеро — это не водоем? С другой стороны: если упомянутые дом и сад принадлежат к
озеру или, иначе говоря, к водоему, ясно, что и водоем в обратном порядке принадлежит
к дому и саду. Пиши, как я сказал: дом, сад и принадлежащий к ним водоем!" — По лов
кости это был удивительный ход, сразу решивший половину дела: простой перестанов
кой слов озеро волшебно превратилось в какой-то захудалый водоем, находящийся в не
коем саду, перед неким домом».                                                                                                              145



Рис. 7.6. Экспериментальный материал из исследования роли направленности внимания в грамматическом структурировании высказывания (по: Tomhn, 1997).
Обращение представителей когнитивной лингвистики к методам и понятиям когнитивной психологии иллюстрирует уже упоминавшаяся выше (см. 7.1.2) работа Расселла Томлина (Tomlin, 1997). Этот автор выдвинул предположение, что выбор референта для грамматического подлежащего определяется тем, на что в момент порождения высказывания направленно наше внимание. В экспериментах испытуемым показывались динамические сцены, вроде изображенной на рис. 7.6. Испытуемые должны были в реальном масштабе времени описывать наблюдаемые события, отслеживая зрительно тот из двух объектов, который отмечался внезапно появлявшейся стрелкой (она видна на рис. 7.6 во втором кадре справа). Предъявление стрелки слева или справа было одной из независимых переменных этого эксперимента и использовалось для управления положением фокуса зрительного внимания испытуемого. Второй независимой переменной было то, какая из рыб, красная (обозначена на рисунке черным цветом) или белая, съедала другую. Результаты показали, что испытуемые действительно чаще описывали рыбу, на которой экспериментатор фиксирует их внимание, посредством подлежащего (в английском и ряде других языков), а выбор активного или пассивного залога предложения определялся ими вторично, в зависимости от того, была ли отслеживаемая рыба АГЕНСом и ПАЦИЕНСом акта поедания35.

146

ъНекоторые испытуемые в этом эксперименте использовали для описания ситуации только активные высказывания (по схеме «АГЕНС на первом месте»). Томлин объясняет это тем, что в критический момент внимание этих испытуемых непроизвольно привлекалось движениями челюстей активной рыбы. По нашему мнению, речь идет о самостоятельной стратегии порождения и понимания «Первое существительное предложения есть АГЕНС действия». Эта стратегия широко представлена в речи пациентов с аграмматиз-мом, а также в нормальной детской речи (что, конечно, ведет к ошибочной интерпретации предложении типа «Тигра поцеловал лев» — см. Vehchkovsky, 1996).

При обсуждении возможных механизмов выбора грамматического подлежащего для всякого образованного психолога (см., например, «Мышление и речь» — Выготский, 1982—1984) сразу же возникает вопрос о так называемом «психологическом подлежащем», которое обычно выделяется в разговоре особой ударной интонацией и в функции которого вполне может выступать даже глагол:
Маша гладила кошку,
Маша гладила кошку,
Маша гладила кошку.
Феномен психологического подлежащего, судя по всему, возникает в контексте противопоставления с предыдущим, более широким дискурсом, например, «Маша гладила кошку, а не собаку, как вы почему-то утверждаете» либо «Маша гладила кошку и ни разу не дернула ее за хвост». Этот феномен, очевидно, не может быть объяснен действием факторов моментального пространственного распределения внимания, которые были достаточными для интерпретации результатов, полученных в экспериментах Томлина.
В теоретическом плане основные усилия направлены сегодня на создание полноценной альтернативы генеративной грамматике как теории языка. Начало этой работе было положено Лангакером в его когнитивной грамматике. Большая группа ведущих когнитивных лингвистов (в том числе Лакофф, Филлмор, Крофт, их ученики и сотрудники) работает над вариантами грамматики конструкций. Под «конструкциями» понимаются репрезентации фреймового типа, обычно включающие как синтаксические (форма), так и семантические (содержание) компоненты36. Наличие формы и содержания говорит о том, что конструкции представляют собой знаки. Они, следовательно, имеют символьный характер и в совокупности образуют особую область концептуальных структур (то есть относятся к тому слою высших символических координации, который мы предлагаем называть «уровнем Е» — см. 5.3.3). Важно подчеркнуть, что конструкции обладают целостными, гештальтными качествами — их значение не может быть выведено из суммы значений их частей (см. 1.3.1). Поскольку конструкции снабжены синтаксическими валентностями, в их отношении заранее известно, как они могут или должны себя вести при объединении с другими конструкциями. При столь детальной предварительной подготовке лингвистических единиц их
36 Конструкции образуют сетевые структуры, в которых выделяются подобласти, име
ющие вид таксономических иерархий с наиболее абстрактными конструкциями в верх
ней части. Такую локальную вершину, например, может образовывать схематическая кон
струкция переходного глагола. Из соображений экономии ресурсов памяти внутри иерар
хии часто постулируется наследуемость свойств вышестоящих инстанций. С другой сто
роны, казалось бы, избыточное повторение данных об абстрактных синтаксических свой
ствах в конкретных конструкциях, нагружая память, могло бы облегчить оперативную
обработку. Споры вызывает также природа синтаксических спецификаций. Некоторые
авторы (например, Р. Лангакер и У. Крофт, автор «радикальной грамматики конструк
ций») считают, что эти спецификации в их основе также являются семантическими.                        147

комбинаторная обработка on-line значительно упрощается и может протекать по принципу «Соединяй что угодно с чем угодно — но только с тем, что подходит!».
По-видимому, в ближайшем будущем могут быть предприняты попытки синтеза этого подхода с развивающимися в том же направлении работами по невербальной семантике (таких как теория перцептивных символов Лоуренса Барсалу — см. 6.4.2). Поскольку число различных «когнитивных» и «психологически мотивированных» грамматик приближается к двум десяткам, можно ожидать появления исследований, направленных на проверку психологической реальности отдельных положений этого нового поколения теорий языка. Интересный пример эмпирического обоснования семантической интерпретации синтаксиса может быть найден в психолингвистических работах, опирающихся на использование латентного семантического анализа (см. 6.1.1 и 6.4.2).
Раскол сообщества исследователей языка на сторонников и противников «синтактоцентризма» стал привычным атрибутом профессиональных дискуссий. Но затянувшийся период «лингвистических войн», кажется, заканчивается. Видный сторонник и ученик Хомского Рэй Джекендофф (Jackendoff, 2002) попытался в последнее время восстановить связь теоретической лингвистики с остальной когнитивной наукой. Он подчеркивает генеративность не только синтаксиса, но также семантики и фонологии. Все три области, согласно Джекендоффу, совершенно равноправны. Они образуют три параллельных модуля, попарно связанных между собой интерфейсами, которые понимаются как особые процедуры установления соответствия основных областей обработки между собой, например как процедуры артикуляции слова, выражающего определенное значение (интерфейс семантики и фонологии), или как процедуры согласования данного фонологического паттерна с другими (интерфейс фонологии и синтаксиса). Интересно, что слова трактуются как обладающие генеративным потенциалом правила их использования, что ведет к процедурной интерпретации внутреннего лексикона (близкая идея возникла раньше в рамках процедурной семантики — см. 6.1.3).
Признание генеративности семантики ведет к тому, что в этой модели синтаксис освобождается от непомерной нагрузки контроля за семантикой и фонологией, возложенной на него в теориях, ориентированных на работы Хомского37. По мнению Джекендоффа, в области
37 Следует отметить, что на последнем витке развития идей Хомского, в его минималистской программе изучения языка (Chomsky, 1995), лексикону были переданы некоторые аналогичные функции, ранее выполнявшиеся правилами трансформации. Кроме того, минимализм постулирует две параллельные системы реализации речи — артикуляторно-перцептивную и концептуально-интенциональную. Этим двум системам соответствуют также два интерфейса применения правил (различных в разных языках), названных фо-148        нетической формой {PF, Phonetic Form) и логической формой (LF, Logical Form).



Рис. 7.7. Параллельная модель Джекендоффа (по: Jackendoff, 2002).

собственно синтаксиса, или «протосинтаксиса», при этом могут в конечном счете остаться лишь несколько очень простых эвристических принципов интерпретации и порождения, например, «Первое существительное предложения есть АГЕНС действия» и «Фокус стоит на первом месте». Возникновение и автоматизация тех или иных специфичных синтаксических процедур является результатом взаимодействия протосинтаксиса с конкретным речевым окружением, выделения в последнем устойчивых и предсказуемых паттернов словосочетаний. Легко видеть, что протосинтаксис фактически оказывается чем-то вроде «про-топрагматики», а именно интуицией того, что при недостатке времени надо в первую очередь успеть сообщить самое важное — что делает АГЕНС отслеживаемых нами событий (\felichkovsky, Kibrik & Velichkovsky, 2003).

7.3.3 Современные модели и данные нейролингвистики
В целом полученные в когнитивной психологии и лингвистике результаты свидетельствуют скорее против разведения синтаксиса и семантики как независимых фаз или «уровней» обработки. Некоторые, семантически-ориентированные подходы к анализу глубинной структуры предложения, такие как падежная и фреймовая грамматики, были только что рассмотрены. Заключительная часть данного раздела посвящена

149

актуальным проблемам синтаксического анализа в психо- и нейролинг-вистике. Перед тем как обратиться к нейролингвистическим исследованиям, мы кратко обсудим две психолингвистические модели понимания предложений, центральные для дискуссий последнего десятилетия. Первая из этих моделей, получившая название теории садовой дорожки (garden-path model), в значительной степени традиционна. Вторая модель, теория множественных ограничений {constraint-based theory), имеет коннекционистскую архитектуру и предполагает одновременное использование различных источников информации.
«Садовая дорожка» означает, что описание глубинной структуры предложения строится строго последовательно и в каждый данный момент времени учитывает лишь одну синтаксическую интерпретацию. Кейт Рейнер и Александр Полацек (Pollatsek & Rayner, 1990) выделяют несколько других принципов, ускоряющих понимание. Предполагается, во-первых, что первоначальная интерпретация строится без учета значения и контекста, во-вторых, предпочтение отдается простейшему (в отношении числа синтаксических групп) решению и, в-третьих, при последовательном просмотре предложения некоторое слово приписывается к непосредственно предшествующей синтаксической единице, если это грамматически возможно. Данная модель вполне успешно объясняет типичные затруднения при понимании некоторых, синтаксически не вполне однозначных предложений38.
Накапливаются, однако, и противоречащие этой модели наблюдения. Принцип приписывания слова к ближайшей синтаксической единице нарушается, например, в случае следующего сложноподчиненного предложения: «Шпион застрелил сына полковника, стоявшего на балконе». Хотя модель предсказывает, что преимущественным прочтением должно быть «на балконе находился полковник», англоязычные испытуемые чаще склоняются к варианту интерпретации, при котором на балконе находился сын. Этот эффект можно попробовать объяснить с учетом прагматики ситуации — в силу чрезвычайности события убийства в фокусе внимания говорящего должен был бы находиться именно сын полковника. Но моделирование семантико-прагматических факторов представляет собой особенно сложную задачу, поэтому сторонники теории садовой дорожки хотели бы ее избежать39.
38    В недавнем обзоре И. А. Секериной (2002) анализируются две другие модели анали
за предложения: модели главного слова (head-driven parsing model) и структурного детер
минизма (structural determinism parsing model). Как и в случае модели садовой дорожки (ее
автор обзора называет «моделью заблуждения», учитывая идиоматическое значение вы
ражения «to lead down the garden path» — см. 7.2.3), речь идет о моделях последовательной
синтаксической обработки.
39    Исследования на материале русского языка, в которых использовались многознач
ные предложения как с аналогичным, так и менее драматическим содержанием, выявили
влияние ряда других факторов, включающих длину и структурную сложность придаточ-
150        ного предложения (Фёдорова, Янович, 2005).

Модель удовлетворения множественных ограничений была разработана в 1990-е годы (например, Seidenberg & MacDonald, 1999). Под «множественными ограничениями» имеются в виду частично избыточные источники сведений, используемых для ограничения степеней свободы интерпретации. Сильной стороной модели является включение семантической информации (контекст и лексическая семантика) в качестве фактора, участвующего в выборе синтаксического описания. Модель содержит ряд неиросетевых компонентов, разработанных ранее для демонстрации возможности решения синтаксических задач — они предсказывают грамматическую категорию следующего слова в предложении, проверяю! правильность построения прошедшего времени глагола и т.п. — без использования правил генеративной грамматики (см. 2.3.3). Возможные интерпретации генерируются и обрабатываются одновременно, каждая со своими динамически меняющимися коэффициентами активации, сравнение которых и определяет конечный выбор. Кроме того, модель способна обучаться. При этом учитывается, что различные синтаксические интерпретации, в равной степени допустимые с точки зрения грамматики, различаются между собой по частоте возникновения в языке.
Как мы отмечали выше, одно из важнейших достоинств моделей искусственных нейронных сетей — изменение параметров функционирования в ходе обучения — одновременно, парадоксальным образом, затрудняет окончательную оценку их эффективности, поскольку у исследователей всегда есть возможность улучшения («подгонки») демонстрируемых моделями результатов при дополнительной тренировке сети. Безусловно, существуют принципиальные ограничения коннекциони-стского подхода к синтаксису речи, но попытки их строгого описания практически отсутствуют — за исключением относительно ранней работы известного голландского психолингвиста Виллема Левелта (Levelt, 1990), который в целом отрицательно относится к коннекционизму, считая его тупиковым направлением, возвращающим лингвистику и психологию в эпоху «до Хомского».
Основу оценки должен составлять вопрос о том, насколько правдоподобны модели типа теории множественных ограничений с психологической точки зрения. Правдоподобным, конечно, представляется интуитивный характер синтаксической обработки, хотя в результате школьного и университетского образования мы оказываемся способными к использованию эксплицитных правил грамматики. Правдоподобно и подтверждается экспериментально участие семантики в выборе синтаксической интерпретации. Напротив, гипотетическим остается предположение об одновременной проработке нескольких синтаксических интерпретаций. Нечто подобное доказано для случая снятия семантической многозначности слов — быстрая одновременная активация целого спектра возможных значений постепенно сменяется активным уточнением и подавлением избыточных вариантов (см. 4.3.2 и 7.2.2). Однако в случае синтаксической неопределенности (ср. «На-

151

казание охотников было ужасным» или «Мужу изменять нельзя») эксперименты, направленные на проверку психологической реальности обработки латентной в данный момент интерпретации, пока еще не были проведены.
Как обстоит дело с выявлением нейрофизиологических механизмов речи, в особенности механизмов синтаксической обработки? Этот вопрос важен как практически, для улучшения методов нейропсихоло-гической реабилитации, так и теоретически, например для проверки гипотезы о врожденности и фиксированности мозговой локализации когнитивных модулей. Простая картина, предполагающая существование двух модулей речевых механизмов — зоны Брока для синтаксиса/ произношения и зоны Вернике для понимания/лексической семантики, — оказалась несколько осложненной новыми данными40.
Хотя участие зоны Брока в синтаксической обработке подтверждается результатами трехмерного картирования изменений мозгового кровотока (rCBF — regional cerebral blood flow) у взрослых здоровых испытуемых, клинические данные свидетельствуют о том, что пациенты с поражениями в области зоны Брока и грамматическими ошибками при порождении речи (особенно в отношении использования глаголов) обычно способны успешно различать грамматически правильные и неправильные предложения при восприятии. Кроме того, поражения зоны Вернике часто, особенно в детском возрасте, также сопровождаются аграмматическими нарушениями (Patterson & Bly, 1999). В настоящее время имеются, как минимум, две нейролингвистические теории, которые пытаются объяснить эти и подобные им факты. Их общее предположение состоит в том, что связанные с зоной Брока процессы отчасти дублируют синтаксическую обработку, которая может до определенной степени осуществляться и в задних отделах коры. В остальном эти теории оказываются полностью противоположными.
Американский нейропсихолог Майкл Ульман и его коллеги считают, что премоторная зона Брока обеспечивает, как и фронтальные отделы коры в целом, сознательный контроль за переработкой информации в других отделах мозга, в данном случае в форме контроля за применением правил грамматической трансформации лингвистического материала (UUman et al., 1997). По мнению Ангелы Фридерици из Института когнитивной нейропсихологии общества Макса Планка в Лейпциге, все обстоит как раз наоборот, а именно по мере развития речи ребенка расположенной в премоторной части лобных долей зоне Брока постепенно
40 С критикой этих традиционных представлений выступал во второй половине 19-го века Джон Хьюлинг-Джексон (но потерпел поражение в публичном диспуте с Полем Брока). Критический анализ продолжили в середине 20-го века такие авторы, как А.Р. Лурия и Р. Якобсон, а также их коллега, гештальтпсихолог Курт Гольдштейн. Последний, в особенности, подчеркивал роль центрального планирования высказывания во внутренней 152        речи (Goldstein, 1948).

передаются формирующиеся автоматизмы быстрой и не контролируемой сознательно синтаксической обработки. В возрасте от 5 до 10 лет в передних отделах коры левого полушария действительно образуется нечто вроде автономного «синтаксического модуля», но только приобретенного, а не врожденного (Friederici, 1996). Главным в его работе является чрезвычайно точное и быстрое временное согласование различных операций обработки при порождении речи41. Собственно «знание» грамматики, в том числе доступное сознательному отчету, скорее связано с задними височными отделами коры, причем не только левого (зона Вер-нике), но и правого полушария.
Точка зрения Фридерици представляется несколько лучше обоснованной имеющимися на сегодня данными. Исследования развития речи ребенка свидетельствуют об особенно явном взаимодействии семантики и синтаксиса на ранних этапах этого процесса. Гипотеза «модуляриза-ции», то есть постепенного выделения автоматизированных процедур синтаксической обработки из первоначально единого комплекса «семантического синтаксиса», позволяет также понять, почему картина афази-ческих расстройств при одних и тех же поражениях мозга может существенно зависеть от типа грамматических средств конкретного языка, например от того, использует ли этот язык жесткий порядок слов, как английский, или же развитую систему морфологических элементов (окончания, суффиксы, приставки), обеспечивающих синтаксическое согласование при относительно свободном порядке слов в предложении, как это имеет место в русском языке. Промежуточное положение между английским и русским как в отношении разнообразия морфологических средств, так и в отношении ограничений на порядок слов занимает итальянский язык.
Несомненно, что выделение и постепенная автоматизация процедур синтаксической обработки — это лишь один из нескольких задействованных в индивидуальном развитии речи нейрофизиологических механизмов. Другим важнейшим механизмом являются процессы имитации жестов и мимики, протекающие с участием концентрированно расположенных в непосредственной близости к зоне Брока, а также и на ее «территории» зеркальных нейронов (см. 2.4.3). Еще одним механизмом, по-видимому, является более или менее рефлексивная оценка знаний и намерений партнера42. Подобная метакогнитивная оценка предполагает достаточно полноценное функционирование индивидуальной теории психики (см. 5.4.1 и 8.1.1). Для такого функционирования существенны структуры филогенетически новых передних отделов мозга, в особенности
41    Нейрофизиологические процессы, обеспечивающие развертку синтаксических ав
томатизмов во времени, вовлекают и субкортикальные структуры мозга, прежде всего,
базальные ганглии. Об этом говорят не только многочисленные клинические и нейрофи
зиологические данные, но и повседневные наблюдения. Так, хорошо известно, что ба-
зальные ганглии чувствительны к стрессу и гипоксии (кислородному голоданию). При этих
условиях и у вполне здоровых людей наблюдаются преходящие симптомы аграмматиз-
ма -- нарушения синтаксической организации речи.
42    Два этих механизма не обязательно жестко отделены друг от друга. Как показывают
новые исследования Дж. Риццолатти (Rizzolatti, 2004), система зеркальных нейронов
обычно вовлечена и в решение задач оценки намерений партнеров.                                                   153

правой префронтальной коры (Stuss, Gallup & Alexander, 2001). Раннее поражение этих структур ведет к нарушениям общения, что обычно тяжело отражается на развитии речи и, по меньшей мере, социального интеллекта.

Таким образом, основной итог нашего обсуждения заключается в выводе об ошибочности изначально изолированной трактовки синтаксиса и семантики. Представители разных направлений лингвистики и когнитивной науки начинают разделять более функционалистский взгляд на язык, допускающий гибкое взаимодействие компонентов. Так, например, Джекендофф (Jackendoff, 2002) рассматривает синтаксис и семантику в качестве равноправных модулей обработки (см. 7.3.2). Понимание грамматики как концептуализации стало одним из основных постулатов когнитивной лингвистики. Гипотеза о первоначальном единстве семантики и синтаксиса поддерживается данными о развитии речи и ее нейрофизиологических механизмов в отногенезе, а равно работами по когнитивным универсалиям в различных языках мира, которые мы рассмотрим в следующей главе (см. 8.1.2). Гигантский слой концептуачьного знания в равной мере образует элементарную основу как наших знаний о мире, так и языковой компетентности. Однако синтаксис и семантика не определяют однозначно использование речи, которое подчинено в первую очередь решению задач, возникающих в социальной ситуации общения.

7.4 Прагматика коммуникативных ситуаций
7.4.1 Принцип кооперативности и понимание

Несмотря на кажущуюся простоту большинства ситуаций понимания и общения, они включают множество операций, связанных с решением таких сложных подзадач, как распознавание конфигураций, кратковременное запоминание, поиск в памяти, синтаксическая интерпретация и т.д. Все эти процессы объединены главной задачей — выделением не просто значений отдельных слов, но и смысла сообщения в целом. Ее успешное решение доказывает, что знаковые средства переноса и выражения значения достаточно «прозрачны», чтобы позволить нам «увидеть» намерения и установки автора, оценить степень его знакомства с темой и, возможно, даже выделить один или более подтекстов, содержащихся в сообщении. По-видимому, это и имел в виду Джером Брунер (1977), когда связывал когнитивный подход с изучением движения «за пределы непосредственно данной информации». Исключительно важная информация, однако, может содержаться как раз в поверхностной, непосредственно доступной коммуникативному партнеру формулировке сообщения.

В 1967 году американский философ Пол Грайс (Grice, 1967) описал в виде четырех «максим» принцип неоперативности, оптимизирующий процессы нашего вербального и невербального общения:
«Максима информативности, или количества» — Будь информативен настолько, насколько это требуется, но не более того.
«Максима истинности, или качества» — Не утверждай того, по поводу чего Ты знаешь, что это неправда или для этого нет доказательств.
«Максима релевантности, или отношения» — Старайся, чтобы Твой вклад был релевантен целям происходящего обсуждения.
«Максима ясности, или способа изложения» — Будь ясен, избегай непонятных слов и формулировок, многозначности и беспорядка в использовании речи.
Не следует думать, конечно, что диалогическое общение всегда строго подчиняется грайсовским максимам. Они описывают лишь «де-фолтные ожидания», разделяемые в общем случае участниками общения. Эти ожидания позволяют строить предположения («импликатуры») о подтексте сообщения. Например, если кто-то из наших собеседников внезапно начинает объясняться слишком детально или невнятно, то обычно сразу же возникает вопрос, в чем состоит смысл нарушения принципа кооперативности.
Действенность принципа кооперативности побуждает нас искать и чаще всего находить содержание и в, казалось бы, совершенно тавтологичных утверждениях, таких как «Закон есть закон» или «No God but God». Те же прагматические соображения, кстати, можно применить и к центральному теоретическому вопросу психологии синтаксиса: зачем в языке сосуществует столько различных поверхностных реализаций некоторой фразы, если, как утверждают сторонники генеративной грамматики, важна только ее глубинная репрезентация? Не несет ли выбор той или иной поверхностной формы некоторую специальную функцию, например, передачу личностного смысла, а не просто значения (см. 1.4.2 и 6.1.1)? Действительно, в реальных ситуациях социального взаимодействия, так же как и в случае произведений художественной литературы или изобразительного искусства, для нас часто значительно более важно не то, что сказано, а то, как сказано (изображено).
Рассмотрим в качестве примера следующие поверхностно различные реализации одной и той же глубинной репрезентации:
В конце концов Золушка была взята принцем в жены.
В конце концов принц взял Золушку в жены.
В конце концов Золушка взяла принца в мужья.
В конце концов принц был взят Золушкой в мужья. Легко видеть, что эти высказывания при одинаковости глубинной синтаксической структуры далеко не равнозначны как раз в прагматическом отношении — с точки зрения смысла социальной ситуации инициатива в ряду описываемых событий устойчиво переходит от принца к
155

Золушке. Этот пример наглядно показывает, что прагматика действительно может быть связана именно с поверхностными характеристиками высказывания. Позволим себе еще один пример такого же рода (по: Апресян, 1995):
Бросил он курить, как же.
И в этом случае именно поверхностные признаки, такие как необычный порядок слов и присутствие излишнего с точки зрения стандартной глубинной интерпретации конструкта «как же», ведут к интерпретации «Он совсем не бросил курить, а все наши надежды на этот счет оказались напрасными», противоположной по смыслу высказыванию «Он бросил курить».
Какие факторы, кроме грайсовских ожиданий, формируют контекст коммуникативного взаимодействия? Герберт Кларк называет этот контекст «общей основой» (common ground) и относит к числу его важнейших компонентов прежде всего взаимное знание (mutual knowledge) о характере происходящего, разделяемое участниками общения. Высвечивая значение тех или иных «поверхностных элементов» высказывания, коммуникативный контекст может также менять смысл целых фраз. Так, как отмечалось выше (см. 7.1.3), вопрос «Знаешь ли ты, сколько сейчас времени?» редко допускает прямое истолкование (позволяющее, например, просто ответить «Знаю») и в некоторых ситуациях может быть совсем не вопросом, а, скажем, напоминанием о намеченных, но еще не выполненных делах. Последнее использование как раз и предполагает существование плана межсубъектного знания, общего для участников общения. В самом деле, чтобы понять этот вопрос как напоминание, адресат должен догадываться, что говорящий знает о его планах и намерениях.
Влияние обобщенного знания на процессы понимания исследовалось в ряде работ Дж. Брэнсфорда и его сотрудников. Испытуемым, например, мог быть предъявлен следующий отрывок: «На самом деле процедура довольна проста. Прежде всего вы должны разложить вещи. Конечно, и одной стопки может оказаться достаточным в зависимости от того, как много нужно сделать. Если вы должны идти куда-то еще из-за недостатка компонентов, то это — естественный следующий шаг, в противном случае можно начинать работу. Выполняя ее, важно не перестараться. Иными словами, лучше сделать меньше, чем попытаться сразу сделать слишком много. Ошибки могут привести к неприятным последствиям. Вначале все может казаться сложным. Постепенно, однако, это станет одной из ваших привычных обязанностей. Трудно предвидеть такой момент в будущем, когда необходимость выполнения этого дела полностью отпадет. После завершения процедуры материал вновь раскладывается по группам. Затем он может быть помещен в соответствующее место. Через какое-то время все это опять будет использовано, и тогда придется повторить данный цикл» (Bransford & Johnson, 1973, p. 400).
Понимание и запоминание данного текста оценивались в двух условиях — когда испытуемому не сообщалось никакой предварительной  информации и когда ему сообщали о теме отрывка, которой в данном

случае была стирка белья (хотя более или менее приемлемыми могут быть и другие интерпретации, например «канцелярская работа»). Во втором случае успешность воспроизведения резко улучшалась. По-видимому, это объясняется эффективной схематической организацией материала уже в процессе восприятия, так как открытие сюжета после прочтения отрывка не приводило к заметному улучшению уровня воспроизведения. В качестве подсказки, позволяющей дать интерпретацию текста, может выступать всякое эффективное сообщение о референтной ситуации43.
Большое количество работ посвящено описанию психологического формата представления знаний в процессах понимания. Речь идет при этом не просто об активации семантических связей, но и о зрительно-пространственном, образном контексте, часто «населенном» действующими лицами. В психолингвистике в связи с этим используется несколько теоретических понятий, одним из которых является понятие ситуативная модель (Zwaan & Radvansky, 1998). В ситуативной модели фиксируются и отслеживаются пять параметров:

  1. протагонист,
  2. время,
  3. пространство,
  4. причинно-следственные отношения,
  5. интенции.

Понимание затрудняется, если по одному из этих параметров нарушается непрерывность переходов от эпизода к эпизоду, скажем, если действие неожиданно перемещается в прошлое (как это бывает, когда протагонист начинает припоминать что-то из своей жизни). Выделяемое значение не исчерпывается тем, что эксплицитно представлено в сообщении, распространяясь также на сведения, неявно предполагаемые или выводимые из текста.
Иллюстрацию можно найти в другой работе группы Брэнсфорда (Johnson, Bransford & Solomon, 1973). Испытуемому предъявлялись предложения: «Джон пытался укрепить скворечник. Он как раз (искал/забивал) гвоздь, когда пришел отец, чтобы помочь ему в работе». При тестировании памяти для узнавания могло быть предъявлено предложение «Джон пытался с помощью молотка укрепить скворечник». Вероятность ошибочных узнаваний (ложных тревог) была больше, если первоначальный текст включал глагол «забивал». В одном из экспериментов Артура Гленберга и его коллег (Glenberg, Meyer & Lindem, 1987) предъявлявшиеся тексты содержали описание действий некоторого любителя бега: «Придя с работы, он (снял/надел) свитер и пробежал четыре раза вокруг стадиона». Слово «свитер» было более эффективной подсказкой для последующего воспроизведения этого микросюжета, если первоначально оно предъявлялось в контексте «надел», а не «снял». В последующих
43 Как отмечал Выготский, для группы людей, давно ожидающих трамвай, произно
симое вдруг слово «Идет!» не требует каких-либо дополнительных разъяснений.                                       157

работах описаны еще более сложные эффекты, обусловленные тем, что при понимании повествовательных текстов мы обычно принимаем перспективу протагониста. Поэтому если в ходе описываемых событий какие-то объекты закрываются в его (героя повествования) «поле зрения», то потом они также труднее припоминаются нами, несмотря на их эксплицитное упоминание в тексте (Horton & Rapp, 2003).
Элементарное требование состоит, следовательно, в определенной непрерывности образа референтной ситуации. Иллюстрацией могут служить трансформации отрывка текста. «Маша крепко держала за ниточку свой новый воздушный шар. Внезапный порыв ветра вырвал его и бросил на дерево. Он наткнулся на ветку и лопнул. Маша горько заплакала». Случайная перестановка предложений резко затрудняет понимание. «Он наткнулся на ветку и лопнул. Внезапный порыв ветра вырвал его и бросил на дерево. Маша горько заплакала. Маша крепко держала за ниточку свой новый воздушный шар». Естественная последовательность событий — инвариантность референтной ситуации — здесь оказывается нарушенной. Тот же эффект вызывает и замена групп существительного в исходном отрывке: «Маша крепко держала за ниточку свой новый воздушный шар. Внезапный порыв ветра вырвал газету и бросил на дерево. Стакан упал на пол и разбился. Джон горько заплакал» (Johnson-Laird, 1978, р. 117). Если текст не отсылает читателя-слушателя к одной и той же ситуации более чем один раз, то он быстро превращается в нечто, напоминающее телефонную книгу.
Хотя глобальная инвариантность референтной ситуации служит важным условием понимания, в процессе коммуникации возможны подчас весьма существенные изменения, которые мы даже не замечаем. К числу самых частотных изменений относится сдвиг референтного значения терминов — явление, называемое в лингвистике метонимией. Так, нет ничего удивительного в признании знакомой студентки «Я люблю Моцарта», а в разговоре двух коллег вполне возможна фраза: «Выготский был интереснейшим психологом своего времени. Посмотрите на верхней полке. Выготский должен быть в синей обложке». Очевидно, существуют абстрактные прагматические связи, позволяющие — в контексте художественной или научной деятельности — заменять автора его произведениями, например книгами с их предметными свойствами. В других ситуациях вполне естественными могут оказаться иные, иногда довольно неожиданные прагматические переходы (или отображения .— англ. mappings) между предметными областями. Так, в коммуникативном контексте, имеющем отношение к общественному питанию, человека вполне можно заменить его едой: «Венский шницель ушел, не заплатив».
Важнейшая особенность прагматики связана с тем, что язык может быть использован для обсуждения не только реальных, характеризующихся определенной онтологией событий, но и воображаемых или гипотетических событий, по отношению к которым следует говорить уже о практически открытом множестве «семантик возможных миров» 158       (Kripke, 1982). Такие «возможные миры» в когнитивной науке принято

трактовать как особого рода ментальные конструкты, включающие не только образ окружения и других индивидов, но также их предполагаемые знания, намерения, эмоции и мотивы. Одним из первых это подчеркнул в первой половине 20-го века английский философ и математик Бертран Рассел. Он же описал языковые средства, используемые для обсуждения ментальных состояний. Эти, так называемые пропозициональные установки обычно имеют вид:
Xпсихологический глагол (пропозиция).
В этом условном выражении «X» — это некоторое действующее лицо, или актор; «психологический глагол» — один из нескольких десятков глаголов, означающих ментальные акты и состояния, такие как «хотеть», «надеяться», «бояться», «знать», «думать»; а «пропозиция» — логическое утверждение, которое само по себе может быть истинным или ложным.
Разнообразные примеры речевых конструкций с пропозициональными установками обнаруживают одну замечательную особенность. Она состоит в их известной непроницаемости для наших знаний о ситуации или, более конкретно, в том, что мы не можем использовать наше знание о ситуации для осуществления, казалось бы, эквивалентных подстановок понятий внутри вложенного в ментальный контекст высказывания (пропозиции). Так, в одном из классических примеров Рассела: «Гамлет хотел убить человека, скрывавшегося за занавесом» — попытка осуществить подстановку имени человека, который, как нам известно, скрывался за занавесом, приводит к довольно сомнительному утверждению «Гамлет хотел убить Полония» (то есть отца своей невесты Офелии). Возьмем другой пример, на этот раз из истории русской литературы, содержащий пропозициональную установку с глаголом «думать»: «Николай думал, что Пушкин — это автор "Гавриилиады"». Подстановка имени автора «Гавриилиады» полностью меняет смысл высказывания: «Николай думал, что Пушкин — это Пушкин».
Обобщение этого подхода было предпринято в последние годы франко-американским логиком и когнитивным лингвистом Жилем Фо-конье (Fauconnier, 1997). Он проанализировал ряд речевых конструкций, которые обладают теми же прагматическими свойствами, что и пропозициональные установки. К таким конструкциям относятся, например, упоминания любого условного отображения реальности («В этом спектакле», «На этой фотографии») и синтаксические маркеры сослагательного наклонения («якобы», «как если бы»). Аналогичную роль могут играть отсылки к определенному историческому периоду («в 1793 году») или культурно-географическому региону («в Афганистане»), коль скоро в силу обстоятельств для этих периодов и регионов оказалось характерным формирование своей собственной «онтологии» — отличной от принимаемой в качестве базовой («наивной» — см. 6.4.3) системы семантических  и   ценностно-прагматических   связей.   Фоконье   предлагает
159

называть подобные, относительно непроницаемые для наших знаний системы смысловых контекстов ментальными пространствами.
Речевое общение и, очевидно, мышление предполагают умение гибко работать с целыми наборами ментальных пространств. Рассмотрим, например, с позиций представлений о ментальных пространствах процессы понимания следующего простого текста: «В этом спектакле Смоктуновский играет Отелло. Отелло думает, что Дездемона ему неверна. Но в действительности она его любит». Текст начинается с упоминания условного изображения реальности, заставляющего покинуть ментальное пространство МП! (где, скажем, актеры — это обычные люди) и перейти в ментальное пространство спектакля (видимо, трагедии Шекспира), МПГ Заметим, что этот переход полностью меняет семантику понятий и прагматику действий. В частности, в МП2 оказывается возможным многое из того, что даже невозможно себе представить, находясь в контексте нашего обыденного сознания МПГ Уже следующее предложение содержит типичный оператор пропозициональной установки «X думает», заставляющий построить еще одно ментальное пространство МП3, включающее эмоции, знания и намерения Отелло. Хотя последнее предложение, казалось бы, возвращает нас «к действительности», на самом деле этот переход подымает процесс понимания всего лишь на одну ступень — в пространство МП2, отличающееся от собственно реальности, которая представлена МП,.
Возможно, впрочем, что в приведенном примере следует говорить только о двух слоях ментальных пространств — МП! (пространство спектакля) и МП2(внутренний мир Отелло), так как в силу ее особого феноменологического и лингвистического статуса реальность не может рассматриваться в одном ряду со своими условными изображениями. Об этом свидетельствует любопытная асимметрия в использовании возвратных местоимений. Предположим, что президент В.В. Путин решил посетить премьеру нового мюзикла, посвященного актуальным политическим событиям. Пусть среди изображаемых на сцене политиков есть и президент Путин, который по ходу действия встречается с Жаком Шираком. Как мы видели выше, имя «Путин» может использоваться в соответствующем контексте и по отношению к исполняющему его роль актеру. Тогда можно представить себе высказывание «Путин был очень удивлен, увидев себя танцующим танго с президентом Шираком». Однако ни при каких обстоятельствах нельзя представить себе высказывание из перспективы актера на сцене «Путин был очень удивлен, увидев себя покидающим зрительный зал». Использование возвратного местоимения здесь оказывается невозможным. Судя по всему, реальность отражается в репрезентации, но репрезентация не отражается в реальности — как и в случае встречи с «настоящими» фантомами зеркало остается пустым!44
44 На наш взгляд, результаты этого мысленного эксперимента представляют собой интересный аргумент в спорах материалистов и идеалистов (см. 1.1.1). В ходе философских дебатов можно выражать сомнение в существовании внешнего мира, но если декларирующий это человек использует возвратные местоимения отмеченным асимметричным образом, то это означает, что на деле он тщательным образом различает реальность и 160        ее условные репрезентации.

Гибкое согласование смысловых контекстов играет критическую роль в социальных взаимоотношениях: мы постоянно оцениваем других людей, пытаемся понять их отношение к нам с учетом их знания о нашем к ним отношении и т.д. Однако намеченная Фоконье теория ментальных пространств позволяет увидеть в новом свете и некоторые элементарные факты, например, имеющие отношение к синтаксису речи. Какую функцию выполняют во многих языках мира определенные и неопределенные артикли? По-видимому, неопределенный артикль служит речевым оператором введения нового элемента в ментальное пространство, тогда как для обозначения уже присутствующих в ментальном пространстве элементов используется определенный артикль45.
Таким образом, в психологии языка многое может быть понято при движении «от сложного к более простому» (так возмущавшего И.П. Павлова в работах гештальтпсихологов — см. 1.4.2). При этой стратегии исследования могут возникать интересные вопросы. Например, упоминание определенного артикля должно инициировать у слушателя поиск известного ему референта. Если невозможно непосредственное соотнесение высказывания с ситуацией, то поиск разворачивается в памяти, причем, видимо, не в безличностной семантической памяти, а в рабочей памяти и в памяти на эпизоды собственной биографии. Как уже отмечалось, если референт абсолютно очевиден для участников общения («находится в фокусе совместного внимания»), то возможно его сокращенное упоминание с помощью местоимения и даже полное исключение из текста. Представленность референтов в составе собственно речи определяется, таким образом, внелингвистическими факторами (см. 7.1.3 и 8.1.2). Изучение связи прагматики общения с работой памяти и с социальным интеллектом во многом остается задачей будущего.
7.4.2 Несовпадение значения и смысла
Особый интерес представляют те случаи, когда подразумеваемое значение фразы не совпадает с ее буквальным значением. Мы подробнее остановимся здесь на метафоре, отложив обсуждение еще более сложных форм непрямого использования речи, подобных иронии, до следующей главы (см. 8.1.3). С точки зрения первоначально доминировавших в ког-
45 В русском языке первоначальное введение неизвестного предмета или персонажа в
ментальное пространство совместной со слушателем зоны внимания обеспечивается дру
гими средствами, например указательными местоимениями или порядком слов, за счет
большей, чем в некоторых западноевропейских языках, свободы последнего (ср. «Маль
чик вышел из дома» и «Из дома вышел мальчик»). Кроме того, близкие функции выпол
няет и развитая падежная система русского языка. Так, использование винительного па
дежа в «Иван ждет поезд» имплицирует определенность (англ. the train), тогда как роди
тельный падеж в этой же фразе — «Иван ждет поезда» — соответствует применению нео
пределенного артикля (a train).                                                                                                               161

нитивной психологии представлений о комбинации семантических компонентов (примитивов, маркеров, элементов), феномен метафоры является как бы аномалией. Но, как обычно бывает, именно аномалии привлекают внимание наиболее талантливых представителей научного сообщества (см. 9.1.1 ). Переход к изучению таких проблем означает уве -личение уровня сложности исследовательских задач, ведь уже объяснение понимания простых предложений часто вызывает споры сторонников различных моделей обработки. С другой стороны, анализ метафоры может оказаться ключом к пониманию психологических механизмов, лежащих в основе нашей работы с концептуальными структурами.
Для когнитивной психологии интересно изучение метафор, которые не успели еще принять «застывшие», фиксированные в лексиконе данного языка формы. Вопрос состоит в выяснении отношений между двумя видами значения — буквальным (М,) и связанным с контекстом, или «переносным» (М2). Согласно распространенной точке зрения, понимание переносного смысла осуществляется на некоторой поздней стадии переработки информации, следующей за пониманием прямого значения. Сначала «вычисляется» буквальное значение Мр которое сравнивается с контекстом. Если оно не подходит, то «вычисляется» значение М2, на что, разумеется, уходит дополнительное время. Но, проанализировав результаты ряда экспериментов, Герберт Кларк (Clark & Clark, 1977) пришел к выводу, что как М(, так и М2 выделяются в качестве элементов одной «упаковки», причем при «вычислении» обоих значений играют роль разные источники информации46. Использование и запоминание того или иного значения зависит затем от дополнительных факторов, таких как пространственно-предметный и социальный контекст общения.
В работе Вербрюгге (Verbrugge, 1977) были получены данные, свидетельствующие о необходимости дополнительных умозаключений для понимания метафоры. Казалось бы, это подтверждает гипотезу двухста-дийной переработки прямого и переносного значения. Но сам автор не склонен соглашаться с двухстадийной моделью. По его мнению, изучение метафоры говорит о потенциальной многозначности любого высказывания. Прибегая к помощи метафоры, Вербрюгге уподобляет предложение нотной записи — очень общей спецификации того, что будет исполнено пианистом. Партитура требует множества дополнений и уточнений со стороны исполнителя, допуская различные интерпретации музыкального произведения. Ортони с коллегами (Ortony et al., 1978) и Джиббс (Gibbs, 1994), проведшие исследования, в которых систематически варьировался контекст, считают, что признаки двухстадийной переработки появляются только тогда, когда контекст накладывает незна-
46 Надо сказать, что в этих экспериментах Кларка исследовалось понимание не метафор, а косвенных и вежливых просьб. Он, однако, считает, что выводы могут быть рас-162        пространены и на другие примеры непрямого использования речи.

 

чительные ограничения на интерпретацию. Это может говорить в пользу представления, обсуждавшегося нами в связи со снятием лексической многозначности при чтении (см. 4.3.2 и 7.2.2) — на некотором раннем этапе микрогенеза одновременно доступно более одного возможного значения (по крайней мере, до степени «доступности» имплицитных форм познания) читателю-слушателю. Задача и контекст ограничивают затем степени свободы интерпретации.
Следует отметить, что в случае устоявшихся в данном языке идиоматических выражений буквальное значение может вообще не выделяться (что означает буквально «сыграть в ящик» или «дать дуба»?) или во всяком случае не осознаваться наряду с идиоматическим значением. Это могло бы объяснить результаты Кларка и других авторов, показавших, что метафоры и идиоматические выражения подчас оцениваются как осмысленные фразы более быстро, чем контрольные предложения. Нечто похожее установлено также в исследованиях понимания и узнавания карикатур — они могут узнаваться быстрее, чем реалистические фотографии (Benson & Perrett, 1994). Интересно, что эффект такой ускоренной обработки, кажется, наблюдается и в случае новых метафор (карикатур), а не только в случае уже знакомых.
Обсуждение метафорической речи было бы неполно без упоминания роли, которую в ней играет мышление по аналогии. Эта тематика была открыта в когнитивной психологии работами Роберта Стернберга (Sternberg & Nigro, 1983). Р. Стернберг исходит из представления о том, что знания хранятся в форме семантических пространств, структурированных принадлежностью понятий к тематически различным предметным областям (они подробно обсуждались в предыдущей главе). При этом можно говорить о глобальной и локальной близости понятий. Глобальная метрика связана с близостью целых семантических областей между собой. Локальная метрика — с близостью понятий внутри одной и той же области. Порождение образного сравнения представляет собой реализацию своеобразной «минимаксной» стратегии: мы лшнммизируем расстояние (увеличиваем сходство) выбираемых понятий внутри локальных областей, стараясь, чтобы сами эти области максимально далеко отстояли друг от друга в глобальном семантическом пространстве. Например, сравнения людей и животных обычно звучат банально, поскольку две эти области непосредственно примыкают друг другу в рамках общей категории «живое существо». Более удачными поэтому могут быть сравнения, вовлекающие далекие друг от друга области — «закипающий чайник», «начищенная сковородка» и т.д.
Надо сказать, что первыми влияние сходства отношений в двух различных предметных областях на понимание образных сравнений и поэтической речи стали изучать гештальтпсихологи. Кёлер (Koehler, 1947) приводит строку поэта Кристиана Моргенштерна «Alle Moeven sehen aus als ob sie Emma hiessen» («Все чайки выглядят так, как если бы их звали


163



Рис. 7.8. Какой из этих объектов называется «Текете», а какой «Малума»? (По: Koehler, 1947.)


164

Эмма»). Здесь, очевидно, используется фонетический рисунок имени «Эмма» (по малой дуге вниз, а затем резко снова и еще выше вверх), напоминающий условное изображение чайки. Другим, ставшим знаменитым примером является предъявление бессмысленных (и совершенно новых для испытуемых) слов «Текете» и «Малума» и двух столь же незнакомых зрительных объектов, типа показанных на рис. 7.8. Обычно ни у кого из испытуемых (этот эксперимент повторялся в десятках самых различных культур) не возникает сомнений, как можно однозначно соотнести между собой эти слова и объекты.
С точки зрения современной психосемантической модели Уолтера Кинча (Kintsch, 2000; 2001), нет принципиальной разницы между пониманием обычных («Скала упала на* дорогу») и метафорических («Семья — это скала») высказываний. Используя векторные репрезентации значений, вычисляемые с помощью Латентного семантического анализа (см. 6.1.1), он показал, каким образом взаимодействие с теми или иными аргументами «высвечивает» различные аспекты значения предиката. Высокая размерность этих репрезентаций (порядка нескольких сотен измерений) позволяет учитывать различные, в том числе и метафорические потенциальные контексты сравнения понятий между собой. Например, при словосочетании «мост рухнул» векторная сумма значений предиката и аргумента указывает в направлении глагола «разрушаться», тогда как в случае фразы «рынок акций рухнул» выделяется аспект падения — резкого снижения уровня.
Другой известный психолингвист Сэм Глаксберг (Glucksberg, 2001) также исходит из гипотезы о том, что основой механизмов метафорического использования языка служат активационно-тормозные процессы в семантических пространствах. Проводимые им исследования иллюстрирует следующий пример. Сравнение «Мой адвокат — акула», очевидно, подчеркивает профессионально-личностностные особенности некоторых представителей юриспруденции, такие как целенаправленность и жестокость, но, конечно же, не способность быстро плавать или дышать под водой. Если вслед за пониманием такой метафоры предъявить испытуемым для оценки осмысленности какие-либо высказывания, осно-


ванные на мешающих подразумеваемому образному сравнению семантических свойствах («X плавает», «Y дышит под водой»), то наблюдается замедление времени реакции верификации по сравнению с контрольными условиями, в которых эти же высказывания предъявлялись вне метафорического контекста. Восприятие контрольных предложений замедляется, даже если они никак не упоминают ни адвоката, ни акулу. Иными словами, наблюдается так называемый негативный прайминг, свидетельствующий о присутствии тормозных эффектов. Это означает, что за пониманием метафоры стоит определенная метакогнитивная работа, связанная с подавлением мешающих ассоциаций, а не просто автоматические (обычно только активационные — см. 4.3.2 и 5.1.3) процессы обработки.
Исследования метафоры широко представлены в литературе по философии познания и когнитивной лингвистике, где начинает доминировать мнение, что любое речевое значение по своему происхождению метафорично. Так, один из ведущих представителей когнитивной лингвистики Джордж Лакофф, а также некоторые его коллеги (прежде всего философ М. Джонсон) считают, что процессы концептуализации имеют метафорический характер (Лакофф, Джонсон, 1987; Lakoff, 1995). Кроме того, предполагается, что основным источником сравнений и аналогий для лексической семантики служат онтологические категории и непосредственный телесно-чувственный опыт (см. 6.3.1 и 9.3.3). Перефразируя название первой книги Лакоффа и Джонсона, можно сказать, что мы живем и мыслим метафорами. Если учесть бурное развитие исследований использования метафор при обозначении эмоций и при нравственных оценках, можно также сказать, что мы чувствуем метафорами (Апресян, 1995; Koevesces, 2005; Lakoff, 2005)
Эта точка зрения верна в отношении научных понятий. Как особая метапроцедура (см. 8.1.3), МЕТАФОРИЗАЦИЯ выполняет важную роль культурной фиксации новых научных результатов. Вопреки мнению о метафоре как о частном средстве повышения выразительности поэтической речи, современные исследования подчеркивают ее значение для расширения научного и разговорного лексиконов, постепенно формирующих и наши индивидуальные представления о мире. Научные понятия, которые обычно вводятся их авторами в оборот как смелые метафоры, постепенно приобретают привычные, фиксированные в лексиконе языка и концептуальных структурах формы. Например, мы говорим сегодня про «электрический ток» и привычно думаем о различных электрических явлениях, используя гидравлические аналогии. Однако в 18-м веке, когда создавались основы наших представлений об электричестве, нужно было настоящее интеллектуальное мужество, чтобы сравнить электричество с потоком воды, хотя повседневные электрические явления — молния, притяжение мелких кусочков бумаги или ткани костяным гребнем — ничего похожего на поток жидкости в себе не содержат.
165

Складывается впечатление, что по мере увеличения объема теоретических знаний роль МЕТАФОРИЗАЦИИ только возрастает. На наших глазах возникли такие понятия, как «очарованные частицы», «общественный резонанс», «переработка информации человеком», «виртуальная реальность», «мозговое картирование». Видимо, незавершенность метафор позволяет им лучше вписаться в систему существующих концептуальных структур, обеспечив их новое понимание, чем использование буквальной речи или введение условных терминов (неологизмов)47. Вместе с тем, всякая, даже очень удачная метафора может обеспечить лишь частичное продвижение вперед и со временем' (как это случается и со всеми научными теориями!) может начать сдерживать дальнейшее развитие. Так, субстанциональное понимание электричества, зафиксированное в нашей наивной модели мира, давно уже стало помехой в процессах обучения физике и электротехнике, препятствующей глубокому пониманию студентами его физической природы и ведущей к ошибочным утверждениям типа «электричество накапливается внутри батареи», «вытекает из батареи», «течет по проводам» и т.д., как если бы речь шла о перемещении жидкости в трубе под давлением (см. 5.4.2).
Дж. Лакофф и его коллеги рассматривают в своих работах самые разнообразные случаи метафорического сравнения, а не только обычные примеры вида «X — это Y», где «X» и «Y» — это некоторые группы существительного (понятия). Более того, в отличие от психолингвистов и психологов, данную группу исследователей интересуют в первую очередь именно устоявшиеся, «вошедшие в плоть и кровь» языка метафоры и идиомы. Их вычленение и изучение предполагают поэтому глубокий лекси-ко-этимологический и фразеологический анализ. Так, высказывание «Мы встретимся в 2 часа» содержит признак концептуальной метафоры «ВРЕМЯ — это ПРОСТРАНСТВО», поскольку предлог «в» изначально используется в качестве предиката для обозначения пространственных отношений. В работах Лакоффа встречается подробный разбор целого ряда таких общих метафор: «ЖИЗНЬ - это ДОРОГА», «АРГУМЕНТАЦИЯ -это ВОЙНА», «ЛЮБОВЬ - это ПУТЕШЕСТВИЕ», «ГНЕВ - это НАГРЕВАНИЕ (жидкости в сосуде)» и т.д.
Наличие концептуальных метафор объясняет множество параллелей между сопоставляемыми областями. Например, гнев, как и закипание жидкости в закрытом сосуде, чреват разрушительным взрывом, если только не держать ситуацию под волевым контролем (крышку сосуда под давлением) или вовремя не «спустить пары». Спорным вопросом
47 Б.Л. Пастернак (в заметках о переводах Шекспира) сравнивал метафору со «скорописью большой личности», позволяющей ей решать огромные задачи в ограниченное время: «Метафоризм — естественное следствие недолговечности человека и надолго задуманной огромности его задач. При этом несоответствии он вынужден смотреть на вещи по-орлиному зорко и объясняться мгновенными и сразу понятными озарениями. Это и есть поэзия. Метафоризм — стенография большой личности, скоропись ее духа» (Пас-166        тернак, 1991, т. 4, с. 414).

оказывается роль самой метафоры — не является ли она просто вторичным обозначением подобных, заранее существующих параллелей? Ла-кофф настаивает, что метафоры выполняют продуктивную роль и, по крайней мере частично, впервые формируют сходство между семантически более богатой областью-источником и семантически бедной областью-целью. Иллюстрацией может служить сравнительно свежая метафора «ИДЕИ — это ПИЩА». В самом деле, идеи можно тем или иным образом употреблять, их также можно жевать, долго переваривать... Эти последние, действительно удачные образы оформляются лишь благодаря введению метафоры.
В более формальном плане метафоры, идиомы и примеры метонимии («Выготский на верхней полке в синем переплете») рассматриваются в когнитивной лингвистике как варианты сложных знаков, или конструкций (см. 7.3.2). Значение конструкций не выводится из слов, более того, часто входящие слова не имеют значения и не встречаются в отдельности, вне шаблонной упаковки. От сравнительно простых оборотов, таких как американские «all of a sudden» и «tit for tat» (это сочетание двух псевдослов используется для обозначения того, что с библейских времен является важным принципом межличных и межгосударственных отношений — «Как ты мне, так и я тебе»), до значительно более сложных конструкций (они могут включать целые тексты) эти аномальные с точки зрения генеративной грамматики структуры образуют континуум или градиент, покрывающий практически все многообразие форм письменной и устной речи. Специфика метафоры как средства коммуникации и мышления заключается при этом в гипотезе инвариантности: метафора отображает схематическую образную структуру (отношения фигуры и фона, причин и следствий, движение и т.д.) некоторого фрагмента области-источника на область-цель, тем самым структурируя последнюю (Croft & Cruse, 2003).
Если общий принцип МЕТАФОРИЗАЦИИ состоит в том, что семантически более богатые области используются для интерпретации и структурирования относительно более бедных, то что это за области? Этимологические изыскания говорят о том, что основой для образных сравнений часто служит лексика, описывающая чувственный опыт. Практически универсальной в разных культурах и языках является оптическая метафора, то есть связка «видеть» — «понимать» с коннотациями типа «ясный», «прозрачный», «понятный». В целом ряде языков прослеживается цепочка трансформаций глагола «слышать» — к «слушать» (в значении «обращать внимание») и «слушаться». Тот же корень используется для обозначения важной информации, сообщения — «слух». Многие когнитивные лингвисты и психологи полагают, что источник метафор — это наше тело и, более того, что язык возник и актуально функционирует в режиме прямого соотнесения значения абстрактных понятий с сенсомоторными ощущениями. В радикальной форме это подчеркнули в своей последней -книге Дж. Лакофф и М. Джонсон (Lakoff & Johnson, 1999), для которых подобная «телесная заземлен-

167

ность» (embodiment) семантики стала центральным объяснительным принципом (см. 2.2.3 и 9.3.3).
Однако в подобном общем виде эта точка зрения вызывает возражения. Она, во-первых, игнорирует культурный опыт48. Во-вторых, она сводит концептуальное знание (уровень Е) к пространственным и телесным ощущениям (уровни С и В). В серии замечательных по их простоте экспериментов психолог из Станфордского университета Лера Боро-дитская и ее коллеги решили выяснить, как влияют на проявление концептуальной метафоры «ВРЕМЯ — это ПРОСТРАНСТВО» актуальное движение тела в пространстве и одно лишь мысленное представливание движения (Boroditsky, Ramscar & Frank, 2001).
Они предъявляли испытуемым неоднозначное высказывание «Назначенное на среду собрание было сдвинуто на два дня вперед», прося ответить, когда в терминах дня недели должно теперь состояться собрание. Если считать, что время движется относительно статичного наблюдателя, то ответом будет «понедельник». При движении самого наблюдателя во времени ответом будет «пятница». В одном из экспериментов этот вопрос задавался людям, находящимся в здании аэропорта. Те, кто лишь встречал кого-либо, с несколько более высокой вероятностью давали ответ «понедельник». Только что прилетевшие с большим преимуществом отвечали «пятница». Интересно, что такое же предпочтение ответа «пятница» наблюдалось и у лиц, готовившихся к отлету. Это означает, что одно только мысленное проигрывание движения способно определить характер метафорического переноса, причем не хуже, чем ощущение физического движения. Более того, последующие эксперименты показали, что при конфликте физического и мысленного движения доминирует мысленное проигрывание.
Сомнения вызывает также рассмотрение метафорического переноса лишь как отображения структур одной предметной области на другую. Такие отображения сплошь и рядом осуществляются в нормальном функционировании языка, при порождении практически любого высказывания. Но метафоры все-таки не всеобщи, они образуют особый класс психолого-лингвистических феноменов, привлекающий к себе повышенное внимание читателя/слушателя. Для них существенна необычность порождаемых конструкций, часто оставляющая впечатление неполной реалистичности («как если бы» семантики — см. 8.1.3). Кроме того, метафоры характеризуются особой личностно-смысловой и ситуативной нагрузкой. Лексикализация метафоры разрушает как раз эти характеристики.
48 Культурно-исторический опыт, несомненно, влияет на содержание концептуальных метафор. Так, если жизнь — это долгий и тяжелый путь, то сегодня мы, похоже, преодолеваем его не так как раньше (то есть пешком, двигаясь даже не по дороге, а через некое метафорическое поле), а явно более моторизованном образом Поэтому временами нам приходится тормозить, прикладывать усилия, чтобы все-таки вырулить, и на са-168        мьш худой конец просто надеяться, что «кривая вывезет»

Вероятнее всего это происходит потому, что в результате многократного повторного использования соответствующие процессы обработки автоматизируются и снижается уровень их контроля — с уровня метакогни-тивных координации F до уровня концептуальных структур Е.

Это предположение можно было бы проверить с помощью методов мозгового картирования. Надо сказать, что вопрос о нейрофизиологических механизмах метафорического и вообще всякого непрямого использования речи длительное время оставался малоизученным. В 1980-е годы в работах Т.В. Черниговской и В.Л. Деглина были получены первые доказательства того, что непрямое использование речи может быть связано скорее с правым, а не с левым, традиционно считавшимся собственно «речевым» полушарием (Черниговская, Деглин, 1986). В последние два десятиления были накоплены подтверждающие и уточняющие гипотезу Черниговской и Деглина данные, согласно которым понимание поэтических, а значит, еще не лексикализованных метафор, иронических замечаний и юмора связано с префронталъными областями, причем действительно прежде всего правого полушария (например, Shammi & Stuss, 1999).
Интересно, что поражения этих структур ведут к конфабуляциям, проблемам с отслеживанием истинностных, онтологических параметров знания (см. 5.1.1). Эти же или непосредственно примыкающие к ним структуры коры участвуют в извлечении информации о субъективно значимых эпизодах биографии, в кодировании материала с точки зрения личностного к нему отношения и в решении задач, предполагающих рефлексивный учет мнений и знаний других людей о той же самой ситуации, то есть связаны с функционированием «индивидуальной теории психики» (см. 5.3.3). Таким образом, в настоящее время сами экспериментальные данные начинают способствовать преодолению искусственного, часто обусловленного лишь административными соображениями разделения психологической науки на изолированные друг от друга «департаменты». Более того, очевидна тенденция к преодолению различий между подходами и теоретическими моделями познавательных процессов и языка, существующими в широком поле когнитивой науки, прежде всего в психологии, лингвистике, антропологии и нейрофизиологии.
7.4.3 Технологические применения прагматики
Поддержка процессов коммуникации выдвигается на первый план в современных технологических приложениях когнитивных исследований. Специальной прикладной дисциплиной, занимающейся оптимизацией взаимодействия человека и компьютера, стала возникшая в начале 1980-х годов (с появлением графических интерфейсов и персональных
169

170

компьютеров) когнитивная эргономика. В более широком плане оптимизацией человеко-машинных взаимодействий продолжают заниматься такие дисциплины, как инженерная психология и, что примерно идентично по значению, но более продвинуто непосредственно в область промышленных разработок (R&D, Research and Development исследование и развитие), инженерия человеческих факторов. Наконец, специфический анализ и моделирование (или «извлечение») знаний являются предметом инженерии знаний, связывающей такие разделы когнитивной психологии, как психосемантика, с информатикой и искусственным интеллектом, а с недавних пор и с работами в области искусственных нейронных сетей (см. 2.3.3 и 9.2.3).
Простейшее применение изложенных в этой главе данных — простейшее по идее, а не по реализации, требующей кропотливого психофизического и лингвистического анализа, а также достаточно сложного программирования, — состоит в создании систем, дублирующих фонологический канал взаимодействия в зрительной модальности, как это имеет место при непосредственном речевом общении. Эти системы «видимой речи» иногда называют также «говорящими головами», поскольку они представляют собой показываемые на экране головы с движущимися в соответствии с фонетикой речи губами (Massaro, 1995). В качестве интерфейса, присоединенного к телефону, «видимая речь» должна поддерживать речевое общение людей с нарушениями слуха. Эти же системы могут использоваться для более эффективного речевого обучения слабослышащих детей. Наконец, данная частная технология нужна в качестве элементарной составляющей при создании виртуальных коммуницирующих агентов — дикторов индивидуально подобранных по интересам новостей, персональных секретарей, продавцов и менеджеров интернет-магазинов и т.п.
Практическое применение (защищенное несколькими патентами) находят работы по латентному семантическому анализу (см. 6.1.1 и 7.4.2). Он используется, например, для определения индивидуального профиля интересов покупателей интернет-магазинов. Каждый выбор книги в интернет-магазине фирмы AMAZON сопровождается определением семантического вектора интересов, к которому автоматически подбираются наиболее похожие книги, сразу же предлагаемые для покупки (обычно в пакете двух-трех наименований). Последующее взаимодействие позволяет еще более точно определить профиль интересов данного клиента. Понятно, что эта же когнитивная технология может использоваться и в целом ряде других практически важных ситуаций — подборе работы по интересам и квалификации клиента, нахождении сходных по содержанию текстов при полном различии составляющих эти тексты слов и, например, при автоматической оценке качества перевода текстов с одного языка на другой.

Фундаментальная проблема состоит в поддержке коммуникации, которая включена в процессы решения некоторых конкретных опосредованных использованием компьютеров практических задач (CSCW, computer supported cooperative work — поддерживаемая компьютерами совместная работа). В отличие от развернутого речевого общения процессы практического взаимодействия включают массу экстралингвистических, или «синпрактических», компонентов. Космонавт, пытающийся укрепить солнечную батарею, авиамеханик, находящийся внутри ремонтируемого им двигателя, военный медик, делающий операцию, или мобильный робот, демонтирующий ядерный реактор, часто нуждаются в строго дозированной в пространстве и времени подсказке экспертов, иногда находящихся за сотни километров от места событий. Поиск решения связан с предоставлением всем участникам общения наряду с акустическим каналом связи видеоизображения рабочей зоны, генерируемого с помощью одной или нескольких телевизионных камер. Однако видеоизображение ситуации в целом еще недостаточно специфично, чтобы быстро и однозначно определить предметные референты практических инструкций типа «Соедини эту штуковину с той» или «Убери камень с правой стороны».
Некоторое время назад нами было предложено явно вводить в опосредованное компьютерами общение информацию о фокусе внимания и интенциях участников (Velichkovsky & Hansen, 1996). Речь идет прежде всего о поддержке операций совмещения внимания участниками общения. Эффекты совместного внимания (joint attention) и их взаимодействие с речью хорошо известны из исследований онтогенеза (см. 7.1.2). Еще Выготский отмечал, что социализация внимания является важнейшим условием речевого и интеллектуального развития младенца. В первые месяцы жизни называние взрослым некоторого объекта увеличивает продолжительность его зрительной фиксации младенцем по сравнению с фиксацией других объектов, одновременно присутствующих в поле зрения (Bornstein, 1996). При возникновении речевой коммуникации характер речи во время фаз «совместного внимания» и вне них оказывается различным как по семантике, так и по синтаксису (Tomasello, 1996). В дальнейшем мы остаемся чрезвычайно чувствительны к направлению взора наших визави (нечувствительность к нему является одним из важнейших диагностических признаков аутизма)*9. Можно сказать, что отслеживание и учет распределения внимания
49 Для изучения особенностей реагирования на другого человека в последнее время
успешно используются методики предъявления виртуальных антропоморфных агентов,
аватаров. Эти исследования (Helmert et al., 2005, Schilbach et al, 2005) свидетельствуют о
том, что очень похожие по психофизическим параметрам социальные стимулы могут об
рабатываться на разных уровнях когнитивной организации в зависимости от личной вов
леченности испытуемого, которая определяется прежде всего контактом «глаза в глаза»
(см. 9.4.2).                                                                                                                                                  171

партнеров — одно из важнейших условий успешного общения и организации совместной деятельности
Современные коммуникативные технологии, такие как электронная почта, интернет и видеоконференции, позволяют исключительно быстро, в режиме близком к реальному времени передавать гигантские объемы текстовой и визуальной информации При этом, однако, отчасти теряется важнейшая информация о динамике внимания участников общения В результате значительная часть диалогов участников видеоконференций посвящена не обсуждаемым проблемам, а самому процессу коммуникации («Кому ты это сейчас говоришь7»), а вероятность полетов менеджеров крупных корпораций друг к другу после проведения телеконференций часто возрастает, а не уменьшается Применение основанных на видеообработке систем регистрации движений глаз может быть необходимым дополнением существующих коммуникационных технологий Действительно, передача информации о том, где в предметном окружении в данный момент находится точка фиксации и, следовательно (с известными оговорками — см 4 3 1), фокус зрительного внимания позволяет формировать состояния «совместного внимания», значительно облегчая решение конструктивных задач кооперативного типа (Vehchkovsky, 1995)50
Тот же прием делает возможным отслеживание социальной микродинамики диалогов участников видеоконференций На рис 7 9А показана современная версия более ранней экспериментальной системы GAZE (ВЗОР), которая включала регистрацию направления взора участников обсуждения (Vertegaal, Vehchkovsky & Van der Veer, 1997) Такая бесконтактная регистрация движений глаз, основанная на автоматическом слежении за зрачком в видеоизображении, упоминалась нами в одной из предыдущих глав (см 2 4 2) Если некоторый участник (партнер 1) обсуждения обращается к другому участнику (партнер 2), фиксируя лицо этого участника на экране компьютера, то на мониторах всех других партнеров изображение лица и глаза партнера 1 поворачиваются в направлении изображения лица партнера 2, так что доминирующая межличностная направленность обращения становится очевидной Путем высвечивания местоположения фокуса зрительного внимания (например, с цветовой маркировкой для идентификации участника) в совместном рабочем поле данная методика делает также возможным выделение объектных референтов речи На рис 7 9Б показана еще одна современ-
50 Следует отметить, что зрительные фиксации могут выполнять несколько разных функций, таких как относительно поверхностная, амбьентная обработка или же фокальная обработка, направленная на идентификацию объектов (см , например, 3 4 2) Коммуникативную нагрузку несут скорее продолжительные фиксации длительностью более 500 мс Фильтрация подобных фиксаций позволяет, кстати, использовать взгляд в качестве замены традиционной компьютерной мышки (Vehchkovsky & Hansen, 1996) Это важно при затруднениях в использовании рук и речевого ввода информации, в частности, парализованными людьми В настоящее время во всем мире используется несколько сотен систем управления компьютерами (а следовательно, и множеством других технических систем) с помощью взора для инициации команд нужно просто чуть внимательнее по-172        смотреть на соответствующий иконический знак



Рис. 7.9. Системы виртуального общения, использующие информацию о направленности зрительного внимания участников А Модификация более ранней лабораторной разработки, Б Современная промышленная система VR-видеоконференций (по Ве-личковскии, 2003)

ная коммуникационная система такого рода, используемая для проектирования новых изделий в автомобильной промышленности (с разрешения фирмы DaimlerChrysler)
Интересно, что проблема эксплицитного выявления фокуса внимания весьма остро стоит и в случае других современных коммуникационных технологий Так, развитие собственно речевого взаимодействия с компьютерами и вообще разнообразными техническими системами

173

сдерживается тем обстоятельством, что существующие голосовые интерфейсы, к сожалению, не обладают способностью к селективному восприятию, например, в его специфической форме, известной в когнитивной психологии как эффект вечеринки (см. 2.2.1). Эти устройства просто пытаются обработать все, что произносится в непосредственной от них близости. Поэтому и здесь очень важной представляется задача разработки чувствительных к вниманию пользователя интерфейсов.
Выявление интенций представляет собой следующий, еще более сложный и важный этап в развитии технологических приложений когнитивных исследований по сравнению с описанными попытками включения параметров внимания в процессы коммуникации. Основная перспектива здесь состоит в создании совершенно нового, некомандного принципа взаимодействия человека и технических систем. Попробуем проиллюстрировать эту идею двумя примерами актуальных практических разработок. Первый пример уже кратко упоминался в этой главе, в разделе, посвященном чтению (см. 7.2.3). Почему иностранный язык нужно, по возможности, учить в живом общении с носителями языка? Потому что при межличностном взаимодействии происходит постоянное отслеживание затруднений партнера и поддержка предоставляется тогда, когда надо, и в объеме, который необходим для данной ситуации. Нельзя ли смоделировать подобную гибкую поддержку, оказываемую без эксплицитного запроса (то есть «без команды» — некомандный принцип) со стороны испытывающего затруднения пользователя и без обычного отвлекающего от контекста «путешествия» по словарям и тезаурусам?
Поскольку значительная часть эмпирических данных по текущему анализу процессов понимания накоплены в области чтения, именно здесь наметился прорыв к новым решениям. Идея состоит в том, чтобы в самом текущем процессе (то есть в режиме on-line) чтения иностранного текста детектировать сочетания параметров движений глаз, свидетельствующих о возникших трудностях понимания (как отмечалось выше, такими признаками являются прежде всего регрессии — возвраты к некоторому слову одновременно с увеличением длительности фиксаций), и осуществлять дозированную подсказку перевода в родном или любом другом удобном для читателя языке. Первый прототип подобного интеллектуального интерфейса iDICT, разработанный финскими ин-форматиками совместно с немецкой фирмой SensoMotoric Instruments, был показан в конце 2005 года. Он содержит три функциональных блока: 1) лингвистический модуль, описывающий структуру текста и прогнозирующий сложность отдельных его компонентов; 2) модуль знаний о параметрах движений глаз при обычном чтении и при возникновении трудностей понимания; 3) коннекционистский модуль, обеспечивающий адаптацию к индивидуальным особенностям движений глаз.
Второй пример связан с усилиями, направленными на повышение бе
зопасности автотранспорта. Основной причиной столкновений на скоро
стных магистралях, иногда вовлекающих десятки машин, является нару-
174                       шение правила сохранения дистанции до впереди едущего автомобиля.

Устройства, автоматически выдерживающие нужное расстояние с учетом скорости, условий видимости и параметров поверхности дороги, давно созданы. Эти так называемые ACCs — от Adaptive Cruise Control сканируют окружение, выделяют другие машины и поддерживают по отношению к ним определенное, зависящее от перечисленных выше условий расстояние, так что если водитель хочет двигаться слишком быстро, приближаясь к впереди едущей машине, педаль газа становится более жесткой. Однако вскоре выявилась следующая проблема: если водитель вынужден отключить подобное устройство для осуществления обгона, то потом оно им почему-то не включается. Традиционный принцип «коммуникации» человека и машины посредством эксплицитных команд здесь не работает. Некомандное решение проблемы разрабатывается, в частности, в рамках проекта под названием «Что человеческий глаз говорит мозгу автомобиля». При этом отслеживаются паттерны движений глаз, характерные для интенции обгона. При возникновении такого паттерна система блокировки скорости отключается сама, а при восстановлении обычного режима визуального сканирования — включается вновь.

Хотя и со значительной задержкой по сравнению с естественными науками психология начинает влиять на пути развития высоких технологий. Часто мы даже не знаем слов, которые будут использоваться для обозначения всех этих новых направлений прикладных исследований. Самое последнее предложение состоит в том, чтобы называть их «когнитивными техническими системами». Не имеет пока устойчивого названия и работа по психологической поддержке технологий «виртуальных форм жизни» — интеллектуальных «действующих лиц» (агентов и авата-ров — Поспелов, 2003; Schilbach et al., 2005), а также область исследований, связанная с оптимизацией взаимодействия человека с мобильными роботами, а не просто с обычными стационарными компьютерами (см. 2.1.2, 9.2.3 и 9.4.2). Нет, впрочем, никакого сомнения, что речь идет при этом о возникновении совершенно нового поколения адаптивных человеко-машинных систем. Задача разработки этих технологий 21-го века является самым серьезным практическим вызовом экспериментальной психологии и когнитивной науке за всю историю их существования.

Ваш комментарий о книге
Обратно в раздел психология










 





Наверх

sitemap:
Все права на книги принадлежат их авторам. Если Вы автор той или иной книги и не желаете, чтобы книга была опубликована на этом сайте, сообщите нам.