Библиотека

Теология

Конфессии

Иностранные языки

Другие проекты

Ваш комментарий о книге

Величковский Б. Когнитивная наука: Основы психологии познания

ГЛАВА 3. СЕНСОРНО-ПЕРЦЕПТИВНЫЕ ПРОЦЕССЫ

3.1 Пространство и время восприятия

Зрительная пространственная локализация
Восприятие движения и времени
Перцептивные взаимодействия и маскировка

3.2 Взлет и падение «иконы»

Иконическая память
Эхоическая память
Микрогенез как альтернатива

3.3 Распознавание конфигураций

Традиционные психологические подходы
Влияние нейронаук и информатики
Роль предметности и семантический контекст

3.4. Восприятие и действие

Сенсомоторные основы восприятия
(и наоборот)
Уровни восприятия
Развитие и специализация восприятия

164

Изучение восприятия началось с описания перцептивных иллюзий и явлений константности, то есть относительной независимости воспринимаемых параметров объектов — положения, ориентации, размера, цвета и т.д. — от физических условий стимуляции. Это позволило в 19-м веке выделить данную область как отличную от сферы интересов оптики и акустики. Гештальтпсихологи Вертхаймер, Кёлер и Коффка описали затем эффекты перцептивной организации, подчеркнув, что восприятие имеет собственные закономерности и не сводится к памяти и мышлению. К началу когнитивной эпохи в области восприятия сосуществовало два основных подхода. Для первого — непрямого или конструктивистского — исходной осталась задача интерпретации ощущений. Поскольку ощущения как проксимальные отображения объектов явно аконстантны, исследователи вынуждены были постулировать процессы их внутренней коррекции с помощью памяти или мышления, например, гельмгольцевских «бессознательных умозаключений». Точку зрения прямого восприятия сформулировал в середине 20-го века ученик Коффки Джеймс Джером Гибсон. Он описывал восприятие как процесс сбора информации о дистальных объектах, осуществляемый с помощью локомоций и предметных действий. Получаемая при этом Информация адекватна объектам и не требует коррекции.
Первые модели переработки информации человеком в когнитивной психологии имели конструктивистский характер. Их неизменным компонентом были блоки «иконической» и «эхоической» памяти, содержание которых выполняло роль зрительных и слуховых ощущений. Не случайно один из авторов, много сделавший для объяснения восприятия, писал в эти годы: «Безусловно, Гельмгольц почувствовал бы себя на знакомой почве, посети он нас после 80-летнего отсутствия» (Epstein, 1977, IX). Когнитивное сообщество вначале игнорировало последователей Гибсона с их лозунгом «Не спрашивай, что внутри твоей головы, а спрашивай, внутри чего твоя голова». Затем ситуация изменилась. Для решения практических задач пришлось перейти к изучению восприятия в естественной среде и в условиях подвижности наблюдателя. Эта среда стала интенсивно изучаться и моделироваться, в результате чего возникла технология виртуальной реальности. Были выявлены группы нейрофизиологических механизмов, в различной степени зависящие от ситуации и от наших представлений о ней. Складывается впечатление, что сторонники альтернативных подходов пытались описать процессы, разворачивающиеся на разных эволюционных уровнях восприятия.

3.1 Пространство и время восприятия
3.1.1 Зрительная пространственная локализация

Среди других перцептивных процессов восприятие пространства выделяется множественностью (избыточностью) своих операций, а также тем, что оно специально настроено на функционирование в нормальных условиях жизнедеятельности: стабильности большинства предметов, независимости их размеров от расстояния до наблюдателя, продолжения существования предмета, частично или полностью вышедшего из поля зрения, и т.д. Легкость, с которой воспринимаемые пространственные отношения определяются искусственными, но экологически правдоподобными стимульными ситуациями, неоднократно давала повод для сравнения механизмов восприятия пространства с изученными этологами врожденными механизмами, запускающими видоспецифи-ческие формы поведения. С этой точки зрения, восприятие пространства могло бы служить примером модулярной системы (Fodor, 1983), если бы не его высокая пластичность и интермодальность, которые явно противоречат некоторым из критериев модулярности (см. 2.3.2 и 3.4.3).
Наиболее известным примером восприятия пространства является бинокулярное восприятие глубины. Джордж Беркли, а затем Герман Гельмгольц дали классическое объяснение этому процессу, основанное на допущении возможности субъективного отображения и интерпретации проксимальной стимуляции. Согласно этой конструктивистской трактовке, восприятие глубины начинается с того, что мы отмечаем различия — диспаратностъ — монокулярных ретинальных изображений, обусловленные несовпадением положений левого и правого глаза в пространстве. Затем на основании этих видимых различий, положений отображений на сетчатке и знаемого расстояния между глазами вычисляется (этап «бессознательных умозаключений») относительная удаленность различных участков сцены.
Важным вкладом в психологию восприятия стали работы американо-венгерского исследователя Белы Юлеза (например, Julesz, 1995), доказавшего возможность бинокулярного восприятия глубины в ситуации, когда это классическое объяснение не работает1. Идея его методики возникла из практики аэрофотосъемки и стереоскопического анализа участков земной поверхности, используемых для определения рельефа местности и при поиске замаскированных объектов. На рис. 3.1 показан пример созданных Юлезом случайно-точечных стереограмм. Для создания стереограмм использовалась матрица размером 100x100, ячейки которой случайно заполнялись с вероятностью 50%. Обе стереограм-мы идентичны за исключением небольшого центрального участка квад-
1 Самые первые демонстрации этого рода были проведены советским исследователем
восприятия Б.Н. Компанейским еще в конце 1930-х годов. 165

Рис. З.1. Пример случайно-точечных стереограмм из работ Юлеза и схематическое пояснение способа их построения.
ратной формы, который несколько смещен в сторону в одной из них. Из-за бесконтурности изображений и совпадения статистических характеристик текстур увидеть этот диспаратный участок при обычном рассматривании стереограмм практически невозможно. Однако если они предъявляются с помощью стереоскопа, независимо левому и правому глазу, мы сразу видим участок квадратной формы, выступающий из окружающего фона2. Если поменять правое и левое изображения, то, в соответствии с заменой знака диспаратности, объект воспринимается как находящийся за поверхностью фона, дальше от наблюдателя. Восприятие глубины, следовательно, оказывается возможным, несмотря на отсутствие объектов или контуров, которые можно было бы увидеть в монокулярных полях зрения.
С традиционной, конструктивистской точки зрения, восприятие объектов или, по крайней мере, контуров в монокулярных полях зрения является предпосылкой бинокулярного восприятия пространства. В случайно-точечных стереограммах порядок событий оказывается прямо противоположным — пространственная локализация служит

166

2 Здесь, правда, возможны индивидуальные различия. Примерно у 7% людей наблюдаются те или иные врожденные дефекты стереопсиса, причем, как и в случае нарушений цветовосприятия, они затрагивают в основном мужскую часть населения.

предпосылкой идентификации объектов. Кроме того, восприятие глубины в подобных стереограммах требует значительно менее выраженных перепадов яркости (меньшего контраста), чем восприятие формы. Поэтому типичными оказываются ситуации, при которых пространственная удаленность объекта оценивается правильно, но его форма еще не может быть определена: он воспринимается как аморфное «нечто».
Каждая поверхность в зависимости от ее материала отражает специфический рисунок распределения света. Поэтому для зрительного выделения объекта в пространстве необходимо наличие зернистости — текстуры — в видимом окружении. Если внутри некоторой области нет обладающих определенной зернистостью рельефов яркости, то она воспринимается как пустое отверстие, не мешающее проникновению за его границы3. Значение текстур для восприятия в особенности подчеркивал в своих работах Джеймс Дж. Гибсон. Результаты Юлеза показывают, что восприятие пространственного положения основано не на интерпретации ощущений, а на автоматических процессах параллельной обработки (кросскорреляции) текстур.
Как можно описать подобные процессы? Для чисто формального описания можно воспользоваться, например, подходом американского психофизика У. Юттала (Uttal, 1975), который разработал автокорреляционную модель обнаружения присутствия точечных конфигураций на фоне динамического шума. Автокорреляционная функция определяется степенью перекрытия копии текстуры с исходным ее вариантом при сдвигах копии относительно вертикальной и горизонтальной осей. При высокой степени перекрытия, вызванной регулярностью конфигурации, на графике автокорреляции появляются пики. Успешность обнаружения конфигураций, согласно данным У. Юттала, хорошо описывается следующим показателем:

F = [ii(AxA)/dj]n (И),
1=1 j=l

где At — амплитуда 1-го пика, А — амплитуда у-го пика, d — евклидово расстояние между двумя пиками, а и — общее число пиков. Для описания процессов параллельной обработки случайно-точечных стереограмм юлезовского типа автокорреляционный процесс может быть заменен

где At — амплитуда 1-го пика, А — амплитуда у-го пика, d — евклидово расстояние между двумя пиками, а и — общее число пиков. Для описания процессов параллельной обработки случайно-точечных стереограмм юлезовского типа автокорреляционный процесс может быть заменен

3 Речь идет в основном о перепадах яркости, а не цвета. Ученица Коффки Сузанна
Либманн (см. Konica, 1935) обнаружила следующий эффект. Если яркость двух примыка
ющих друг к другу поверхностей выравнивается, так что они начинают отличаться между
собой только цветом (спектральным составом отраженного света), то граница этих по
верхностей неожиданно теряет стабильность и определенность формы. Исследования с
применением равнояркостных стимулов выявили ряд разновидностей данного эффекта:
уплощение пространственных рельефов, замедление и даже исчезновение впечатления
движения объектов и т.д. (Livingstone & Hubel, 1987). Причина этих феноменов состоит в
том, что восприятие цвета — относительно поздний продукт перцептивной обработки
(частично связанный с зоной V4 зрительной коры). Пространственная локализация по
верхностей, основанная на выделении текстур и перепадов яркости, является скорее ус
ловием, чем следствием такого восприятия (см. 3.1.3). 167

точно такой же кросскорреляцией текстур в левом и правом монокулярных полях зрения при их взаимных сдвигах относительно горизонтальной оси. Результатом будет обнаружение и определение степени сдвига повторяющегося диспаратного участка.
Для оценки нейрофизиологической реальности таких процессов следует упомянуть еще одну важную линию исследований. В 1970-е годы, в исследованиях восприятия получили распространение теории, основанные на предположении, что зрительная система проводит Фурье-анализ ретинального изображения, то есть выделяет в его составе синусоидальные компоненты разной пространственной частоты и амплитуды. Фурье-анализ изображений основан на использовании теоремы, доказанной в 1822 году французским математиком и физиком Жаном Батистом Фурье. Согласно этой теореме, любая аналитическая функция может быть приблизительно описана как сумма некоторого числа синусоидальных компонентов, отличающихся частотой, амплитудой (контрастом) и фазой. В случае двумерных распределений яркости (к ним может быть отнесено ретинальное изображение) к этим трем параметрам добавляется ориентация соответствующих синусоидальных решеток. Эти идеи, как и представления о корреляционном анализе частот, первоначально возникли в области анализа механизмов слухового восприятия. Несмотря на ряд трудностей (например, таких, как проблема сохранения информации о фазе), в рамках этих моделей удается описать процессы детекции акустических и зрительных стимулов типа синусоидальных и производных от них решеток. Наличие в зрительной системе нейронов, селективно чувствительных к различным пространственным частотам изображения, подтверждается большим числом данных (Brace, Green & Georgeson, 2003).
Эти данные свидетельствуют о том, что кросскорреляционная обработка текстур, лежащая в основе бинокулярного восприятия глубины, по-видимому, осуществляется только в перекрывающихся по пространственной частоте участках спектра. Иными словами, используя для областей фигуры и фона каждой из предъявляемых одновременно стерео-грамм текстуры различной степени зернистости (то есть материал с разной пространственной частотой), можно создать ситуацию, обратную опытам Юлеза — диспаратные объекты сами по себе будут отчетливо видны в каждой из отдельно взятых стереограмм, но при их предъявлении независимо левому и правому глазу впечатление глубины будет полностью отсутствовать. Следовательно, постулируемая классическим, конструктивистским подходом возможность феноменального восприятия объектов или, по крайней мере, контуров в монокулярных полях зрения не является ни необходимым, ни достаточным условием бинокулярного восприятия глубины.
Стереопсис (или бинокулярный параллакс) — лишь один из множества механизмов перцептивной оценки глубины и удаленности. Среди них есть и другие, столь же базовые механизмы, как бинокулярный параллакс, причем они явно присутствуют и у многих животных, не обладающих бинокулярным зрением из-за отсутствия фронтального расположе-168 ния глаз. К таким механизмам относится детекция параллакса движения

Рис. 3.2. Два примера градиентов величины и плотности: А. Уходящая вдаль поверхность; Б. Поверхность, глобальное расстояние от участков которой до наблюдателя не меняется.

(различия угловой скорости объектов в зависимости от их удаленности при движениях самого наблюдателя), перекрытия объектов (при этом фактически используется факт продолжения существования предметов, частично вышедших из поля зрения), воздушной перспективы (низкий контраст и голубоватая окраска далеких объектов), распределения света и тени (здесь для оценки знака рельефа поверхностей используется информация об актуальном или типичном положении источника света), а также градиентов величины и плотности элементов текстуры (см. рис. 3.2). Наконец, к этой же группе базовых биопсихологических механизмов, по-видимому, относятся аккомодация и вергентные движения глаз (см. 3.4.1). Учет вергентных движений существенен для калибровки оценок удаленности, так как в зависимости от степени конвергенции одной и той же диспаратности будут соответствовать различные значения глубины (это последнее утверждение время от времени ставится под сомнение — см. Logvinenko, Epelboim & Steinman, 2001).
Перечисленные выше механизмы восприятия глубины и удаленности имеют различное значение внутри разных «срезов» эгоцентрического окружения наблюдателя. В одной из классификаций (Cutting, 2003) предлагается рассматривать три вложенные друг в друга и довольно приблизительно очерченные сферы: персональное пространство (personalspace), пространство действия {actionspace) и воспринимаемое пространство {vistaspace). Механизмы перцептивной обработки конвергенции и аккомодации работают практически только внутри персонального

169

пространства (1—2 м), тогда как признаки перекрытия, гибсонианских фадиентов и воздушной перспективы эффективны во всем диапазоне еще воспринимаемого человеком окружения, то есть при идеальных условиях наблюдения (подходящий угол и интенсивность солнечного освещения, соответствующие по размерам объекты и чистый горный воздух) примерно до десяти километров и, если очень повезет, даже несколько больше.
Наряду со всеми этими механизмами имеются признаки глубины и, соответственно, процессы их перцептивной детекции и обработки, носящие выраженный культурно-исторический характер. Все они, без какого-либо исключения, используются для решения задачи передачи и интерпретации глубины в двумерных изображениях. Следует отметить, что различные культурные традиции интерпретации глубины опираются на отдельные аспекты более базовых нейрофизиологических механизмов. Эта ситуация в известной степени аналогична соотношению процессов цветонаименования и физиологических механизмов восприятия цвета, где историческое развитие соответствующей области лексикона постепенно выявляет более фундаментальные механизмы нейрофизиологического кодирования информации о цвете, основанные, например, на контрастировании оппонентных цветов (см. 8.1.2).
Наиболее известным из числа таких «вторичных признаков глубины» является линейная перспектива, использующая работу механизма выделения градиентов величины и плотности. Теория линейной перспективы была разработана и почти канонизирована европейским Возрождением. Тем не менее большие художники никогда не следовали ее предписаниям буквально, учитывая константность величины и формы, то есть относительную независимость воспринимаемых размеров и очертаний предмета от его удаленности и ориентации в пространстве. Кроме того, даже следуя законам линейной перспективы, художники вводили в построение картины несколько систем перспектив, соответствующих различным точкам зрения (этот прием начал применять Джотто, 1266—1337). В традиционной китайской и японской живописи, не знающей линейной перспективы, основными приемами передачи удаленности являются имитация воздушной перспективы (передача удаленных объектов более блеклыми и голубоватыми цветами) и так называемой параллельной перспективы (варьирование положения на вертикальной оси: чем выше расположено изображение объекта на плоскости, тем больше его подразумеваемая удаленность). Размеры изображенных предметов при этом могут не меняться, как и должно было бы быть при 100% константности. В византийских и древнерусских иконах общим случаем является даже обратная перспектива, при которой размеры изображений объектов увеличиваются с предполагаемой удаленностью4.
4 Причины подобной «сверхконстантности» как раз в случае иконописи остаются не вполне понятными (Раушенбах, 1980). Возможно, разгадку обратной перспективы следует искать скорее в особенностях зрительной памяти и воображения, чем собственно восприятия. При возникновении последовательных образов, а также в случае так называемой эйдетической памяти (см. 5.3.1) размеры представляемых объектов увеличиваются при увели-170 чении их предполагаемой удаленности. Такая зависимость называется «законом Эммерта».

Таблица 3.1. Основные признаки глубины и удаленности, эффективные в процессах зрительного восприятия

Признаки глубины и удаленности	Бино-/ монокулярн.	Абсолют./ относит.	Качеств./ количеств.
Бинокулярный параллакс	бино	отн.	кол.
Вергентные движения глаз (до 3 м)	бино	абс.	кол.
Аккомодация хрусталика (до 2 м)	моно	абс.	кол.
Монокулярный параллакс (параллакс движения)	МО НО	отн./абс. (?)	кол.
Перекрытие поверхностей/текстур	моно	отн.	кач.
Градиенты величины и плотности (геометрическая перспектива)	моно	отн./абс. (?)	кол.
Знание размеров и удаленности ориентиров	моно	абс.	кол.
Высота положения в поле зрения	моно	отн.	кол.
Воздушная перспектива (размытость контуров и цвет)	моно	отн.	кол.
Распределение света и тени	моно	отн.	кач./кол. (?)
Разделение на фигуру и фон	моно	отн.	кач.

Перечисление основных признаков восприятия глубины и удаленности, используемых при зрительном восприятии пространства, дано в табл. 3.1. Как видно из таблицы, значительное большинство этих признаков может использоваться в монокулярных условиях. При этом вне зоны ближайшего пространственного окружения (пространство действия с включенным в него персональным пространством), где возможно непосредственное сенсомоторное взаимодействие с предметами, зрение выделяет скорее относительную информацию о взаимной удаленности объектов. За пределами этой зоны (все еще воспринимаемое пространство, vista space) абсолютные оценки удаленности объекта помогает выносить опора на память, то есть на знаемые размеры предметов и известную (привычную) удаленность ориентиров. Нако-1 нец, выделяемая стереозрением информация носит как порядковый (например, в случае очень мощного признака перекрытия поверхностей), так и количественный, метрический характер (бинокулярный параллакс).

171

Второй классической проблемой восприятия пространства является стабильность видимого мира. Дело в том, что оценка видимого направления не меняется при движениях глаз (и даже несколько улучшается при их наличии). Под движениями глаз в данном случае имеются в виду саккады — чрезвычайно быстрые, до 800°/с, скачки, переводящие глаза в новое положение для фиксации, то есть относительно неподвижное состояние, во время которого и осуществляется сбор сенсорной информации (см. 3.4.1). В среднем глаза совершают от 3 до 5 саккадических скачков каждую секунду, свыше 160 000 раз в течение каждого дня нашей жизни (мы не принимаем при этих подсчетах во внимание движения глаз во время так называемой REM-фазы сна). Возникающие во время саккад перемещения проекции объектов по сетчатке не воспринимаются нами и не ведут к ошибочным оценкам положения этих объектов в физическом окружении.
Подобная стабильность видимых направлений представляет собой один из первых описанных в литературе феноменов восприятия, известный уже Аристотелю. В 19-м веке были сформулированы два основных объяснения, с небольшими вариациями встречающиеся в нейро-и психофизиологии до сих пор. Эрнст Мах предположил, что коррекция зрительного восприятия осуществляется на базе проприоцептив-ной информации, поступающей от рецепторов глазных мышц. Гельм-гольц выдвинул несколько более сложную гипотезу, согласно которой каждое произвольное движение глаз сопровождается прогнозом изменений зрительной стимуляции. Сравнение этого прогноза, связанного с эфферентной командой (или, в современной терминологии, «эфферентной копии»), с сенсорной ситуацией после осуществления движения («реафферентацией») позволяет судить о том, произошли ли в окружении за время саккадического скачка глаза какие-либо фактические изменения.
Возможность проверки этих предположений связана с обездвижением глаз. С точки зрения теории эфферентного прогноза, но не про-приоцептивной коррекции, в такой ситуации можно ожидать иллюзорных скачков видимого мира при каждой попытке посмотреть в сторону. В последние десятилетия несколько исследователей попытались проверить эти классические гипотезы путем внутривенного введения себе яда кураре. Это вещество селективно блокирует нервно-мышечную передачу импульсов, временно вызывая паралич мышц тела. Система мышц, вращающая глазное яблоко в орбите, отключается при этом в последнюю очередь, поэтому такие опыты можно проводить лишь в клинических условиях, с использованием аппарата искусственного легкого. Полученные результаты свидетельствуют об отсутствии иллюзорного движения и скачков объектов в зависимости от интенции двигать глаза, и, следовательно, они не подтверждают гипотезу об активном прогнозе обратной
афферентации как основе видимой стабильности (Matin, 1986). Одно-172

временно в независимых экспериментах было показано, что проприоцеп-ция от мышц недостаточно точна, а главное, слишком медленна, чтобы ее можно было полноценно использовать для корректировки восприятия при саккадических движениях глаз. Поэтому в целом не подтверждается и альтернативная гипотеза проприоцептивной коррекции.
Не все авторы считают оправданным столь интенсивный интерес к стабильности видимого мира. Для Гибсона и его последователей (а ранее, конечно, и для гештальтпсихологов) — это всего лишь псевдопроблема. Зрительное восприятие, с их точки зрения, направлено на поиск инвариантных характеристик оптического потока. Воспринимаемое направление определяется при этом относительным положением объекта в окружении, которое не меняется при движениях глаз. Несколько иное объяснение предложил в начале 1970-х годов Дональд М. Маккай. По его мнению, в относительно стабильном мире стабильность положения большинства объектов автоматически принимается организмом в качестве «нулевой гипотезы», которая сохраняется до тех пор, пока не будет получено убедительных доказательств обратного5.
Но стабильность видимого мира не удается списать со счета просто так, как нечто само собой разумеющееся. Прежде всего она не сохраняется при нарушении в работе вестибулярных функций и, например, при алкогольном отравлении. Кроме того, с конца 1980-х годов стали широко проводиться эксперименты, в которых предъявление информации зависело от одновременно регистрируемых движений глаз. Эти эксперименты показали, что примерно в течение первых 50—100 мс после начала зрительной фиксации однозначная и устойчивая локализация быстро предъявляемых тест-объектов отсутствует. Далее было установлено, что если во время саккадического скачка осуществляются сдвиги, перестановки и даже подмена объектов, то испытуемые часто этого просто не замечают (о феномене «слепоты к изменению» см. подробнее 3.1.3 и 4.4.1). Данный факт противоречит традиционным теориям стабильности видимого мира, поскольку они предполагают существование детальной «транссаккадической памяти» — либо в форме прогноза вероятных изменений зрительной стимуляции (Гельмгольц и многие последующие авторы), либо в форме образа ситуации, который может требовать (Мах), а может и не требовать (Маккай) дополнительной интермодальной коррекции.
5 Независимость восприятия пространства от наших собственных движений под
черкивал и H.A. Бернштейн: «Когда мы ходим, поднимаемся по лестнице, поворачи
ваемся вокруг себя, мы не только знаем, но и ощушаем со всей наглядностью и непо
средственностью, что перемещаемся мы, в то время как пространство с наполняющи
ми его предметами неподвижно, хотя все рецепторы говорят нам обратное. Если мож
но так выразиться, каждый субъект еще с раннего детства преодолевает для себя эго
центрическую, птоломеевекую систему координат, заменяя ее коперниканской» ( 1947/
1991, с. 82). 173
Эти данные заставляют пересмотреть взаимоотношения восприятия, памяти и сознания. Если ранняя экспериментальная психология абсолютизировала роль сознания, то когнитивная психология первоначально явно преувеличила роль памяти, заменив анализ процессов восприятия на представление о сохранении сенсорной информации в периферических регистрах — иконической и эхоической памяти. Как будет показано в следующем разделе, это представление создает больше проблем, чем решает (см. 3.2.1 и 3.2.2). Возможно, восприятие стабильного окружения вообще не связано с существованием сколько-нибудь детального, удерживаемого в памяти образа. Дело в том, что запоминание и сравнение таких массивов данных потребовало бы от зрительной системы гигантского объема собственно когнитивных ресурсов, которыми зрительная система не располагает. Вместо этого есть очень быстрые, требующие, как правило, менее 100 мс процессы пространственной локализации самих объектов. Эти процессы инициируются вновь и вновь после каждого саккадического движения глаз и, во-видимому, после каждого моргания (Bridgeman, Van der Heijden & Velichkovsky, 1994; Velichkovsky et al., 2002a).

3.1.2 Восприятие движения и времени

Чтобы перейти к обсуждению восприятия движения, необходимо кратко рассмотреть две общие особенности перцептивных процессов: их интермодальность и их опору на целую иерархию выделяемых в окружении пространственных систем отсчета. Несмотря на анатомические различия, разные сенсорные модальности работают в отношении оценки пространственных характеристик как одна функциональная система (см. 1.4.2). Так, варьирование интенсивности билатерально предъявляемых стимулов приводит к аналогичным изменениям направления не только в зрительной, слуховой и осязательной модальностях, но даже в обонятельной и вкусовой (Shipley & Rowlings, 1971). Конечно, при этом сохраняются различия. Например, слуховая локализации обычно быстрее, чем зрительная, но ее точность ниже, в частности, на слух мы не можем определить, находится ли источник звука перед нами или за нашей спиной. Отдельные модальности можно уподобить группам инструментов симфонического оркестра, исполняющих в разном ключе и с вариациями одну и ту же мелодию. Эта избыточность обеспечивает высокую надежность восприятия пространства, служащего опорой как для других перцептивных процессов, так и для решения собственно когнитивных задач.
Сам субъект восприятия также оказывается одним из локализуемых
компонентов окружения. Кожная, мышечная и, в особенности, сустав-
но-мышечная чувствительность традиционно рассматриваются как ос-
174 нова восприятия положения собственного тела и его движений — про-

Рис. 3.3. Примеры динамических градиентов Гибсона.
приоцепции и кинестезии. Речь идет о широкой интеграции ощущений взаимного расположения частей тела («схема тела» — уровень В) и положения тела во внешнем окружении («пространственное поле» — уровень С, по классификации Бернштейна — см. 1.4.3). Имея в виду интермодальность этих процессов, Гибсон писал о «зрительной кинестезии», а Бернштейн о «проприоцепции в широком смысле слова». Гибсон, длительное время проводивший исследования для ВВС США, выделил зрительные источники информации о собственных движениях, описав знаменитые динамические градиенты оптического потока (рис. 3.3). Скорость и целостная геометрия подобных трансформаций позволяют определить характер движений. Например, положение точки, остающейся неподвижной внутри потока оптического расширения {focusofexpansion, FoE), специфицирует направление движения наблюдателя6. Пространственное зрение взаимодействует и со значительно более древней вестибулярной системой. В частности, общая ориентация видимых контуров позволяет выделять информацию, соответствующую критическим для работы вестибулярной системы данным о направлении гравитационной вертикали.

6 Использование зрительной информации для контроля собственных локомоций зависит от способа перемещения в пространстве. При движениях с помощью технических средств решающая роль действительно принадлежит динамическим градиентам: изменяй одну только оптическую плотность объектов в периферии поля зрения (например, увеличивая плотность дорожной разметки), можно значительно более надежно заставить водителей тормозить на перекрестках, чем расставляя предупреждающие знаки. При перемещениях, так сказать, «на своих двоих» роль обнаруженных Гибсоном механизмов снижается и ведущим оказывается просто видимое направление на цель.

175

Характерной особенностью восприятия положения и движения является зависимость от пространственных систем отсчета. Роль систем отсчета можно проиллюстрировать следующим примером. Один из основных инструментов в кабине самолета — индикатор бокового наклона, или «авиагоризонт». Долгое время российские и западные авиастроители отдавали предпочтение разным вариантам отображения информации об этой переменной — «виду снаружи» и, соответственно, «виду изнутри» (см. рис. 3.4, А и Б). Этот спор объясняется присутствием различных систем отсчета, связанных с кабиной самолета и с внешним окружением. Зрительно стабильной кажется кабина, тогда как когнитивно, а с учетом вестибулярной афферентации также и сенсорно — земная поверхность. Нельзя ли использовать эти частные подходы для создания более гибкой системы отображения? Решение связано с учетом особенностей работы вестибулярной системы: из-за быстрой адаптации ее рецепторов вестибулярная система реагирует не столько на положение головы в пространстве, сколько на изменение этого положения (Величковский, Зинченко, Лурия, 1973). Поэтому характер отображения можно поставить в зависимость от темпа изменения наклона. При продолжительном полете без выраженных изменений наклона используется «вид изнутри», при резких изменениях — «вид снаружи», который постепенно вновь трансформируется (путем вращения дисплея, как показано на рис. 3.4В) в «вид изнутри» (Wickens, Gordon & Liu, 1998).

176

Рис. 3.4. Три различных варианта отображения информации о боковом наклоне самолета: А. «Вид снаружи»; Б. «Вид изнутри»; В. Комбинированный инструмент, сочетающий оба способа отображения в зависимости от темпа изменения наклона.

Обратимся, наконец, к рассмотрению восприятия движения. Прежде всего оно, безусловно, имеет такой же непосредственный характер, как и пространственная локализация, что связано с особой биологической значимостью тех и других процессов. Хорошо известно, например, что нейроны зрительной системы реагируют главным образом на движение стимула внутри соответствующих рецептивных зон. Следует, однако, очень осторожно использовать эти нейрофизиологические данные с точки зрения объяснения восприятия движения, так как критическую роль в последнем играют процессы детекции изменения положения объекта относительно внешних систем отсчета, а не перемещение стимула по сетчатке само по себе.
Так, при полном устранении зрительного контекста (в темноте или в другом гомогенном окружении) возникает иллюзия автокинетического движения: неподвижная и аккуратно фиксируемая цель начинает казаться движущейся то в одном, то в другом направлении, совершая «экскурсии», амплитуда которых может достигать десятка угловых градусов. Вариантом управляемого автокинеза является так называемое индуцированное движение, детально изученное Карлом Дунке-ром (Dunker, 1929). При этом в гомогенном поле наблюдателю предъявляется неподвижный объект с окружающей его рамкой. Если рамка — единственная видимая система отсчета — начинает двигаться, то наблюдатель воспринимает движение фиксируемого объекта в противоположную сторону. Это восприятие сопровождается отчетливым впечатлением отслеживания иллюзорного движения глазами, головой и даже всем корпусом!
Ситуация возникновения индуцированного движения служит удобной моделью для иллюстрации общих особенностей восприятия. Для получения особенно сильного эффекта индуцированного движения вместо рамки часто используются вертикальные полосы, заполняющие практически все зрительное поле. При этом может наблюдаться дополнительный эффект, свидетельствующий о непосредственной связи видимого движения с особенностями восприятия пространства. Когда испытуемый устает и перестает аккуратно фиксировать полосы или же специально получает инструкцию фиксировать точку, находящуюся перед фоном, может возникать бинокулярная фузия сдвинутых на один период полос. В результате большей конвергенции осей глаз (вергент-ные движения глаз калибрируют оценки удаленности и величины — см. 3.1.1) фон феноменально приближается к наблюдателю, ширина полос сужается и, что существенно, соответственно замедляется скорость индуцированного движения (Velichkovsky & van der Heijden, 1994).
Точно так же и пороги обнаружения реального движения в обычном структурированном окружении оказываются зависящими не от угловой, а от абсолютной скорости. Иными словами, движение воспринимается нами в трехмерном пространстве, с учетом удаленности объектов. Например, при бинокулярных условиях наблюдения пороги обнаружения
177

смещения объектов, горизонтально движущихся в противофазе в каждом из монокулярных полей зрения, оказываются выше порогов восприятия такого же движения только одним глазом. Это связано с тем обстоятельством, что в условиях стереоскопического зрения происходит фузия стимулов с меняющейся (из-за разной направленности монокулярных векторов смещения) диспаратностью и воспринимается движение объекта в глубину — по направлению от или к наблюдателю. Несмотря на практически идентичную картину стимуляции самой сетчатки, пороги обнаружения движения меняются, так как разрешающая способность восприятия движения в третьем измерении пространства не так высока, как для движения во фронто-параллельной плоскости7.
Особенно интересным индуцированное движение становится в случае двух и более систем отсчета. Предположим, что наблюдатель фиксирует в гомогенном окружении неподвижный объект, вокруг которого расположена рамка средних размеров и еще одна, окружающая ее внешняя рамка. Пусть теперь обе рамки начинают двигаться, причем в разных направлениях, скажем, внутренняя рамка направо, а внешняя вверх. В каком направлении будет «перемещаться» фиксируемый объект? На основании знакомства с физикой (а именно принципом параллелограмма, введенным в науку Галилеем — см. 6.4.3) можно было бы ожидать, что при этом будет происходить своего рода векторное суммирование, ведущее к возникновению иллюзорного движения объекта в направлении левого нижнего угла поля зрения. Но в восприятии происходит нечто иное. Центральный объект кажется движущимся строго влево. Вместе с этим средняя рамка и движущийся в ней объект как целое смещаются вниз.
Таким образом, при одновременном присутствии множества систем отсчета поведение локальных перцептивных структур определяется ближайшей системой отсчета. Ученик Кёлера и Коффки Вольфганг Метцгер (Metzger, 1941/2001) обобщил эти наблюдения в качестве общего закона организации феноменов сознания, распространив его и на другие области, включая психологию мотивации и межличностных отношений. Следует заметить, что для когнитивной науки характерно использование многочисленных производных этого принципа, с тем основным отличием, что вместо несколько громоздкого словосочетания
7 Эти факты говорят о том, что обработка, непосредственно ведущая к восприятию видимого движения, должна иметь место не ранее первичной зоны VI зрительной коры. В восприятии движения участвуют нейроны зоны V5 (MT/MTS) на границе затылочной и височной долей. Ее поражения или временные отключения (с помощью методики ТМС — см. 2.4.1) приводят к затруднениям в оценках направления и скорости движения. При этом нарушаются и следящие движения глаз (см. 3.4.1 ). Данное объяснение, однако, не является полным — неясными остаются механизмы интермодальных влияний на видимое движение. Поэтому можно предположить, что в восприятии движения участвуют также теменная кора и субкортикальные структуры (четверохолмие и базальные 178 ганглии), где происходит такая интермодальная интеграция.

Рис. 3.5. Эффекты расщепления влияния систем отсчета при восприятии жестов (А) и походки (Б).
«система отсчета» в современной психологии, лингвистике, а также работах по машинному зрению и искусственному интеллекту обычно используется термин «фрейм» (от англ. frame= рамка и frameofreference = система отсчета)8.

В чем причина подобного расщепления влияния одновременно присутствующих в окружении систем отсчета? Ответ заключается в том, что восприятие, по-видимому, и не может быть организовано другим образом. Во-первых, рассмотрение событий в рамках лишь одной, ближайшей системы отсчета позволяет резко ограничить сложность перцептивной обработки. Во-вторых, такое рассмотрение позволяет сохранить специфику локальных движений, что является важным условием их узнавания. Хорошим примером здесь может служить восприятие так называемого биологического движения — прежде всего, специфических характеристик походки, жестов и мимики людей. Представьте себе, что вы провожаете на вокзале знакомого, который стоит у открытой двери тамбура и машет рукой. Когда поезд трогается, ладонь начинает описывать в системе координат, связанной с поверхностью Земли и вашим телом, синусоидальное движение (см. рис. 3.5А). Однако из-за разделения влияния систем отсчета вы будете видеть те же самые движения ладони вверх и вниз относительно рамки двери (то есть ближайшей системы отсчета), тогда как поезд и машущий рукой знакомый в целом движутся в системе координат вокзала и стоящих на перроне провожающих.

' Мы рассмотрим ниже примеры расширенной трактовки этого теоретического конструкта при анализе семантики (см. 3.3.3, 6.3.1 и 7.3.2), представлений окружающей среды (6.3.2), организации так называемых ментальных пространств (7.4.1) и влияния эмоционального контекста на принятие решений (8.4.1).

179

Несколько более сложный случай представляет собой восприятие локомоций. Здесь лучше всего изучено восприятие походки, причем практически все данные получены на основании видеосъемки (в последнее время, разумеется, также компьютерной симуляции) и последующего наблюдения взаимного движения всего лишь нескольких, прикрепленных к основным суставам тела маркеров (рис. 3.5Б). Эта использовавшаяся ранее в биомеханике методика впервые была применена в контексте перцептивных исследований шведским последователем Гибсона Гуннаром Иохансоном (например, Johanson, 1978). При неподвижном положении маркеров их интерпретация и узнавание оказываются полностью невозможными. При движении тела, причем (по разным, к сожалению, не очень точным данным) уже после 100—500 мс экспозиции, испытуемые отчетливо видят движущегося человека, уверенно различая мужчин и женщин. Несмотря на предельную редуцированность информации, испытуемые даже способны узнавать при этом себя и своих знакомых (см. 3.4.1). Походка оказывается, таким образом, очень индивидуальной и легко идентифицируемой формой биологического движения. При разработке систем автоматического видеопоиска, идентификации и отслеживания разыскиваемых людей она даже рассматривается в последнее время в качестве возможной альтернативы узнаванию по геометрии лица.
Чем объяснить, что усложнение стимульной ситуации за счет введения информации о множестве разнонаправленных движений как раз и делает восприятие возможным? Эти движения позволяют выделить несколько иерархически связанных между собой систем отсчета. Прежде всего, такие перцептивные механизмы, как описанный гештальтпсихо-логами закон «общей судьбы» (см. 1.3.1), выявляют в глобальной системе координат тела две подсистемы, а именно туловище и конечности. Каждая из этих подсистем, в свою очередь, становится локальной системой отсчета: в рамках туловища выделяются плечи и бедра, в рамках конечностей — плечевая (бедренная) кость и предплечье (голень). В результате возникает трех- или даже четырехуровневая структура (см. также 3.3.2). В рамках каждой из этих систем отсчета оказывается возможной достаточно точная спецификация характера локальных движений. Так, оказалось, что определяющим признаком для дифференциации походки мужчин и женщин является относительная амплитуда колебаний в плечевом поясе и в области бедер. Как показывают эксперименты с компьютерными анимациями походки, меняя один лишь этот параметр, удается легко управлять восприятием пола фантомных фигур (Mather & Murdoch, 1995).
Мы уже несколько раз упоминали фактор времени, отмечая исключительную быстроту процессов зрительной пространственной локализации. Временной контекст, естественно, весьма важен для возникновения впечатления движения. Так, мы непосредственно видим движение секунд-180 ной стрелки часов, но лишь знаем о движении часовой и минутной стре-

лок. Для непосредственного восприятия движения, по-видимому, существенными оказываются события внутри интервала времени порядка 100 мс. Бельгийский гештальтпсихолог Альбер Мишотт провел в первой половине 20-го века множество простых экспериментов, показав, в частности, что остановки движущегося предмета не замечаются наблюдателем, если они продолжаются менее 100 мс. Самые известные эксперименты Мишотта описывают условия, при которых чисто оптическое сближение и соприкосновение двух зрительных объектов (двух теней на проекционном экране) устойчиво воспринимается как «механический толчок» и «передача импульса». Для восприятия подобной феноменальной причинности необходимо, чтобы не позднее, чем через 100 мс после видимого соприкосновения, произошло бы характерное изменение скорости движения объектов, например, первый объект остановился, а неподвижный до момента соприкосновения второй объект начал двигаться в том же направлении (см. 3.3.3 и 9.4.2)9.
Другим классическим феноменом, исследованием которого даже датируется возникновение гештальтпсихологии (Wertheimer, 1912), является стробоскопическое движение. Оно возникает при предъявлении в пространственно-временном соседстве двух и более объектов. Рассмотрим простейший случай показа всего лишь двух объектов, расположенных на расстоянии нескольких угловых градусов друг от друга. Если последовательное предъявление осуществляется очень быстро, так что асинхронность включения стимулов {AВС = время показа первого стимула, tj + интерстимулъный интервал, ИСИ) остается меньше 40—50 мс, то воспринимаются два одновременно появившихся в поле зрения объекта. При увеличении асинхронности возникает восприятие одного объекта, быстро движущегося от места первого предъявления к месту второго. Иногда объект кажется движущимся за непрозрачным экраном и лишь на мгновение появляется в местах показа стимулов, которые, в свою очередь, воспринимаются как отверстия в экране: этот вариант амодального, не имеющего сенсорной основы восприятия соответствует так называемому ФИ- {феноменальному) движению. При увеличении ABC до 80—120 мс возникает отчетливое восприятие движущегося объекта, который виден во всех промежуточных положениях. Такое движение называется оптимальным, или БЕТА-движением. Если асинхронность превышает 250—300 мс, то движение постепенно исчезает и воспринимается лишь последовательное появление двух объектов на разных позициях.
. ' Пафос классических исследований Мишотта заключался в попытке опровержения
мнения Джона Локка и других эмпирицистов (особенно Юма), согласно которым при
чинно-следственная связь событий не может непосредственно восприниматься, а может
ли11п> домысливаться в результате ассоциативного объединения представлений в сужде
ния (см. 1.1.2). 181

В силу очень простого контроля параметров предъявления объектов, стробоскопическое движение до сих пор остается популярной ситуацией исследования. Эксперименты со стробоскопическим движением показывают, что оно определяется прежде всего дистальными, а не проксимальными параметрами стимуляции. Выше (см 3.1.1) мы отмечали, что информация о третьем измерении пространства выделяется зрительной системой в естественных условиях наблюдения (свободный режим движений глаз, присутствие видимого структурированного окружения) непосредственно и очень быстро. Аналогично обстоит дело и с данным видом воспринимаемого движения: пороги быстрого стробоскопического движения определяются не угловым расстоянием, а близостью стимул ьных объектов в трехмерном пространстве, так что при увеличении расстояния до дисплея или изменении угла, под которым он рассматривается наблюдателем, пороги возникновения движения остаются примерно постоянными, соответствующими константному восприятию метрических отношений пространства (Величковский, 1973)
Эту же закономерность воспринимаемого движения можно проиллюстрировать примером тактильного стробоскопического движения. Если с асинхронностью порядка 100 мс прикасаться к ладоням левой и правой руки (для этого применяются прикрепленные к ним вибраторы), то сидящему с закрытыми глазами наблюдателю внезапно начинает казаться, что что-то или даже кто-то быстро бегает между ладонями. Если теперь несколько развести руки в пространстве, то тогда для сохранения впечатления движений «тактильного крольчонка» приходится пропорционально увеличить величину асинхронности включения, хотя физические и анатомические условия стимуляции при увеличении расстояния между ладонями не меняются. Пороги стробоскопического движения, следовательно, явно демонстрируют некоторую инвариантность скорости перемещения в воспринимаемом трехмерном пространстве, напоминая, тем самым, закономерности процессов «ментального вращения», лежащие в основе узнавания и сравнения различным образом ориентированных в пространстве объектов (см. 5.3.1).
Значительный интерес представляют условия, при которых последовательные события воспринимаются как одновременные. Соответствующие максимальные интервалы времени получили название перцептивного момента. С увеличением точности методик большинство оценок размеров перцептивного момента в разных сенсорных модальностях сдвинулось с величин порядка 100 мс в область 30 мс. Функция разбиения непрерывного потока физической стимуляции на статичные кадры, внутри которых все кажется одновременным, традиционно приписывается интегральным ритмам мозга, измеряемым с помощью таких методик, как ЭЭГ (см. 2.4.2). При этом за последние два десятилетия несколько изменились представления о возможной нейрофизиологической основе этих процессов — с подчеркивания роли альфа-ритма к анализу вероятного участия гамма-ритма. Последний не только имеет более подходящую частоту (а именно порядка 40 Гц), но также регист-182 рируется в субкортикальных структурах, участие которых в регуляции

ритмических движений (таламус, мозжечок и базальные ганглии — пал-лидум) и в восприятии временных интервалов (базальные ганглии — стриатум) сегодня представляется бесспорным (Wittmann, 1999).
Представление о том, что в ходе сенсорной обработки сначала выделяется статичная информация, которая затем служит основой для восприятия движения, наталкивается на возражения. В частности, Гибсон подчеркивал в своих работах первичность выделения динамических градиентов стимуляции. Один из наиболее известных его последователей Майкл Турвей (Turvey, 1977) считает, что восприятие движения вообще невозможно в системе, регистрирующей статичные кадры. Такие кадры, или «иконы», предположительно должны быть направлены для сохранения и интерпретации в следующий блок переработки информации, кратковременную память. Но поскольку кратковременная память может осуществлять лишь сжатие масштаба времени последовательности икон (в отношении T:t), то необходимо постулировать дополнительную инстанцию (мышление, гомункулуса и т.д.), которая могла бы «увидеть» в этой преобразованной последовательности характерную динамику событий (см. рис. 3.6А).
Фактически речь идет о том, как из локальных перцептивных моментов строится глобальное перцептивное время. Представление о статичных иконах как основе восприятия соответствует гипотезе дискретного перцептивного времени, согласно которой оно состоит из поставленных «в затылок друг другу» перцептивных моментов (подобно организации астрономического времени, где 2005 год ровно в полночь 31-го декабря сменяется 2006 годом). Эту гипотезу обычно приписывают французскому философу Анри Бергсону. Ей противостоит гипотеза непрерывного перцептивного времени, восходящая к идее потока сознания Уильяма Джеймса. По этой альтернативной гипотезе перцептивный момент подобен движущемуся вместе с физическим временем окну, обеспечивающему симультанный охват некоторого поля событий. Различие этих двух точек зрения можно проиллюстрировать с помощью следующей пространственной аналогии. Гипотеза дискретного времени соответствует ситуации, когда наблюдатель стоит на перроне и последовательно заглядывает в различные купе проходящего мимо поезда. Непрерывное перцептивное время соответствует обратному случаю — наблюдатель сам сидит в одном из купе поезда и видит непрерывно разворачивающуюся перед ним панораму, в том числе и проплывающий мимо перрон со стоящими на нем людьми
В одном из наиболее остроумных экспериментов последних десятилетий английский психолог Алан Олпорт (Allport, 1968) попытался проверить следствия из обеих гипотез. Для этого он использовал анализ направления стробоскопического движения, воспринимаемого в гирлянде последовательно зажигаемых лампочек. Если режим стробирования (то есть включения-выключения) таков, что все лампочки, кроме одной, кажутся горящими одновременно — «попадают в один перцептивный момент», то возникает иллюзорное впечатление движения темного

183

время события (?)

момент 1 (- лампочка 8) j
¦ момент 2 (- лампочка 7)
момент 3 (- лампочка 6)
Рис. 3.6. Структура перцептивного времени: А Гипотетическая интеграция икон в кратковременной памяти; Б. Обоснование эксперимента Олпорта по проверке двух гипотез перцептивного момента.

184

пятна на светлом фоне. На основании рассмотренных гипотез, как это демонстрирует рис. 3.6Б, можно сделать взаимоисключающие предсказания о направлении движения такого темного пятна Согласно гипотезе дискретного времени, оно должно двигаться в противоположную направлению зажигания лампочек сторону. Гипотеза непрерывного момента, напротив, предсказывает совпадение направлений. Полученные

Олпортом экспериментальные данные свидетельствуют о том, что направление движения темного пятна совпадает с порядком зажигания лампочек, подтверждая, таким образом, гипотезу непрерывного перцептивного времени. Не исключено, впрочем, что дискретная (квантовая) модель перцептивного времени также имеет право на существование, но в диапазоне более высоких временных частот, примерно соответствующих гамма-ритму ЭЭГ.
В объяснениях перехода от субъективной симультанности к восприятию последовательности событий, как и в целом в моделях восприятия времени, до сих пор сохраняется много неясностей. Наряду с описанием различных физиологических «водителей ритма», в литературе имеются предположения об отсутствии какого-либо влияния подобных внутренних часов на восприятие, а также представление о восприятии как процессе, принципиально не знающем времени и разворачивающемся в «вечном настоящем» (см. 3.4.2 и 5.4.2). Величина перцептивного момента при различных способах его измерения связана, как мы увидим в следующем разделе, с характером задачи, а субъективная продолжительность события и действий меняется в зависимости от направленности и напряженности внимания, а также от того, на каком уровне осуществляется обработка. В частности, осмысленные конфигурации кажутся тем наблюдателям, для которых они являются осмысленными, предъявляемыми на более длительное время. Так, если испытуемым на очень короткое время показываются химические формулы, то время показа оценивается как более продолжительное профессиональными химиками. Возможно, что в оценку длительности некоторого события включается и время инициированной им когнитивной обработки.
Как обстоит дело с выявлением продолжительности восприятия здесь и теперь или, по словам французского психолога Поля Фресса, через какое время перцептивное восприятие времени сменяется его когнитивной оценкой! Разные методические подходы к ответу на этот вопрос, как правило, настолько произвольны, что едва ли заслуживают упоминания. Наиболее привлекательный из этих подходов состоит в анализе колебаний восприятия ритмических звуковых сигналов или, скажем, многозначных фигур (рис. 3.7). Предполагается, что продолжительность

Рис. 3.7. Примеры многозначных изображений А Змеи, Б. Трезубец; В Треугольник.

185

186

«воспринимаемого настоящего» соответствует времени непрерывного удержания в сознании одной из возможных интерпретаций. Если судить по точности оценки временных интервалов, а также по частоте изменений восприятия типичных многозначных изображений, то средняя длительность «воспринимаемого настоящего» должна составлять примерно 2—3 секунды. Это время зависит от многих факторов, таких как зрительное утомление и характер движений глаз (см. 3.4.1). При оценке продолжительных отрезков времени, порядка часа и более, в действие вступают другие механизмы, в частности, биопсихологические механизмы суточных (циркадных) ритмов, участвующих в регуляции режима сна и бодрствования.
Вместе с тем, следует еще раз подчеркнуть роль фактора осмысленности решаемых задач при оценке их продолжительности. Существует контрастный эффект влияния этого фактора на субъективную продолжительность актуального переживания и на ретроспективные оценки времени. При непосредственном восприятии отрезки, заполненные личностно значимым делом, кажутся более короткими по сравнению с периодами монотонной работы. Когда же мы оцениваем подобные эпизоды по памяти, то более продолжительными становятся как раз субъективно значимые отрезки автобиографии. Эти наблюдения говорят скорее в пользу трактовки воспринимаемого времени как сложного социокультурного конструкта, связанного с высшими формами памяти и мышления. Не случайно в онтогенезе ориентация во времени развивается сравнительно поздно — в возрасте около 4-х лет, когда появляется рефлексивная способность оценки собственных знаний и знаний других людей как отличных от собственных. Обсуждению этих, так называемых метапознавательных координации посвящены некоторые разделы следующих глав (см. 5.4.3 и 8.1.3).
Эмпирические исследования восприятия времени осложняются тем, что при использовании сознательного отчета о времени проиходя-щих событий могут возникать систематические ошибки, объясняемые фундаментальной способностью нашего сознания «редактировать» как отдаленное, так и непосредственно предшествующее прошлое (см. 4.4.3). Вопрос о воспринимаемом и оцениваемом времени нужно также отделять от двух других вопросов, касающихся временных параметров собственно перцептивной обработки: во-первых, сколько времени нам нужно для восприятия некоторых свойств, предметов и событий (проблема микрогенеза — см. 3.2.3) и, во-вторых, сколько времени занимает последействие восприятия (проблема сенсорной памяти — см. 3.2.1 и 3.2.2). На перцептивные оценки продолжительности и самого факта предъявления объектов драматическим образом влияют предшествующие и в особенности непосредственно следующие события, как это будет видно из анализа эффектов динамической маскировки и метаконт-раста, обсуждаемых в следующем подразделе.

3.1.3 Перцептивные взаимодействия и маскировка

Проведенный выше анализ свидетельствует о тесной взаимосвязи процессов восприятия движения и пространственного положения. Для когнитивных исследований в целом характерен особый интерес к взаимоотношениям различных субмодальностей восприятия, их связям с моторикой и высшими формами познания, примерно так же, как аналогичный вопрос о взаимодействии многочисленных специализированных механизмов мозга начинает доминировать в работах нейрофизиологов и нейропсихологов. Уже в организации одной только зрительной коры сегодня различают, по меньшей мере, 32 специализированные зоны, которые объединены в сложную сеть, включающую более 300 анатомически идентифицируемых связей. Нейроны внутри этих зон отвечают на разные комбинации цвета, движения, ориентации, пространственной частоты, признаков формы и глубины (Tovee, 1996). Как обстоит дело с взаимоотношениями других перцептивных процессов, отличных от только что рассмотренной группы процессов динамической пространственной локализации?
Ощущения света и цвета длительное время описывались философами, физиологами и психологами в качестве первичных фактов зрительного восприятия, более всего соответствующих тому, что можно было бы считать «специфическими энергиями» (или «квалиями» — см. 1.2.1 и 4.4.3) органа зрения. Значительная часть данных по цветовоспри-ятию была получена в условиях лабораторных психофизических опытов на сравнение и оценку цвета экранированных от окружения источников света. Гештальтпсихологи (например, Koehler, 1947) обоснованно критиковали этот традиционный подход за его искусственность. Они считали, в частности, что психофизика изучает лишь апертурный цвет (то есть цвет свечения отверстия, «апертуры»), а не восприятие окраски поверхностей предметов.
С функциональной точки зрения интересно как раз восприятие окраски поверхностей, инвариантное — константное — по отношению к спектральным характеристикам освещения. Пространственная организация сцены играет при таком константном восприятии чрезвычайно важную роль. Американский изобретатель Эдвин Лэнд провел в 1960-е годы эксперименты, продемонстрировавшие зависимость восприятия цвета от пространственного контекста. Он показывал испытуемым коллажи, состоявшие из участков поверхностей разной окраски (типа картин голландского художника-абстракциониста Мондриана или же лоскутных, «бабушкиных» одеял). Эти коллажи освещались проекторами с цветовыми фильтрами в красной, зеленой и синей части спектра. Освещение, например, длинноволновым светом приводило к тому, что, скажем, некоторый зеленый участок отражал в два раза больше света в длинноволновой, красной части спектра, чем в коротковолновой. Тем не менее соответствующая поверхность продолжала воспри-
ниматься зеленой. Константное восприятие цвета окраски, однако, сразу же нарушалось и зеленая окраска начинала казаться красной, если наблюдатель смотрел на этот участок через отверстие в черном экране, закрывавшем окружающие его поверхности.

Во многом опираясь на работы Лэнда, когнитивная нейрофизиология объясняет восприятия цвета как своеобразное сравнение сравнения (Zeki, 1993). Вначале между собой сравниваются отражательные характеристики поверхностей отдельно в каждом из трех различных участков видимого спектра (человек, как и все другие приматы Старого Света, является трихроматом) При монохроматическом освещении каждая поверхность будет иметь различную светлоту в зависимости от ее отражательных характеристик в данном участке спектра. Так, при освещении длинноволновым, красным светом красные поверхности будут отражать больше света и казаться более светлыми, чем зеленые или синие В результате первого сравнения получаются три независимые светлотные карты, которые являются относительными — светлота некоторого участка определяется в них не просто количеством отраженного им света, а логарифмом отношения этого света к среднему количеству света, отраженному окружающими этот участок поверхностями. Предположим теперь, что волновой состав освещения меняется. Соответственно меняется и спектральный состав отраженного каждой поверхностью света. Однако поскольку светлотные карты релятивируют такие изменения, то и характеристики отдельных участков сцены остаются относительно постоянными Сравнение всех трех светлотных карт ведет к выявлению окраски — искомых цветоотражающих характеристик поверхностей предметов10
Относительный характер оценок светлотности особенно очевиден в
случае феномена одновременного яркостного, или светлотного, кон
траста, который заключается в изменении воспринимаемой светлоты
участка поверхности в зависимости от видимой светлоты окружающих
участков — серая поверхность кажется более светлой на темном фоне и,
наоборот, более темной на светлом (рис. 3.8А). Хотя одновременный контраст часто объясняется в нейрофизиологии нейрональными взаимодействиями по типу латерального торможения, подчеркивающими границы перепадов яркости и возникающими уже в рецепторных элементах сетчатки, имеющиеся данные говорят о более центральном про-
исхождении этого феномена Так, А Джилкрист и И. Рок (Gilchrist &
Rock, 1981) продемонстрировали зависимость одновременного контра-
10 Для константного восприятия цвета (окраски) поверхности необходимо, чтобы
спектральный состав освещения был достаточно широким для активации каждой из трех групп цветовых пигментов человеческого глаза Другими словами, при вариациях спектрального состава освещения в нем еще должны сохраняться компоненты, позволяющие вычислить все три светлотные карты Это требование не выполняется в случае некоторых промышленных источников, излучающих свет в очень узком диапазоне спектра На автостоянке, освещенной таким светом, можно легко потерять свой и «найти» 188 чужой автомобиль

Рис. 3.8. Вариации на тему одновременного контраста А Стандартный вариант, Б Иллюзия Уайта, В Влияние светотени на восприятие окраски в предметных сценах (окраска светлых квадратов в середине совпадает с окраской темных на переднем плане — по Adelson, 2000)
ста от феноменальной локализации сравниваемых по светлоте поверхностей, в частности, от близости поверхностей в третьем измерении пространства. К этому же разряду эффектов относится так называемый принцип эквипланарности — одновременный контраст действует только внутри одинаково ориентированных в пространстве поверхностей11.
На рис. 3.8Б серые участки слева кажутся светлее, чем идентичные по окраске серые участки справа. Этот эффект может показаться парадоксальным, ведь серые участки слева в основном окружены светлыми поверхностями, а справа — темными Объяснение состоит именно в использовании принципа эквипланарности — разделении этого плоского изображения на два плана глубины: поскольку серые участки слева воспринимаются как принадлежащие «выступающим вперед» черным полосам, а справа они относятся к «расположенному за черными полосами» белому фону, то соответственно меняется и выбор эффективных систем
1 ' Аналогичные данные недавно впервые были получены и для собственно цвета (Shevell
& Wei, 2000) 189

отсчета. Наконец, рис. 3.8В иллюстрирует влияние воспринимаемого распределения света и тени12. Светлые квадраты в середине этого рисунка по своей окраске совпадают с темными квадратами на переднем плане, но, отчасти, из-за «отбрасываемой цилиндром тени» их восприятие искажается. Таким образом, реальные механизмы восприятия оказываются явно более сложными, чем это предполагалось в классических психологических и нейропсихологических исследованиях цвета. Светлот-ные карты в действительности представляют собой трехмерные ландшафты, учитывающие удаленность, а также взаимную ориентацию поверхностей и предполагаемых источников света в пространстве.
Проведенный анализ говорит о том, что микроструктура процессов восприятия цвета (окраски) включает операции пространственной локализации и определения ориентации поверхностей. Можно попытаться непосредственно прохронометрировать эти формы восприятия, чтобы проверить данный вывод. В исследовании, проведенном совместно с М.С. Капицей (Величковский, Капица, 1980), мы просили испытуемых максимально быстро определять в разных пробах параметры одного из перцептивных измерений предъявляемого на дисплее объекта: пространственное положение (вверху или внизу), направление движения (влево или вправо), светлота (низкая или высокая) и форма (симметричная или асимметричная относительно вертикали). Регистрировалось время реакции — отвечая, испытуемые должны были нажимать на кнопки, — и для различных интервалов времени реакции подсчиты-вался коэффициент успешности различения соответствующего перцептивного признака.
Результаты показаны на рис. 3.9. При их интерпретации следует иметь в виду, что выбор ответа и его чисто моторные компоненты могут требовать не менее 100 мс. Это время нужно вычесть из полученных данных, чтобы получить более точную оценку времени восприятия. Как следует из графиков, особенно быстро испытуемые могли определять пространственное положение и направление движения, причем данные для скорости оценок этих двух измерений практически совпали. Именно так должны были бы выглядеть результаты, если на самом деле существует единая функциональная система, обеспечивающая чрезвычайно быструю (около 100 мс) динамическую локализацию объектов. Восприятие и различение индивидуальности объектов требуют явно большего времени. Так, для оценки видимой светлоты потребовалось время в общей сложности порядка 200 мс. Еще более продолжительным оказалось восприятие особенностей формы объектов, требовавшее не менее 300 мс.

190

12 Системы автоматического разпознавания до сих пор с большим трудом различают тени (пятна) и телесные предметы, так что снабженный электронным «зрением» автомобиль вполне может внезапно остановиться перед тенью, отбрасываемой растущим на обочине деревом.

100

300 Время реакции, мс

500

Рис. 3.9. Успешность различения четырех перцептивных признаков объекта (по: Велич-ковский, Капица, 1980).

Ситуацию только что описанного простого эксперимента по хронометрированию восприятия различных перцептивных характеристик можно использовать для более углубленного анализа взаимоотношений соответствующих процессов. Поскольку во всех пробах испытуемые отвечали нажатием одной из двух кнопок, легко проанализировать, например, насколько полно сознательная задача оценки цветовых (светлот-ных) характеристик позволяет игнорировать другие признаки, такие как форма или движение. Результаты такого анализа свидетельствуют об асимметричности взаимодействий перцептивных процессов (Величков-ский, Капица, 1980). Оценивая цвет объекта, мы можем игнорировать форму, но не положение или движение, так что многие ответы, ошибочные с точки зрения сознательной задачи, оказываются неслучайными в отношении различения этих формально иррелевантных признаков. Точно так же обстоит дело и с восприятием формы — ответы обнаруживают зависимость от процессов динамической пространственной локализации, но остаются случайными в отношении признака светлоты. Остается добавить, что когда задача заключается в различении положения или движения, наблюдается значительная взаимная интерференция, однако влияние цвета и формы полностью отсутствует.

191

Большинство других исследований по классификации признаков объектов также свидетельствуют о том, что цвет и форма — это независимые качества. Этот вывод соответствует данным об относительной независимости их нейронных механизмов, возможности селективных выпадений и необходимости использования внимания для их одновременного восприятия (см. 3.4.2 и 4.2.3). Что касается отношений процессов динамической локализации (восприятие положения и движения) и восприятия перцептивной идентичности предметов (форма и/или цвет), то, по крайней мере при жестких ограничениях на время восприятия, они явно носят асимметричный характер, что соответствует представлению о двух последовательных уровнях восприятия.
Опираясь на эти простые хронометрические эксперименты, можно обратиться к линии исследований восприятия, связанной с анализом феноменов маскировки. В психологии с термином «маскировка» ассоциируются две довольно различные группы феноменов. Гештальтпсихоло-ги положили начало изучению статической маскировки (или камуфляжа). Она чрезвычайно широко распространена в биологическом мире, например, в виде вариантов адаптивной раскраски, делающей неподвижное животное трудноразличимым в естественной среде обитания. Основу маскировки в этом первом значении слова образуют законы перцептивной организации (см. 1.3.1). В когнитивной психологии и в этой главе речь идет об эффектах динамической маскировки, которая возникает при быстром последовательном предъявлении информации13. Типичная процедура состоит в предъявлении в пространственно-временном соседстве двух стимулов — тестового и маскирующего. При несовпадении их локализаций говорят также о метаконтрасте. Эффекты маскировки обычно оказываются сильнее, если маска следует за тестовым стимулом (обратная маскировка), а не предшествует ему (прямая маскировка).
Многочисленные данные демонстрируют два вида зависимости успешности опознания или оценки параметров первого стимула от задержки второго — монотонную и немонотонную, когда максимальный эффект маскировки наблюдается при асинхронностях включения 100—120 мс. Так, в одном из вариантов исследования так называемой «очень короткой зрительной памяти» (см. 3.2.1) испытуемым показывался ряд букв, причем одна из букв маркировалась кольцом или сплошным диском, перекрывавшим критическую позицию. Если меткой был диск, то при одновременном показе с буквами успешность восприятия буквы на критической позиции была минимальной, затем — примерно в течение трети секунды — она улучшалась. Если меткой было кольцо, то при ну-

192

13 Насколько нам известно, первая работа по «динамической маскировке» была опубликована в 1871 году работавшим у Гельмгольца в Гейдельберге стажером из России (впоследствии приват-доцентом физиологии Санкт-Петербургского университета) Н.И. Бакстом (Baxt, 1871).

левой задержке испытуемый просто видел букву в кольце, и успешность воспроизведения была максимальной. При росте асинхронности предъявления (ABC) кольца восприятие буквы ухудшалось и при асинхронности порядка 100 мс наступал момент, когда кольцо как бы «стирало» букву — феноменально оно окружало пустое место. При увеличении задержек до 200—300 мс кольцо переставало оказывать какое-либо влияние на восприятие и воспроизведение вновь улучшалось.
Для объяснения динамической маскировки было предложено два принципа — интеграции и прерывания. Согласно первому принципу, маскировка есть результат объединения тестового стимула и маски в единый перцепт. Такая комбинация затрудняет считывание информации о тестовом стимуле. Согласно принципу прерывания, маскировка возникает из-за прекращения процесса считывания информации о тестовом стимуле, например, в результате вытеснения или стирания его перцептивной репрезентации маской. Современные теории включают оба принципа. Считается, что интеграция действует при небольших интервалах между стимулами. При асинхронностях, превышающих 100 мс, вступает в силу механизм прерывания. Подробный анализ этого вопроса содержится в раннем исследовании Майкла Турвея (Turvey, 1973). Он обнаружил два механизма маскировки — периферический и центральный. Периферическая маскировка бывает как прямой, так и обратной и определяется суммарной энергией маски, то есть подчинена правилу:
Ixt = const, где / — интенсивность, ai— время стимуляции.
Она исчезает при дихоптических условиях — независимом предъявлении тестового стимула и маски левому и правому глазу. Эти свойства позволяют интерпретировать периферическую маскировку как реализацию принципа интеграции. Центральная маскировка зависит не от энергетических характеристик маски, а от асинхронности ее включения. Она является обратной и возможна при дихоптических условиях, но только в случае структурированной маски — гомогенное световое поле оказывается неэффективным. По всей видимости, механизмом центральной маскировки является прерывание.
Легко видеть, что анализ процессов маскировки также приводит к выводу о существовании глобальной двухуровневой архитектуры восприятия: сначала объект воспринимается как относительно недифференцированное, но локализованное в трехмерном пространстве нечто, затем — как предмет с индивидуальными признаками, такими как цвет и форма14 (Величковский, 1973; Enns & Di Lollo, 2000; Hillyard & Anllo-Vento, 1998; Wichkovsky, 1982). Этот вывод подтверждается в результате рассмотрения других релевантных данных, которым посвящены последующие разделы этой главы (см. 3.2.3 и 3.4.2). В частности, процессы локализации и
14 В порядке уточнения отметим, что, согласно нашим данным (см. 3.3.3), на первом
из этих глобальных уровней возможны не только динамическая локализация и различе
ние текстур, но и рудиментарное различение формы — как общих внешних очертаний
объекта. Восприятие формы как внутренней геометрии является прерогативой филогене
тически более молодой системы фокального (предметного) восприятия. 193

идентификации (восприятия индивидуальных характеристик предметов) не только имеют различные нейрофизиологические механизмы, но и обнаруживают разные взаимоотношения с процессами внимания, осознания и памяти. Перед тем как обратиться к обсуждению этих вопросов, нам, однако, придется разобраться с представлениями об икони-ческой и эхоической памяти («периферических сенсорных регистрах»), популярными в ранний период когнитивных исследований.

3.2 Взлет и падение «иконы»
3.2.1 Иконическая память

Обсуждая результаты самых первых тахистоскопических экспериментов, Вильгельм Вундт отмечал, что «продолжительность жизни» зрительного образа может превышать номинальное время экспозиции стимула. По его наблюдениям, эта продолжительность обычно составляет примерно 250 мс. Он признавал также, что за это время возможны сдвиги внимания — идея, напоминающая современное представление о сканировании информации из иконической памяти. Однако Вундт считал такую инерцию зрения связанной с ретинальными послеобразами и был далек от того, чтобы приписывать ей решающее функциональное значение в восприятии и познании. Более того, он рассматривал присутствие послеобразов как прямую помеху, затрудняющую процессы детального восприятия, например, чтение.
В когнитивной психологии понятие об инерционности зрения превратилось в представление о периферическом зрительном регистре — иконической памяти. Это понятие на несколько десятилетий стало одним из центральных при анализе когнитивной организации вообще. Известным исследованиям Джорджа Сперлинга предшествовали теоретические соображения Хэбба (Hebb, 1949), противопоставившего сохранение информации в форме динамического следа стимуляции (длительностью порядка половины секунды) более продолжительной, структурированной форме хранения. В своей докторской диссертации Сперлинг (Sperling, 1960) попытался определить количество информации, воспринимаемой при кратковременном предъявлении15. В качестве материала для воспроизведения испытуемым показывались матрицы из согласных букв (чтобы из них трудно было составить слово).
15 Джордж Сперлинг — физик по образованию — решал в этой работе, выполненной на базе Белловских лабораторий фирмы AT&T, практическую задачу сравнения инерционности зрения оператора с инерционностью катодно-лучевых трубок, которые как раз стали использоваться в начале 1960-х годов в качестве самых первых компьютерных 194 дисплеев.

Время предъявления было равно 50 мс. Успешность полного воспроизведения при этом была равна примерно 5 буквам, то есть соответствовала нижней границе «магического числа» (см. 2.1.1). Эти ограничения могли быть вызваны либо особенностями восприятия — испытуемый не мог разглядеть больше за 50 мс, либо особенностями памяти — испытуемый увидел все или, по крайней мере, многие символы, но очень быстро их забыл.
Для проверки этой второй гипотезы Сперлинг разработал методику частичного отчета. В варианте методики испытуемому быстро предъявляется матрица из трех строчек по 4 элемента в каждой, а после ее исчезновения подается один из трех звуковых сигналов: высокий, низкий или средний. В зависимости от высоты тона он должен воспроизводить только одну из трех строчек матрицы. Поскольку тестирование строк осуществляется в случайном порядке, для определения общего объема воспринятого и запомненного на короткое время материала количество воспроизведенных символов умножается на число строк. Результаты этой процедуры показывают, что сразу после исчезновения матрицы испытуемый помнит значительно больше информации, чем может сообщить. Так, если испытуемый правильно воспроизводит в среднем 3,5 символов тестируемой строки, то умножение на число строк позволяет дать оценку объема иконической памяти, как превышающего 10 символов.
Время сохранения иконического следа можно определить, меняя отсрочку акустической послеинструкции — при увеличении отсрочки объем хранящейся информации начинает быстро уменьшаться. Когда отсрочка достигает 300 мс, вычисленная эффективность запоминания перестает отличаться от результатов экспериментов с полным воспроизведением, то есть снижается до нижнего уровня «магического числа». Поэтому Сперлингом был сделан вывод, что в течение примерно трети секунды после исчезновения зрительного стимула информация о нем продолжает сохраняться в виде быстроугасающего зрительного образа, или (по терминологии Найссера — см. 2.2.2) «иконы». В течение этого короткого времени информация может продолжать «сканироваться» из иконической памяти в более устойчивую, но ограниченную по объему кратковременную память.
Принципиально те же выводы были сделаны годом позже Э. Авербахом и А. Корайллом (Averbach & Coriell, 1961). Эти авторы предложили модифицированный вариант методики, в котором испытуемым симуль-танно показывался ряд символов и критическая позиция маркировалась зрительной послеинструкцией, например, стрелкой, указывающей на определенную позицию. Если отсрочка послеинструкции не превышала 200—300 мс, то вероятность правильного воспроизведения символа на отмеченной позиции была выше, чем вероятность его свободного воспроизведения.
195

Множество других методических процедур, казалось бы, указывало в том же самом направлении. К ним прежде всего относятся методики изучения инерции зрения, такие как методика определения частоты слияния мельканий, а также оценка величины перцептивного момента — максимального временного интервала, внутри которого последовательные перцептивные события воспринимаются как одновременные (см. выше 3.1.2). Например, по данным Дж. Хайлана 1903 года, шесть последовательно показанных на соседних позициях букв обычно кажутся одновременными, когда все они попадают внутрь интервала, продолжительность которого не превышает 80 мс. В когнитивной психологии были проведены многочисленные измерения, давшие в основном оценки от 30 до 120 мс. Подобные результаты можно получить, например, предъявляя с переменным интервалом два «случайных» узора точек, образующих при наложении короткую надпись, которую испытуемые должны были прочитать. Кроме того, понятие иконической памяти использовалось и для объяснения эффектов зрительной маскировки (см. 3.1.3). Так, один из методических приемов состоял в определении критического интервала суммации — максимального временного интервала, внутри которого некоторый пороговый или надпороговый перцептивный эффект определяется суммарной энергией стимула в соответствии с известным нам из обсуждения маскировки мультипликативным правилом:
/ * t = const, где / — интенсивность, at — время стимуляции16.
Эти феномены, однако, еще не исчерпывают список фактов, которые должна была гомогенизировать гипотеза сенсорного регистра. Ряд исследований был выполнен с помощью классической, предложенной еще Гельмгольцем методики «как верблюду пройти через игольное ушко». В этом случае за вертикальной щелью в непрозрачном экране в горизонтальном направлении движется контурный рисунок, например, изображение верблюда. Если время прохождения рисунка за щелью (или щели перед рисунком) не превышает 250—300 мс, то испытуемые обычно могут узнать, что изображено на рисунке. Этот факт также можно считать указанием на существование некоторой структуры, накапливающей зрительную информацию в течение соответствующего времени.
Таким образом, в основу подхода к большому числу зрительных феноменов была положена очень простая идея, согласно которой начальным этапом процессов переработки информации является двумерная и статичная картина («зрительный сенсорный образ») физической стимуляции, исчезающая («затухающая») за время порядка трети или четверти секунды. В связи с этим возникают вопросы о точ-
16 Существование подобной зависимости внутри интервала около 100 мс в задачах оценки яркости было впервые показано в 19-м веке французскими физиологами Блоком и Шарпантье. Временную суммацию долго считали либо проявлением фотохимических закономерностей, либо следствием ритмической организации физиологических процессов в зрительной коре (прежде всего альфа-ритмом ЭЭГ — см. 2.4.2 и 3.1.2). С появлением предсташшния об иконической памяти именно она стала считаться структурой, в ко-196 торой происходит интеграция зрительной стимуляции.

ной локализации, временных характеристиках и содержании икони-ческой памяти.
По вопросу о локализации иконы мнения разделились. Ряд данных свидетельствовал о том, что иконическая память связана с активностью палочкового аппарата сетчатки. Другие результаты говорят о наличии центральных икон. В одной из работ измерялась критическая частота слияния мельканий решетки из вертикально или горизонтально ориентированных черно-белых полос. Определяемая таким образом инерция зрения уменьшалась вслед за адаптацией к решетке той же самой ориентации и увеличивалась после адаптации к ортогональной решетке, причем эти результаты не зависели от того, предъявлялись ли адаптационная и тестовая решетка одному и тому же глазу (Meyer, Lawson & Cohen, 1975). Учитывая данные из нейрофизиологии, необходимо сделать вывод, что эти эффекты имеют кортикальное происхождение. Иконическая память оказалась состоящей из разноуровневых компонентов.
Трудности возникли и при уточнении собственно временных характеристик иконической памяти. После продолжавшегося 20 лет попыток объединить огромный массив полученных данных стало выясняться, что свести эти данные к некоторому единому показателю в принципе не удается. Так, практически все методики, связанные с оценкой видимой продолжительности стимула, обычно дают существенно меньшие значения времени иконического хранения, чем косвенные процедуры типа спер-линговской методики частичного отчета. Как отметил в обстоятельном обзоре этих исследований англичанин Макс Колтхарт, «информационная инерционность (или иконическая память) не может быть идентифицирована с видимой инерцией, так как они имеют фундаментально различные свойства» (Coltheart, 1980, р. 183).
Можно добавить, что даже с помощью одного и того же методического приема иногда измеряются различные процессы. Например, критический интервал суммации, который считали чуть ли не фотохимической постоянной, меняется от 30 мс в задаче обнаружения зрительного сигнала до примерно 300 мс в задачах идентификации букв и оценки остроты зрения. Неожиданным свойством видимой инерции оказалось то, что при уменьшении яркости стимула она возрастает. Та же тенденция наблюдается и при уменьшении длительности экспозиции. В литературе выдвигалось предположение об адаптивном характере этих эффектов: чем сложнее условия восприятия, тем больше продлевается время жизни иконы, чтобы облегчить работу вышестоящим инстанциям. По-видимому, в этом случае значительно проще было бы говорить не об инерции, а о времени восприятия характеристик объектов, которое увеличивается при недостаточной энергии стимуляции.
Столь же сложен вопрос о характере информации, представленной в иконической памяти. Исследования показали, что успешный частичный отчет возможен на основании целого ряда «физических признаков»: по-

197

ложения, яркости, цвета, размера, общей ориентации символов и т.д. Интересно, что в этот список входят также параметры движения объектов, хотя от чисто инерционной, иконической системы отображения это было бы трудно ожидать. С другой стороны, селекция на основании фонологических или семантических признаков оказывается неэффективной. Так, Сперлинг установил, что если матрица состоит из букв и цифр, то послеинструкция воспроизводить символы одной из этих двух категорий не дает никакого преимущества перед полным отчетом. Это соответствует представлению об иконической памяти как о прекатегориаль-ном (то есть фиксирующем только физические признаки) хранилище. Возможными, однако, остаются и другие объяснения: например, за отсутствие семантической информации могла быть принята ситуация, в которой информация о категориальной принадлежности символов присутствовала в ответах, но, в отличие от физических признаков, «не затухала» (см. 4.1.3).
Общим аргументом против гипотезы иконической памяти служат выявленные в течение 1970-х годов данные о том, что сохранение зрительной информации вполне возможно в течение секунд, минут и месяцев (см. 5.2.1). Предположим, что попытка заменить исследования восприятия изучением иконической памяти была ошибкой и за статическими иконами на самом деле кроются процессы актуального развития, или микрогенеза восприятия17. Пусть далее эти процессы зависят не только от стимульной ситуации, но и от быстрого распределения внимания. Если в результате часть сцены будет обследована более детально, то это совсем не означает, что сцена в целом получает столь же полную обработку. Мы вернемся к альтернативному объяснению данных, на которых основана гипотеза иконической памяти, в конце этого раздела (см. 3.2.3). Отметим только, что, согласно современным данным, зрительная память, удерживающая полученную за время одной фиксации информации, часто работает всего лишь с одним объектом (обычно он является целью следующего саккадического скачка — см. 4.2.3). Кроме того, спецификация этого объекта имеет довольно абстрактный характер (см. 3.3.3 и 4.4.1), что, конечно, не позволяет говорить о какой-либо полной картинке видимой сцены — «иконической репрезентации».

" Термин «микрогенез» был введен в 1930-е годы эмигрировавшим в США немецким психологом Хайнцем Вернером (впоследствии — одним из ведущих специалистов по когнитивному развитию), чтобы отличать актуальное развитие восприятия, мышления и эмоций от процессов их онто- и филогенеза. В предвоенной Германии исследованием микроненеза (или «актуалгенеза») занимались представители так называемой «второй лейпцигской школы» Феликс Крюгер и его ученики. Основные принципы микрогенетического подхода были сформулированы в конце 19-го века русским учеником 198 Вундта H.H. Ланге (см. 3.2.3).

3.2.2 Эхоическая память

В силу ряда причин нельзя одновременно предъявить большое число звуковых сигналов так, чтобы они были в достаточной степени различимы. Это обстоятельство несколько задержало изучение слухового сенсорного регистра, хотя, например, Найссер (Neisser, 1967) был настолько уверен в его существовании, что даже предложил вошедший в литературу термин «эхоическая память». Предполагалось, что эхоическая память — это точная реплика акустических событий, которая продолжает «звучать в нас» после их окончания, позволяя воспроизводить последнюю из только что сказанных нашим собеседником фраз в ответ на вполне справедливый упрек: «Да ты меня совершенно не слушаешь!» Наиболее полной имитацией методики частичного отчета в слуховой модальности является работа Дарвина, Турвея и Краудера (Darwin, Turvey & Crowder, 1972). За одну секунду испытуемым последовательно предъявлялись три тройки букв и цифр. В каждой тройке один стимул предъявлялся на левое ухо, другой — на правое, а третий — на оба сразу. Послеинструкция указывала, с «какого места» воспроизводить информацию. Естественно, в эксперимент вводилось и контрольное условие полного воспроизведения. Результаты, на первый взгляд, также оказались знакомыми: при увеличении задержки послеинструкции наблюдалась типичная «функция затухания», затянувшаяся, правда, в случае эхоической памяти на целых четыре секунды (!). Вместе с тем перепад результатов на этом временном отрезке едва достигал половины единицы материала при абсолютном уровне пять единиц, что, конечно, едва ли достаточно для доказательства существования независимого блока хранения с «почти неограниченным объемом сенсорной информации».
Не прояснили вопроса и другие исследования, проводившиеся, в частности, с помощью предъявления акустически сжатых последовательностей цифр. Эта методика широко использовалась в работах Холдинга и его сотрудников (Holding, 1979). Вопреки большинству других сообщений они вообще не нашли преимущества частичного отчета перед полным, установив дополнительно ряд неожиданных с точки'зрения гипотезы эхоической памяти фактов, таких как наличие выраженного эффекта первичности (хотя «эхо» первых элементов должно было бы «затухать» в первую очередь), а также появление слабого преимущества частичного отчета при увеличении интервалов между стимулами. Последнее изменение условий, очевидно, увеличивает время, в течение которого должен сохраняться эхоический след, тем не менее результаты улучшались. По-видимому, и в этом случае речь идет не столько о накоплении информации, сколько о процессах восприятия и перекодирования акустических событий. Обращает внимание тот факт, что во всех этих работах число символов, якобы хранящихся в эхоической памяти, с трудом достигало нижней границы «магического числа» Дж. Миллера.

199

Множество исследований было посвящено анализу элементарных временных характеристик слуха, аналогичных инерции зрения. Идеалом здесь также была количественная конвергенция результатов. Однако если при детекции повторяющихся участков последовательностей звуков время удержания эхоического следа оценивалось величиной порядка двух и более секунд, то согласно результатам другой методики, основанной на синхронизации начала и конца звукового стимула со вспышкой света, продолжительность эхоической памяти составила около 130 мс. Необъяснимым для гипотезы эхоической памяти образом инерция слуха определялась в последнем случае началом, а не концом предъявления, так что звуковой сигнал длительностью 10 мс имел «инерцию» 110 мс, а длительностью 100 мс — только 20 мс. Этот результат довольно трудно интерпретировать как эффект памяти, скорее как эффект микрогенеза восприятия, начинающегося в момент акустического события и требующего для своего завершения порядка 100 мс.
Серию известных исследований переработки слуховой информации человеком провел Доменик Массаро (Massaro, 1975). Он установил, в частности, что при обратной маскировке опознание звуковых тонов нарушается, если асинхронность предъявления маски становится меньше 250 мс. Этой величиной Массаро и оценивает продолжительность «преперцептивного слухового образа», который представляет собой лишь другое название для эхоической памяти. Он же показал, что кроме «маскировки опознания» существуют другие виды маскировки, например, «маскировка обнаружения», определяемая интервалом, при котором испытуемый затрудняется сказать, был ли вообще предъявлен тестовый стимул. Этот интервал оказывается на порядок меньше. Возможно, приводимая Массаро оценка 250 мс — это время, которое уходит на восприятие и опознание акустического события. Собственно сохранение слуховой перцептивной информации могло бы продолжаться в течение более длительного времени. В самом деле, Ф. Крэйк и М. Кирс-нер (Craik & Kirsner, 1974) показали, что информация о специфических особенностях интонации голоса доступна испытуемым через 8 секунд после предъявления речевого сообщения, а при некоторых условиях ее влияние обнаруживается и через несколько минут.
Несколько иная линия исследований была начата Робертом Крау-дером (Crowder, 1978). Он предпочитает говорить не об эхоической памяти, а о «прекатегориальном акустическом хранилище». Согласно этому автору, о существовании такого хранилища свидетельствуют три эффекта: 1) эффект недавности в позиционных кривых полного воспроизведения (то есть лучшее воспроизведение последних элементов ряда), 2) эффект модальности — более выраженный эффект недавности после слухового предъявления по сравнению со зрительным, 3) эффект аудиторного суффикса. Поскольку эффект недавности в целом чаще связывают с кратковременной памятью, остановимся несколько подробнее на

200
последнем из этих эффектов.

В типичном эксперименте испытуемому предъявляются 6—10 акустических стимулов (обычно буквы, цифры или слоги, но иногда также естественные шумы или музыкальные звуки). За этими стимулами последним в ряду следует заранее известный «суффикс» (скажем, слово «нуль»), который нужно просто игнорировать. В контрольном условии вместо суффикса в начале ряда предъявляется префикс (например, тот же «нуль»). Данные говорят о снижении успешности воспроизведения элементов, непосредственно предшествующих суффиксу. Считается, что суффикс интерферирует с информацией, хранящейся в «прекатегори-альном хранилище». Эффект суффикса может быть далее уменьшен при введении явных физических различий между суффиксом и последними элементами ряда, такими как изменение тембра голоса и положения в пространстве. Эти факты выглядят весьма убедительно, но были обнаружены и некоторые осложняющие обстоятельства. Дарвин и Бэддели показали в конце 1970-х годов, что эффект суффикса «не работает», если ряд стимулов состоит из слогов, отличающихся согласными (например, «ба», «га», «да»...), и восстанавливается, когда они отличаются гласными («ги», «га», «ге»...). Этот результат говорит о присутствии фонологического анализа, причем основанного на выделении согласных звуков. Имеются также сообщения, ставящие под сомнение тезис о «прекатего-риальности» эффекта суффикса. Так, например, оказалось, что данный эффект уменьшается почти на 20%, если в качестве суффикса используется синоним последнего слова ряда (Salter & Colley, 1977).
Оценивая накопленные в 1970-е годы экспериментальные данные, Роберт Краудер писал, что «в целом они соответствуют модели эхоичес-кой памяти, но не достаточны для того, чтобы заставить принять эту модель» (Crowder, 1978, р. 367). С этим выводом трудно согласиться. Одно то, что оценки продолжительности эхоического хранения иногда различаются между собой на два порядка, доказывает, что эта частная попытка гомогенизации психологических феноменов в рамках компьютерной метафоры окончилась неудачей. Не случайно, что к началу 21-го века понятие «эхоическая память» практически перестало упоминаться в руководствах по когнитивной психологии. Сами феномены, разумеется, остались. Их изучение продолжается в рамках двух основных направлений.
Первое направление развивает представления, близкие идеям геш-тальтпсихологии. Хотя законы перцептивной организации были первоначально описаны главным образом на зрительном материале, исследования восприятия звуковых тонов выявили аналогичные зависимости. Их автор — А. Бригман (Bregman, 1990) описывает полученные результаты в терминах классических законов сходства, близости, простоты, хорошего продолжения, вхождения без остатка и общей судьбы (см. 1.3.1). Один из ведущих специалистов в области внимания Даниел Канеман считает, что суффикс меняет перцептивную организацию акустического ряда, ухудшая условия восприятия релевантных элементов. Причина такого ухудшения заключается в том, что включенный в общую группу иррелевантный элемент отвлекает на себя часть внимания и обработка 201

остальных элементов оказывается менее эффективной. В доказательство своей точки зрения Канеман продемонстрировал существование эффекта суффикса в зрительной модальности (см. 4.2.2).

Второе направление связано с анализом собственно феноменов памяти. Центральным при этом становится анализ кратковременной, или, в современной терминологии, рабочей памяти. Рабочая память содержит целый ряд служебных компонентов, в том числе относительно пассивное фонологическое хранилище (см. подробно 5.2.3). Это последнее фиксирует продукты перцептивного анализа речи и оказывается более продолжительным (до нескольких секунд), чем гипотетический слуховой сенсорный регистр, или эхоическая память. По-видимому, существование подобного фонологического хранилища, специализированного на поддержке процессов речевой обработки, и позволяет нам в ответ на справедливый упрек «Да ты меня просто не слушаешь!» практически всегда достаточно успешно воспроизвести последнее из того, что сказал наш собеседник.

3.2.3 Микрогенез как альтернатива
Чтобы подойти к объяснению фактов, на которых основано предположение о существовании иконической памяти, полезно обратиться к работам ученика Вундта и одного из основателей экспериментальной психологии в России, профессора Одесского университета Николая Николаевича Ланге (1858—1921). В 1892 году им была опубликована работа «Закон перцепции». Исходя из своих наблюдений с тахистоскопи-ческим показом изображений предметов, он описывает восприятие как процесс микрогенетического развития: «Процесс всякого восприятия состоит в чрезвычайно быстрой смене целого ряда моментов или ступеней, причем каждая предыдущая ступень представляет психическое состояние менее конкретного, более общего характера, а каждая следующая — более частного и дифференцированного» (Ланге, 1893, с. 3). Восприятие трактуется здесь как развернутый во времени процесс, а не моментальный, постепенно растворяющийся в воздухе снимок.
Можно ли операционализировать эту интерпретацию, сделав ее экспериментально проверяемой? Один из таких подходов состоит в анализе зависимости «сенсорной инерции» от времени, прошедшего с момента предъявления стимула (stimulus onsetasynchrony, SOA— асинхронность включения стимулов, ABC) и с момента его выключения (interstimulus interval, /57 — интерстимульный интервал, ИСИ). Микрогенез начинается в момент предъявления информации и поэтому должен быть связан с параметром асинхронности включения. Напротив, в случае эффектов сенсорной памяти решающее значение должен иметь интерстимульный интервал, так как инерция зрения (или слуха) просто увеличивает эффективную 202 продолжительность стимула после его физического окончания.

Имеющиеся данные дают однозначный ответ — как слуховые (см. выше 3.2.2), так и зрительные сенсорные эффекты определяются временем, прошедшим с момента включения стимула. В частности, канадским психологом Винцентом Ди Лолло (Di Lollo & Wilson, 1978) было показано, что возможность перцептивной интеграции зрительных конфигураций зависит от параметра ABC, a не от интерстимульного интервала. Он последовательно предъявлял своим испытуемым две матрицы 5x5, которые при физическом наложении образовывали полную матрицу с одной пустой ячейкой (рис. 3.10). Задача заключалась в обнаружении этой ячейки при различных комбинациях длительности предъявления и величины интерстимульного интервала. Когда время экспозиции первого изображения превышало 100—120 мс, то даже при интервале 10 мс не происходила суммация изображений — испытуемые не могли указать пустую ячейку. Если бы «иконическая память» на самом деле была памятью, то есть в известном смысле «следом стимуляции», ее продолжительности с избытком должно было бы хватить для заполнения столь короткого интервала. Напротив, естественно предположить, что в первые 100 мс после предъявления объект просто еще не воспринят как некоторое устойчивое и оформленное целое и всякая поступающая информация легко интегрируется с ним.

первая матрица

вторая матрица

отсутствующая ячейка

комбинация

Рис. 3.10. Псевдослучайные матрицы, используемые для изучения зрительной интеграции: при наложении они образуют заполненную матрицу с одной пропущенной ячейкой. 203

Рассмотрим второй тезис Ланге, согласно которому актуальное развитие восприятия обнаруживает несколько «моментов или ступеней» в направлении от общих к более дифференцированным «психическим состояниям». К началу когнитивной революции взгляды Ланге и последующие работы лейпцигской школы гештальтпсихологии были успешно забыты. Но в 1970-е годы было выдвинуто несколько похожих предположений. В частности, нами была обоснована теория микрогенеза, согласно которой восприятие предмета начинается с его динамической локализации в трехмерном окружении, после чего происходит спецификация его общих очертаний и, наконец, инвариантное восприятие тонких внутренних деталей (Величковский, 1973; 1982а; Velichkovsky, 1982). Базовый цикл микрогенеза восприятия может занимать до 300 мс и требует, особенно в отношении анализа индивидуальных характеристик и деталей предметов, участия внимания (то есть осуществляется в режиме так называемого «фокального зрения» — см. 3.3.2 и 3.4.2).
С этой точки зрения, через треть секунды после предъявления зрительный образ предмета обычно лишь впервые формируется, а отнюдь не прекращает свое существование. Отмечавшиеся многими авторами систематические расхождения в различных оценках длительности иконы (см. 3.1.2) могли бы тогда объясняться тем, что методики изучения видимой инерции основаны на относительно простых задачах обнаружения и локализации, требующих для своего завершения около 100 мс, тогда как выявляемая с помощью методики частичного отчета информационная инерция предполагает возможность идентификации формы объектов, то есть занимает в общем случае порядка 300 мс18. Так называемое «сканирование информации из иконы» осуществляется по ходу формирования зрительного образа и принципиально приурочено к тому или иному его этапу (например, 100 или 300 мс) в зависимости от характера требуемого от испытуемого ответа.
Столь же естественно объясняется в рамках микрогенетических представлений и маскировка. Она возникает из-за ошибочной спецификации маскирующего стимула вслед за правильной локализацией тестового. Иными словами, речь идет о подмене объекта: предъявление тестового объекта быстро (в течение примерно 100 мс) локализуется как некоторое требующее нашего внимания событие, но когда мы переходим затем к детальной спецификации его индивидуальных характеристик, таких как цвет и форма, то находим в соответствующей области окружения уже другой объект, который и воспринимается нами вместо первого (Enns & Di Lollo, 2000). Это объяснение, предполагающее повторное обращение к объекту на более высоком уровне обработки, по-
18 Известные исключения лишь подтверждают это правило: в случае идентификации формы видимая инерционность, определяемая по величине критического интервала сум-мации или с помощью упоминавшейся выше методики «как верблюду пройти через иголь-204 ное ушко», возрастает до 300 мс (например, Kahneman & Norman, 1964).

зволяет понять целый ряд особенностей маскировки, например, почему даже в условиях жесткой маскировки, когда испытуемые утверждают, что совершенно не видят тестовый объект, они, тем не менее, способны различать (в ситуации вынужденного выбора) те пробы, в которых он был предъявлен, от тех, где он не предъявлялся (Pollack, 1972)19.
В рамках этих представлений удается объяснить результаты экспериментов по частичному отчету, не прибегая к понятию «иконическая память» (Величковский, 1977). Дело в том, что в когнитивной психологии не рассматривалось скрытое допущение о равенстве времени восприятия материала матрицы и восприятия послеинструкции в методике частичного отчета. В большинстве таких экспериментов необходимо было воспринимать и воспроизводить довольно сложную фигуративную информацию, тогда как инструкция содержала простую пространственную информацию. Восприятие послеинструкции, следовательно, могло значительно опережать восприятие релевантных для решения задачи аспектов матрицы. Учитывая хронометрические данные по быстрым оценкам местоположения и формы объектов (см. 3.1.3), можно ожидать, что такое опережение будет достигать 200 мс. За это время испытуемый может сконцентрировать свое внимание, эффективно настроившись на восприятие формы объектов в указанной части матрицы, но не в других ее частях. Последнее делает процедуру умножения результатов в методике частичного отчета неправомерной.
Можно предположить, что если кодировать положение критических элементов матрицы с помощью фигуративных послеинструкции (то есть стимулов, отличающихся формой, а не пространственным положением), то всякие указания на иконическую память должны исчезнуть, точнее, «функция затухания иконы» должна сдвинуться в область положительных задержек «послеинструкции». Это подтвердили эксперименты, проведенные нами некоторое время назад совместно с М.С. Капицей (см. Величковский, 19826)20. Как видно из результатов этих экспериментов,
19    Первоначально маскировку объясняли как своеобразные гонки между двумя сти
мулами, причем восприниматься должен тот стимул, который первым достигает блока
«сознательной репрезентации». С этой точки зрения, однако, совершенно непонятно,
почему обратная маскировка обычно выражена более сильно, чем прямая, иными сло
вами, почему «в гонках» побеждает стимул, предъявляемый последним. Предложенная
двухуровневая модель объясняет это задержкой в подключении внимательного анализа,
направленного на спецификацию индивидуальных характеристик объектов. Данная мо
дель является частным случаем уровневых объяснений восприятия, более подробно рас
смотренных нами ниже (см. 3.4.2 и 8.4.3).
20    В экспериментах применялась методика частичного опознания со зрительной пос-
леинструкцией, похожая на методику экспериментов Авербаха и Корайлла (см. 3.2.1).
Кстати, практически полное совпадение результатов этих авторов и Сперлинга (исполь
зовавшего не зрительную, а акустическую послеинструкцию) представляет собой про
блему для гипотезы иконической памяти, так как объединение информации из икони-
ческой и эхоической памяти допускается в блочных моделях лишь на уровне кратковре
менного хранилища. Напротив, с нашей точки зрения, процессы быстрой пространствен
ной локализации принципиально имеют интермодальный характер.                                                   205

-500 -300 -100 0 100 300 500
Асинхронность предъявления послеинструкции, мс
О пространственная инструкция ? фигуративная инструкция
Рис. 3.11. Результаты экспериментов по частичному опознанию зрительных форм в зависимости от характера инструкции, асинхронности ее предъявления и состояния тем-новой адаптации зрения (по: Величковский, 19826).

206

представленных на рис. 3.11, использование в качестве кода признака формы, а не пространственного положения приводит к тому, что для улучшения восприятия элементов предъявлять инструкцию действительно приходится до показа самой матрицы.
Из представленных на этом рисунке графиков также видно, каким образом на успешность опознания влияет предварительная темновая адаптация зрения, способствующая появлению выраженных последовательных образов стимульных объектов. Темновая адаптация улучшает результаты, давая возможность «считывать» информацию с послеобраза, но она никак не меняет вид выявляемых зависимостей, в частности, тот факт, что кривые для пространственных и фигуративных инструкций сдвинуты относительно друг друга примерно на 200 мс. Это говорит об относительной независимости микрогенеза и механизмов возникновения последовательных образов, а также о том, что сперлинговский эффект частичного отчета зависит прежде всего от параметров микрогенеза восприятия, а не от последействия сенсорной стимуляции, резко возрастающего в условиях темновой адаптации.
Обсуждая общенаучные основания исследования процессов актуального развития восприятия, нельзя не отметить их несомненную романтическую основу: микрогенетические представления естественно

соотносятся с данными о развитии восприятия в фило- и онтогенезе, а также с результатами неиропсихологических и нейрофизиологических исследований (см. 1.4.1 и 3.4.2). Этот факт в полной мере подчеркивал еще H.H. Ланге: «Подобно тому как эмбриологическое развитие человека повторяет в несколько месяцев те ступени, которые некогда проходило общее развитие рода, так и индивидуальное восприятие повторяет в несколько десятых секунды те ступени, какие в течение миллионов лет развивались в общей эволюции животных» (Ланге, 1893, с. 3).
Гетерохронность (разновременность) различных аспектов микроге-неза зрительного восприятия подтверждается нейрофизиологическими данными, свидетельствующими о существовании быстрых и медленных каналов сенсорной переработки. Они отличаются рядом анатомических особенностей (отсюда одно из их названий: магноцеллюлярные, M — крупноклеточные и парвоцвллюлярныв, ? —- мелкоклеточные). В функциональном отношении эти механизмы также весьма различны. Каналы первого типа быстро отвечают на «размытую» информацию, наличие больших пятен, движение и появление объектов в широком поле зрения. Механизмы второго типа работают сравнительно медленно, реагируя на локальные перепады яркости, тонкие линии, другие мелкие детали (Tovee, 1996).
На вопрос о том, достаточно ли этого разделения для описания микрогенеза, следует ответить отрицательно. Во-первых, не совсем ясны взаимоотношения между этими группами каналов. Обычно предполагается, что фазические каналы тормозят активность тонических21. В одном из обзоров процессов маскировки Бруно Брейтмейер (Breitmeyer, 1980), однако, приходит к выводу, что такое торможение является взаимным. Иконические репрезентации этот автор идентифицирует с положительными последовательными образами, причем, по его мнению, в процессах восприятия (в частности, при чтении) такие «иконы» могут лишь мешать восприятию деталей, а следовательно, должны активно
21 Взаимодействие фазических и тонических каналов служит основой распространен
ного объяснения обратной маскировки и метаконтраста. Предполагается, что фазичес-
кий ответ на маскировочный стимул тормозит более поздний тонический ответ на предъяв
ление тестового стимула (коррелятом этого ответа может быть описание деталей). Для
данного объяснения существенно, чтобы маскировочный стимул предъявлялся с соот
ветствующей задержкой. В последнее время обнаружены условия, при которых это объяс
нение не работает. Например, полная маскировка (метаконтраст) возникает и в том слу
чае, когда маскировочный стимул предъявляется одновременно с тестовым и просто про
должает оставаться в поле зрения после того, как тест-объект примерно через 100 мс ис
чезает (Enns & Di Lollo, 2000). Этот вариант маскировки легко предсказывается описан
ной выше (см. 3.1.3) двухуровневой моделью восприятия: 1) вначале происходит регист
рация и локализация тестового и маскирующего стимулов как некоторого недифферен
цированного события; 2) с задержкой порядка 100 мс начинаются процессы детальной
спецификации этого события, которые ведут к восприятию индивидуальных характерис
тик одного лишь маскировочного стимула. 207
подавляться22. По-видимому, зрение действительно занимается «иконоборчеством» — вывод, который предвидел уже Вундт. К тому же, разделение двух групп каналов связано, главным образом, с анализом сенсорной переработки в сетчатке и в первичных, затылочных отделах коры. Как мы увидим в дальнейшем (см. 3.4.2), восприятие вовлекает и другие структуры мозга, включающие различные субкортикальные области, а также ассоциативные зоны теменных и височных долей.

3.3 Распознавание конфигураций
3.3.1 Традиционные психологические подходы

Важнейшей функцией восприятия является распознавание зрительных и акустических конфигураций, ведущее, в частности, к узнаванию предметов и их категоризации, то есть отнесению к той или иной семантической категории. Проблема механизмов распознавания, или «распознавания образов», является одной из центральных для целого комплекса когнитивных наук: психологии, нейрофизиологии, искусственного интеллекта и нейроинформатики. В когнитивной психологии ей прямо или косвенно посвящены десятки монографий и сотни статей. В дальнейшем мы будем многократно возвращаться к ее рассмотрению из перспективы исследований памяти и организации семантической информации (см., например, 5.1.1 и 6.1.2). Данный раздел посвящен сенсорно-перцептивным механизмам распознавания.
Элементарной предпосылкой того, что некоторый объект вообще будет опознан, является его выделение в качестве фигуры из окружающего фона. Кроме того, при распознавании акцент лежит на индивидуальных признаках, таких как цвет поверхности и форма. Пространственно-ситуативные признаки (положение в пространстве, ориентация, движение, освещенность) выполняют при распознавании скорее технические функции — чаще всего их параметры лишь учитываются нами для того, чтобы дать инвариантную (константную) оценку индивидуальным признакам. Таким образом, можно сказать, что распознавание связано с относительно поздними стадиями восприятия, как бы «надстраивающимися» над процессами динамической пространственной локализации (см. 3.1.3).
22 Инерционность восприятия увеличивается при утомлении, когда ослаблены центральные процессы контроля. Это проявляется в увеличении продолжительности последовательных образов, усилении маскировки и снижении критической частоты слияния 208 мелькании (Леонова, 1984)

В последние годы были проведены систематические исследования законов перцептивной организации, направленные на выяснение природы влияющих на выделение фигуры из фона факторов и их взаимоотношений. При этом оказалось, что динамическая локализация в пространстве служит наиболее фундаментальной основой для такого выделения. Если разные законы перцептивной организации (см. 1.3.1) конфликтуют между собой, «навязывая» разные варианты группировки видимых компонентов сцены, то победителем обычно оказывается фактор близости, причем близости в трехмерном пространстве, а не на сетчатке. Закономерное движение стимулов в трехмерном пространстве также оказывается сильнейшим фактором перцептивной организации. Если пространственно-динамические факторы нейтральны (например, когда в статичной конфигурации расстояния между элементами равны между собой), то второй по силе группой факторов оказывается глобальное сходство, определяемое такими признаками, как окраска, общая ориентация (для элементов, имеющих выраженную ориентацию) или размеры (зернистость). Только тогда, когда все эти факторы нейтрализованы, группировка начинает учитывать особенности и сходство собственно формы элементов.

Рис. 3.12. Различение текстур (А) может быть противоположным по профилю простоты
и сложности различению формы (Б) образующих эти текстуры элементов. 209

Очевидное объяснение этих зависимостей состоит в том, что восприятие формы предполагает анализ уже выделенных из фона объектов, тогда как группировка основана на глобальной оценке сходства без предварительного восприятия формы образующих текстуру элементов. Эти два процесса не просто различны, но часто противоположны по чувствительности к отдельным признакам объектов. Так, хотя буквы «L» и «Т» явно отличаются по форме, образованные из них текстуры лишь с трудом отличаются друг от друга (см. рис. 3.12 справа). Напротив, небольшие вариации в наклоне «Т» практически не замечаются нами при узнавании, однако они служат хорошей основой для дифференциации соответствующих текстур (рис. 3.12 слева).

Особенно важную роль в распознавании играют именно процессы спецификации и распознавания формы. Как особая, требующая специального изучения проблема восприятие формы длительное время не осознавалась представителями «импрессионистической» (Эрнст Мах) ассоциативной психологии. Гештальтпсихологи считали восприятие формы первичным фактом восприятия, подчеркивая его «вещный», или предметный, характер. Если тезис о первичности восприятия формы вызывает сегодня — на основании представленных выше данных о микрогенезе — обоснованные сомнения, то предметность действительно представляется весьма важной характеристикой этого класса перцептивных процессов, к обсуждению которой мы еше вернемся в конце этого раздела (см. 3.3.3).
В психологических подходах последних десятилетий центральное место занимают формальные теории описания структуры перцептивных конфигураций. Речь идет о синтаксическом подходе: сначала выделяются отдельные элементы (признаки), из которых по определенным правилам (грамматикам) строится перцептивное описание конфигурации. Фактически в основу этого подхода положена более ранняя идея Дональда М. Маккая (МасКау, 1950), согласно которой перцептивная сложность (информативность) конфигурации определяется числом операций, осуществляемых перцептивной системой для ее спецификации (см. 2.1.3). Но характер этих элементов и операций над ними по-прежнему остается не вполне ясен23. Одна из наиболее интересных теорий такого рода развивается голландским психологом Э. Ле-венбергом и его коллегами (Leeuwenberg, 1978). Модель постулирует повторения, зеркальные отображения и другие избыточные операции с разными элементами конфигураций, иногда осуществляемые в итеративном (повторном) режиме, то есть в ходе нескольких последовательных обращений к продуктам процесса кодирования.
Оценка сложности различных перцептивных интерпретаций используется для объяснения множества эффектов. Так, можно задать вопрос, почему на рис. 3.1 ЗА мы всегда видим два пересекающихся квадрата, хотя теоретически возможны и альтернативные варианты, частично указанные в нижнем ряду. Ответ связан с относительной простотой процесса конструирования квадрата, для которого нужно повторное использование лишь двух элементов — отрезка фиксированной
21 Джулиан Хохберг следующим образом характеризует эти исследования1 «На физиологическом и психофизическом уровнях идет лихорадочный поиск элементов сенсорного анализа (которые учитель Гельмгольца Иоханнес Мюллер назвал "специфическими энергиями органов чувств") и есть упоминания ментальных структур, к которым эти элементы должны относиться... Но если Титченер когда-то заявил, что небольшой (по сегодняшним масштабам) финансовой поддержки и пары лет работы было бы достаточно, чтобы поставить все точки над / и черточки на tего варианта ассоцианистской теории, ..мне что-то не приходилось слышать таких оптимистичных заявлений в последнее вре-210 мя» (Hochberg, 1979, ? 138).

Потенциальные интерпретации

Прозрачность
низкая высокая

Рис. 3.13. Примеры влияния фигуративной сложности на восприятие: А. Однозначность восприятия потенциально многозначной конфигурации; Б. Эффект глубины в плоском изображении; В. Феноменальная прозрачность.
длины и угла 90°. При других интерпретациях число элементов и разнообразие операций с ними возрастает. Точно так же на рис. 3.1 ЗБ нами воспринимается, казалось бы, очень сложная трехмерная конструкция, а не плоский, нанесенный на поверхность узор. В действительности, с учетом высокой избыточности компонентов (они показаны справа), трехмерная интерпретация оказывается более простой, чем двумерная, требующая спецификации множества отличающихся по ряду параметров элементов. Наконец, на рис. 3.13В слева мы видим плоский двумерный паттерн, тогда как справа похожая с точки зрения физических при-

211

знаков конфигурация распадается на две, причем та из них, которая лежит «сверху», к тому же оказывается феноменально прозрачной, позволяющей видеть детали, лежащие «внизу». Мы предоставляем читателю возможность объяснить этот феномен по аналогии с объяснениями, данными выше24. Несколько иной подход будет рассмотрен нами в конце данной главы (см. 3.4.1).
В когнитивной психологии существует несколько групп моделей, или теорий распознавания. Только что рассмотренные формальные теории восприятия формы служат хорошим введением в эту проблематику. Дело в том, что наиболее распространенными в настоящее время являются теории признаков и структурные теории распознавания. Фактически они дополняют друг друга: признаки понимаются как исходные элементы, а структурные теории — как правила их объединения. Возникающие «описания» сравниваются с хранящимися в памяти репрезентациями (эталонами), и в случае совпадения происходит ассоциативная активация соответствующих узлов или областей семантической памяти. Хотя мы часто ориентируемся на отдельные признаки, особенно при поиске хорошо знакомых объектов, узнавание может происходить и на основании их более целостных комбинаций, как это подчеркивали гештальтпсихологи.
В силу их чрезвычайной значимости детальной классификации были подвергнуты речевые признаки, различающие отдельные буквы и, при акустическом предъявлении, фонемы (см. подробнее 7.1.1). Один из основных признаков, различающих фонемы, называется местом артикуляции, то есть местом перекрытия гортани при произнесении звука: подъемом задней части языка к нёбу, прикосновением языка к губам или соединением губ. Оказалось, что когда в психоакустических экспериментах на одно ухо подается звонкая согласная с так называемым передним местом артикуляции [Ь] и одновременно на другое — глухая согласная со средним положением артикуляции [t], то ошибки часто комбинируют эти признаки — [р] и [d] слышатся чаще, чем [q] и [к], возможно, потому, что глухость (звонкость) сочетаются здесь с передним (либо, наоборот, более задним) положением места артикуляции. Однако такого рода аргументация наталкивается на трудности. Прежде всего, физические признаки фонем не остаются постоянными и меняются в зависимости от контекста. Далее, восприятие речи вполне возможно в
24 Данный подход можно легко распространить на слуховое восприятия. Один из результатов изучения избирательного восприятия речи («проблема вечеринки» — см. 2.2.1) состоит в том, что понимание релевантного речевого сообщения на фоне шума определяется возможностью его дифференциального описания в терминах локализации, громкости, тональности и тембра голоса собеседника. Если при восприятии музыки предъявляются короткие и сильные сигналы, замещающие участки мелодии, то последняя воспринимается непрерывной с тем большей вероятностью, чем меньше сходство ее ритмического рисунка с ритмом последовательности шумов. Иными словами, различие перцептивных описаний шумовых сигналов и мелодии делает шум акустически «прозрачным» 212 (Bregman, 1990).

условиях, исключающих использование традиционных фонематических признаков (например, Remez, Rubin, Pisoni & Carrell, 1981).
Стивен Лупкер (Lupker, 1979) проверил гипотезу, согласно которой восприятие букв при чтении основано на выделении признаков. Ни одна из признаковых моделей при этом не подтвердилась. Напротив, данные хорошо описывались моделью микрогенетического типа — восприятие локальных особенностей букв начинало играть некоторую роль в их различении лишь после восприятия обобщенных очертаний. Эксперименты с маскировкой слов также показали, что она оказывается особенно сильной, если в качестве маски используются буквы, а не их фрагменты. Это говорит о том, что репрезентация букв может быть наиболее дробным слоем анализа. Существенную роль в распознавании букв играет контекст — распознавание резко улучшается, если этот контекст представляет собой осмысленное слово или, по крайней мере, произносимое псевдослово (см. ниже классический эффект превосходства слова — 7.2.1). Эта закономерность играет особенно большую роль в распознавании рукописного текста, когда один и тот же графический знак уверенно воспринимается как разные буквы (например, «А» или «Н») в зависимости от контекста.
Вторую группу теорий распознавания образуют так называемые теории шаблонов. Они предполагают наличие в памяти целостных репрезентаций, с которыми сравниваются столь же целостные перцептивные описания предметов и событий. Идея целостного сравнения подтверждается многочисленными результатами, свидетельствующими об ускорении опознания в случае общего перцептивного сходства тестового и эталонного объектов, а также данными Р. Шепарда и его коллег (например, Shepard & Podgorny, 1978) по мысленному вращению и другим пространственным трансформациям зрительных образов объектов в процессах узнавания (см. подробно 5.3.1 и 6.3.1).
Споры вызывает, впрочем, вопрос о степени абстрактности подобных целостных репрезентаций. Первоначально преобладало мнение, что их детальность, или конкретность, зависит от времени, прошедшего с момента восприятия. Считалось, что при очень коротких интервалах сравниваются детальные репрезентации, удерживаемые в иконической и эхоической памяти, так что распознавание зависит здесь от более или менее точного пространственного (зрение) и временного (слух) наложения конфигураций. Рассмотренные нами выше данные (см. 3.2.1 и 3.2.2), а также эксперименты на так называемую транссаккадическую память (Irwin, 1996) показывают, что уже через сотые доли секунды после исчезновения изображения или смены точки фиксации в рабочей памяти сохраняется лишь относительно абстрактное описание одного-двух воспринятых объектов.
Несмотря на эту сравнительно обедненную постперцептивную информацию, наша память, несомненно, умудряется строить детальные и разнообразные долговременные репрезентации осмысленных предметных сцен. Эти репрезентации, например, оказываются достаточными для „. „

успешного узнавания тысяч видовых слайдов через недели после их однократного показа (Standing, 1973). Важным условием при этом являются целостность и предметная правдоподобность — полностью абстрактные изображения и предметные сцены, поставленные «на голову» или расчлененные на несколько переставленных кусков, не обнаруживают и доли успешности узнавания экологически естественного материала. Интересно, что узнавание предметных сцен оказывается весьма успешным при повороте изображений относительно вертикали, не нарушающем законы гравитации (Величковский, 19826). Это свидетельствует о целостности процессов сравнения, которые явно не сводятся к поэлементному совмещению тестовой сцены и репрезентаций памяти (см. 5.2.1). В конце этого раздела мы рассмотрим новые работы, выявляющие особенности восприятия интактных предметных сцен, которые, по-видимому, объясняют также и их последующее успешное узнавание (см. 3.3 3).
К группе теорий, допускающих возможность целостного сравнения, примыкают теории прототипов, согласно которым при ознакомлении с элементами некоторого множества испытуемый постепенно выделяет одну или более центральных тенденций — прототипов. По отношению к ним и решается вопрос о принадлежности конкретного объекта к данному множеству. С существованием границ между классами объектов, тяготеющим к разным прототипам, связываются обычно эффекты категориального восприятия — два незначительно различающихся в отношении физических признаков объекта, которые попадают в разные классы (категории), кажутся более разными, чем объективно более различающиеся объекты, попадающие в одну и ту же категорию. Соответственно, во втором случае можно ожидать более быстрое узнавание различных объектов как одинаковых. Такие эффекты обнаружены при восприятии фонем, назывании оттенков цвета, идентификации сложных зрительных форм и т.д. (см. 7.1.1). Формирование прототипов не сводится к абстрагированию признаков, так как можно подобрать множество объектов, не обладающих признаками будущего прототипа — в отношении различительных признаков прототип будет находиться «между» конкретными образцами.
Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для частных случаев, например, упоминавшейся выше походки (см. 3.1.2). Особенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмоциональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выражения, но варьирование выражения не оказывает какого-либо однознач-214 ного влияния на узнавание лиц.

Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ориентации, а затем в нормальном и снова в перевернутом положении
Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спецификой деталей. В отличие от восприятия обычных предметов и объектов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей степени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изменение диаметра зрачка обычно не воспринимается как таковое, а интерпретируется глобально, скажем, как увеличение привлекательности. Целостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображения на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.
Зависимость восприятия «внутренней геометрии» лица от его ориентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215

можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не менее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозгового картирования, эти формы восприятия, по-видимому, преимущественно связаны с нижневисочными отделами правого полушария.

В нижневисочных отделах коры тоже локализуются процессы, существенные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы восприятия формы объектов и как это связано с межполушарными различиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные механизмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработке формы и узнавании повседневных предметов Однако они не вовлечены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это предварительное объяснение подтверждается, в частности, анализом основных синдромов дислексии — нарушения чтения при локальных поражениях мозга (см 7 2 2)

3.3.2 Влияние нейронаук и информатики

Многие из числа известных современных теорий распознавания опираются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизиологии, нейропсихологии и нейроинформатики. Начало переориентации психологических описаний восприятия на физиологическую терминологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую известность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды американская исследовательница восприятия Науми Уайсстейн)
Эти данные, полученные при изучении зрительной системы кура-
ризированных кошек, были использованы в дальнейшем для моделиро-
216 вания различных аспектов зрительного восприятия. Если нейроны вы-

деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Математическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отнесением участков, ограниченных контурами, к одним и тем же или к разным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некоторое сочетание детекции пространственных частот и ориентации Участки гладких поверхностей moi ут моделироваться путем выделения овальных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).
На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ

Рис. 3.15. Гладкие изменения телесных поверхностей (А) можно аппроксимировать (Б) с помощью множества овальных участков, разной ориентации (по Koendennk & van Doom, 2003)

218

по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вычислительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной информации. На первом этапе вычисляется грубое, но полное описание изменений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения яркости: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных параметрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, поскольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок картины. По отношению к первичному наброску последовательно применяются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона.
Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в работах Марра значительно менее подробно, чем первичная сенсорная обработка. Первоначально строится так называемая «двух-с-половиной-мер-ная» (2'/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом восприятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, универсальными элементами «ментального конструктора» служат обобщенные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответствует микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческого тела, показанная на рис. 3.16. Незначительная модификация параметров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).
К этой же группе моделей примыкает теория американского психолога Ирвина Бидермана (Biederman, 1987), предположившего, что зрительная система располагает целым алфавитом таких базовых элементов, которые он называет геонами. Наряду с цилиндрами, этот алфавит включает еще несколько других простых форм, таких как конусы и параллелепипеды. Различные предметы могут составляться из разных элементов. Психофизиологическая реальность подобных элементов не вполне очевидна. Эксперименты с использованием так называемого прайминга (см. 5.1.3), при которых гипотетические элементы предмета предъявлялись в некотором иррелевантном контексте непосредственно перед опытами на его прямое опознание, не выявили в общем случае ожидавшегося ускорения опознания. Поэтому вопрос о возможности некоторой

человек

кисть

Рис. 3.16. Описание сложного объекта с помощью иерархии «обобщенных цилиндров» (по: Магг, 1982).
универсальной, основанной на геометрии декомпозиции предметов остается открытым. Скорее всего такая декомпозиция может быть только результатом развернутого во времени обучения, позволяющего постепенно выявить компоненты предмета, которые обладают наибольшей автономной вариабильностью и, таким образом, заслуживают статуса «частей».
С помощью компьютерной графики и других, например акустических и тактильных, средств предъявления новой информации и обратной связи о собственных движениях, у наблюдателя можно создать живую иллюзию взаимодействия с динамическим предметным окружением — виртуальную реальность {virtualreality, VR)25. Кроме таких полностью искусственных моделей среды и объектов на практике (в частности, в устройствах отображения информации) широко используется промежуточная форма представления среды, расширенная реальность {augmentedreality, AR). В этом случае восприятие реального окружения совмещается с элементами искусственного окружения, созданного средствами компьютерной графики, что дает возможность воспринимать скрытые характеристики объектов, такие как внутреннее устройство автомобильного двигателя, положение анатомических структур во время эндоскопической операции, детальный рельеф местности в тумане и т.д. (см. 9.2.3).

25 Значительный прогресс наблюдается сегодня в создании тактильных (гаптических) компонентов виртуальной реальности. С их помощью сапер может за сотни метров от эпицентра событий почувствовать сопротивление проржавевшего металла обезвреживаемой роботом мины, хирург — пластичность обрабатываемых на расстоянии тканей и т.д.

219

Последней разновидностью является так называемая расширенная виртуальность (augmentedvirtuality, AV), которая представляет собой искусственное окружение для реальных объектов и, например, используется для проведения VR-видеоконференций с обсуждением и проверкой реальных технических изделий (Величковский, 2003).

Все эти сенсорные технологии разрабатываются при участии психологов. Они начинают оказывать заметное влияние и на сами психологические исследования, прежде всего психологию восприятия. В частности, системы виртуальной реальности используются для создания условий экспериментов, которые, с одной стороны, экологически валидны, а с другой, позволяют контролировать независимые переменные (как, например, в исследованиях восприятия опасных ситуаций и реагирования на них при поездках по виртуальному городу — см. 3.4.2). Наряду с этим вкладом в методологию эксперимента, компьютерная графика может служить источником аналогий для теоретических представлений о восприятии. При создании виртуального окружения сначала строится схематическая (или «проволочная») модель среды, которая затем «облачается» участками различных текстур. Можно предположить, что восприятие решает обратную задачу, а именно задачу перехода от информационно богатого внешнего окружения к обедненной схематической модели среды. Понятно, что на ранних этапах микрогенеза важную рель должны играть не только контуры, но и в особенности текстуры.

Именно при обработке текстур, выделении границ объектов и контуров обнаруживается особая компетентность разрабатываемых в ней-роинформатике коннекционистских моделей (см. 2.3.3). На рис. 3.17 показаны примеры того, как самоорганизующаяся нейронная сеть справляется с соответствующими тестовыми заданиями. В первом случае (А) сеть различает участки достаточно похожих текстур. Во втором (Б) — выделяет и подчеркивает контурные компоненты сложного изображения. Методы параллельной обработки используются также при распознавании пластических трансформаций биологических объектов, таких как движения губ при речи и мимика эмоций. Значительный практический интерес представляет собой и обратная задача — продуцирование правдоподобной мимики и эмоционального выражения лица виртуальных персонажей (аватаров). Соответствующие технологии необходимы для создания антропоморфных интерфейсов, например, систем «видимой речи», позволяющих глухим людям пользоваться для общения обычным телефоном с соответствующей компьютерной приставкой (см. 7.4.3 и 9.4.2).
Методы нейроинформатики могут использоваться и в значительно более глобальном плане — для так называемого эволюционного моделирования механизмов восприятия. Для этого первоначально совершенно гомогенная нейронная сеть (то есть сеть с одинаковыми весовыми коэффициентами синаптических связей) начинает подвергаться много-220 кратному (десятки тысяч раз) воздействию разнообразных, возникаю-

Рис. 3.17. Примеры сенсорно-перцептивных задач, успешно решаемых нейронными сетями А. Дифференциация текстур; Б. Выделение контуров в составе сложного изображения

щих в различных участках «поля зрения» сети объектов. Успешность работы сети определяется ее способностью распознавать эти объекты. Такого рода идеализированные компьютерные эксперименты обычно демонстрируют любопытный эффект постепенной «модуляризации сети»: нейронная сеть начинает распадаться на две автономные подсистемы, одна из которых занимается преимущественно выделением параметров местоположения объектов, а другая — анализом их фигуративных характеристик, критических для собственно распознавания (Calabretta & Parisi, 2005).
Вырисовывающееся различение соответствует изложенным выше фактам об уровневой организации восприятия и прямо напоминает два гипотетических механизма построения движений, а именно уровни пространственного поля С и предметного действия D, описанные в 1947 году H.A. Бернштейном (см. 1.4.2). В современной нейропсихологии предположение о существовании в восприятии приматов и человека двух, филогенетически различных зрительных систем одним из пер-

221

вых высказал, в 1968 году, шотландский исследователь Колуин Тривар-зен (Trevarthen, 1968). Специализацией более древней системы, или так называемого «амбьентного зрения» (от фр. ambiance= окружение), по его мнению, является динамическая пространственная локализация. Вторая система, или «фокальное зрение», занимается идентификацией объектов. На основании экспериментов с перерезкой мозолистого тела (корпус коллозум), связывающего между собой полушария большого мозга, Триварзен и Сперри пришли к выводу, что первая система расположена преимущественно в субкортикальных структурах, тогда как вторая система находится в коре и поэтому зависит от сохранности межполушарных связей (Trevarthen & Sperry, 1973).
В последующем нейропсихологический поиск субстрата этих двух форм зрительной обработки надолго сместился в кору (отчасти потому, что процессы в коре проще наблюдать, чем в субкортикальных структурах). В этом контексте различают дорзальный (ведущий в заднетеменные зоны коры) и вентральный (нижние височные зоны) «потоки» зрительной информации, хотя постепенно накапливается все больше данных, подтверждающих мнение Бернштейна и Триварзена, что филогенетически более древний дорзальный поток {амбьентное зрение, или уровень С) включает и субкортикальные компоненты. Различие механизмов локализации и идентификации было установлено в последнее время также в слуховом восприятии (см. 4.1.2). Аналогичные взаимодействия выявляются и при выполнении мануальных движений: при схватывании предмета сначала задается общее направление и расстояние (локализация), и лишь затем осуществляется приспособление пальцев к его форме и размерам (идентификация). Мы более подробно остановимся на дискуссиях об уровневой организации восприятия в последнем разделе этой главы (см. 3.4.2) после рассмотрения взаимоотношений восприятия и семантики.
3.3.3 Роль предметности и семантический контекст
Недостаток большинства нейрофизиологических моделей распознавания состоит в том, что они односторонне подчеркивают геометрические признаки конфигурации, игнорируя предметный контекст. Предметность восприятия представляет собой не просто абстрактный философский или, например, идеологический принцип26, а фактор, оказываю-
26 По известному замечанию Курта Коффки, мы воспринимаем «предметы, а не промежутки между ними». Согласно Брентано и последующим феноменологическим направлениям философии и психологии, предметность и интенциональность (в смысле «интенцио-нальной направленности психических актов на предметы») лежат в основе феноменов сознания. В марксистской философии предметность восприятия («чувственного отражения») 222 выводилась из предметного характера внешней практической деятельности (см. 9.3.1).

щий влияние на результаты конкретных исследований. Эксперименты с классификаций и идентификацией различных сенсорно-перцептивных признаков показывают, что нам значительно проще определять разные признаки одного и того же предмета (цвет, размер и форму), чем один и тот же признак (например цвет) такого же числа разных предметов (см. 4.1.3). Особенно поучительным является эффект превосходства объекта, обнаруженный Науми Уайсстейн и Чарльзом Харрисом (Weisstein & Harris, 1974).
Эти авторы провели эксперименты, в которых испытуемые сначала должны были в тахистоскопических пробах с последующей маскировкой различать один из четырех возможных отрезков, типа показанных на рис. 3.18А, при их изолированном предъявлении. После того как в первой части эксперимента индивидуально определялось время экспозиции, позволяющее правильно узнавать отрезки в 75% случаев, эксперимент несколько усложнялся. Вместе с каждым отрезком и на то же самое время предъявлялся фигуративный контекст, представлявший собой два квадрата, которые были смещены таким образом, что каждый из тестовых отрезков связывал между собой их различные вершины (рис. 3.18Б). Во всех пробах второй части эксперимента этот контекст был идентичным — подобное избыточное дополнение, казалось бы, не должно было улучшать различение предъявляемых линий. Более того, присутствие дополнительной информации в условиях тахистоскопичес-кого эксперимента означает дополнительную нагрузку, поэтому во второй части эксперимента можно было ожидать некоторого снижения

Рис. 3.18. Эксперименты Уайсстейн и Харриса (Weisstein & Harris, 1974): А. Изолированное предъявление одной из четырех альтернатив; Б. Предъявление тех же отрезков в контексте, создающем впечатление различных трехмерных объектов; В. Контрольный эксперимент с непредметным контекстом.

223

уровня успешности узнаваний тестовых отрезков по сравнению с условиями его первой части.
Результаты показали, однако, что успешность ответов во второй части эксперимента возрастает, достигая 90%. Иными словами, отрезки линий воспринимаются быстрее и точнее внутри конфигураций, вызывающих впечатление предметности — присутствия различных объемных («телесных») объектов, чем при изолированном предъявлении. Если бы восприятие следовало порядку активации гипотетических детекторов признаков — от линий к углам и лишь затем к более сложным, образующим предметы конфигурациям, результаты должны были бы получиться обратными. Возможное возражение состоит в том, что квадраты могут выполнять роль удобных ориентиров, присутствие которых облегчает определение положения и ориентации тестовых линий. Поэтому в одном из контрольных экспериментов тестовые линии показывались на фоне фрагментов координатной сетки (рис. 3.18В). В этом случае вероятность правильного узнавания снижалась до 70%.
Эффекты контекста не менее выражены и в слуховом восприятии. Хорошо известно, прежде всего, что признаки фонем — наименьших смыслоразличительных единиц потока речи — меняются в зависимости от акустического контекста (см. 7.1.1). Интерес представляет влияние семантики речи на восприятие фонем. Так, в классических экспериментах Р. Уоррена (Warren, 1970) фонема /s/ в составе некоторого слова иногда просто заменялась шумовым сигналом. В нормальном речевом сообщении испытуемые этого не замечали, продолжая отчетливо слышать /s/. Более того, такие отсутствующие физически, но субъективно слышимые фонемы могут при их «повторении» даже приводить к адаптационным психофизиологическим эффектам, сдвигая пороги восприятия звуков со сходными признаками27. Вместе с тем, не следует переоценивать эффекты ожидания в восприятии. В частности, нужно принять во внимание, что белый шум, использовавшийся в экспериментах Уоррена, по своим характеристикам особенно похож на фонему /s/. Если шумовыми сигналами той же средней громкости заменяются другие фонемы, то это относительно легко замечается испытуемыми.
Что можно сказать о взаимоотношении восприятия фигуративных и семантических характеристик объектов? Анализируя влияние семантики на наше восприятие, Фодор и Пылишин (Fodor & Pylyshin, 1988) связывают его с переходом от «восприятия» к «восприятию как» («perception us»),
" Соответствующий зрительный эффект состоит в следующем. Адаптация к пространственной частоте синусоидальных решеток (известно, что в детекции такого рода стимулов участвуют специализированные нейроны — см. 3.1.1) зависит не только от физической стимуляции определенной части поля зрения, но и от перцептивной организации в целом. Если часть заполненного адаптационной решеткой поля зрения перекрывается, то адаптация в этой локальной части окружения определяется тем, воспринимаем ли мы перекрытие как фигуру (то есть как предмет, выступающий перед непрерывным, образо-224 ванным решеткой фоном) или же как отверстие в решетке.

иллюстрируя это теоретическое различение следующим примером. Потерпевший караблекрушение моряк может смотреть на некоторую звезду и, безусловно, видеть ее очень отчетливо, наряду с другими звездами, но может видеть ее и совсем иначе, например, «как Полярную звезду», позволяющую ему найти направление к берегу. Аналогично, по проницательному замечанию А.Н. Леонтьева, после высадки астронавтов на поверхность Луны изменилось само наше восприятие этого небесного тела. Экспериментально семантику восприятия впервые исследовал М.П. Никитин, работавший в лаборатории В.М. Бехтерева. В статье «К вопросу об образовании зрительных ощущений», опубликованной в 1905 году, он описал эксперименты по узнаванию изображений предметов, предъявлявшихся с индивидуально подобранной околопороговой длительностью экспозиции (она составила от 0,8 до 3 мс). После каждого предъявления испытуемый зарисовывал то, что видел, и давал словесный отчет. В целом результаты подтвердили закон перцепции Лан-ге, но с одним существенным добавлением. Оно состояло в том, что всякая новая идея о предмете «запускает» микрогенез восприятия сначала. «Некоторые лица, — пишет М.П. Никитин, — так описывают этот момент: "Помню, что некоторое время ясно осознавал общие очертания некоторых линий, но, как только блеснула идея о предмете, сразу забыл их"» (1905, с. 118). Та же закономерность проявилась и в динамике зарисовок: сразу после возникновения идеи, даже если она была правильной, увеличивалось количество ошибочно изображенных деталей! Испытуемый говорил «птица» и рисовал птицу другого вида, чем та, которая была на карточке. Насколько нам известно, подобные эффекты никогда не перепроверялись в последующие десятилетия и лишь совсем недавно — через 100 лет — стали предметом анализа в контексте исследований так называемого послевнимания (см. 4.2.3).
В когнитивной психологии долго доминировало представление, что осмысленность восприятия носит постперцептивный характер. «Прека-тегориальными» считаются иконическая и эхоическая память. Уже в первых экспериментах Дж. Сперлинга испытуемым предъявлялись матрицы, включавшие буквы и цифры. Инструкция отбирать символы одной из этих двух категорий не приводила к преимуществу частичного отчета. Позднее Дж. Сперлинг и сотрудники (Sperling et al., 1971) провели эксперименты по определению максимальной скорости распознавания. Испытуемым показывались матрицы из букв, в которых нужно было найти и идентифицировать спрятанную цифру. Задача решалась при фантастических условиях предъявления, когда в каждой матрице было от 9 до 16 букв и матрицы сменялись каждые 40—50 мс. Поскольку категоризация, по мнению авторов, может иметь место лишь после строго последовательного сканирования информации из иконической памяти в «буфер опознания» (подструктуру кратковременной памяти), ими был сделан вывод о том, что распознавание одного символа может осуществляться за время порядка 10 мс (80—120 символов в секунду).

225

С точки зрения сегодняшних представлений о временных характеристиках восприятия, к этому выводу следует отнестись с некоторым скептицизмом. Среди прочего, он не учитывает возможность очень эффективной семантической категоризации хорошо знакомой перцептивной информации. Так, например, в работах по зрительному поиску было неоднократно показано что искать букву (цифру) среди цифр (букв), оказывается легче, чем искать букву (цифру) в контексте других букв (цифр). Любопытно, что эти эффекты, по-видимому, не сводятся к выделению одних только сенсорных различительных признаков материала: в литературе сообщается о результатах, согласно которым искать «букву "О"» среди цифр проще, чем искать «цифру "О"» (то есть буквально тот же самый объект с точки зрения сенсорных признаков!) среди цифр (Jonides & Gleitman, 1972). Многочисленные перепроверки, проведенные за прошедшие со времени первой публикации 30 с лишним лет, в большинстве случаев подтверждали этот поразительный результат.
Данные говорят не о вторичных, а о непосредственных эффектах значения в восприятии. Например, когда на очень короткое время (скажем, 30 мс) нам предъявляются знакомые или незнакомые символы, то длительность предъявления первых кажется больше. Этот результат сохраняется даже тогда, когда вводится обратная маскировка и испытуемый не может сказать, что было показано в каждом конкретном случае. Перцептивное распознавание оказывается до определенной степени процессом уточнения не только фигуративных, но и семантических характеристик объектов. Если начальным этапом в первом случае является динамическая локализация в окружающем пространстве, то во втором — появление абстрактного представления о существовании объекта. Нами совместно с М.С. Капицей и У. Кемпфом (Величков-ский, 1982а; Velichkovsky, 1982) проведены эксперименты по зрительной маскировке, показавшие, что на промежуточных этапах микрогенеза (100—200 мс) особую роль играют общие очертания объектов28. На основе выделения общих очертаний, в частности, могут строиться быстрые положительные ответы в задачах сравнения конфигураций. По-видимому, этим промежуточным этапам микрогенеза соответствуют и критические моменты уточнения принадлежности объекта к той или иной общей семантической категории.
Некоторые другие данные также говорят о том, что перцептивные процессы могут быть, по крайней мере, столь же тесно связаны с абстрактной семантической информацией, как и речевые. Согласно ре-
28 Недавно (март 2004) нами совместно с Т.Г. Визель и Е.Г. Гришиной было проведено обследование пациентки О.Б. Ядерная магнитнорезонансная томо1рафия выявила у нее двустороннее поражение затылочно-височных областей коры (вентральный поток — см. 3.4.2), что объясняло прозопагнозию и дислексию. Одновременно О.Б. была способна узнавать (отчасти угадывать) отдельные предметы и буквы по их форме, но только на основе общих очертаний. Восприятие внутренней геометрии предметов было нарушено (см. 226 также Botez, 1975).

зультатам M. Поттер (например, Potter & Faulconer, 1975), при показе изображения молотка испытуемый гораздо быстрее называет более общую семантическую категорию «инструмент», чем при показе слова «молоток». Об этом же свидетельствуют результаты работы И. Хофф-манна (1987). Испытуемым давалось либо возможное название категории, либо возможное название объекта, изображение которого предъявлялось с переменной задержкой вслед за этим для скоростной бинарной классификации. При этом оказалось, что в положительных пробах ответ давался быстрее, если испытуемому вначале указывалась семантическая категория некоторой средней степени общности (о таких категориях промежуточного, или «базового», уровня абстрактности и их роли в когнитивном развитии — см. 6.2.2). Например, если на картинке была изображена роза, то ответ «да» давался быстрее при преднастройке «цветок», чем при преднастройке «роза». Преднастройка на «растение» не вела к такому относительному ускорению ответов.
В связи с этими данными возникают два принципиальных вопроса. Первый состоит в том, каким образом осуществляется выделение семантических признаков в восприятии. Суть второго вопроса в том, какие следствия такое выделение имеет для процессов обработки собственно фигуративных признаков.
В связи с первым вопросом мы уже отмечали, что речь идет о микрогенетическом процессе, причем опирающемся скорее на глобальные, чем на локальные характеристики объектов и сцен. Если учесть, что детальное предметное восприятие представляет собой относительно медленный процесс, требующий (как правило, после первоначальной пространственной локализации) участия фокального внимания, то «общий смысл», очевидно, может выделяться одновременно или даже раньше, чем большинство геометрических признаков. Имеется целый ряд работ, показывающих это с помощью методики, в которой испытуемым в высоком темпе последовательно предъявлялось значительное число осмысленных изображений (Potter, Staub & O'Connor, 2004)29, Выявляемое при этом время обработки (80—200 мс) соответствует промежуточным фазам микрогенеза восприятия. Иными словами, эти промежуточные фазы микрогенеза как бы отвечают на вопрос «На что это похоже?».
В последнее время появились самые первые модели обработки сложных реалистических изображений, показывающие, как, в принципе, может происходить столь быстрое выделение их общего семантического содержания (Oliva & Torralba, 2001). Оказывается, для этого достаточно использования нескольких относительно простых фильтров, работаю-
г9 В современной психологической литературе для обозначения подобного методи
ческого приема применяется буквосочетание RSVP (от англ. rapidserialvisualpresentation,
то есть «быстрое последовательное зрительное предъявление»). Эту английскую аббре
виатуру легко запомнить, если учесть, что она идентична стандартному международному
сокращению, означающему просьбу ответить — responde s'il vous plait. 227

щих без обратной связи. Отсутствием обратных связей может объясняться высокая скорость обработки, а также то, что она оказывается возможной даже в условиях отвлечения внимания (см. 4.1.3). Работая с частотным спектром изображений, не зависящим от точной пространственной локализации и идентичности отдельных объектов, эти фильтры позволяют оценивать зрительные сцены сразу по нескольким глобальным измерениям «протосемантики сцен»: «естественный—искусственный», «угловатый—гладкий», «открытый—закрытый» и т.д. Конкретные изображения успешно кластеризуются в координатах подобного семантического пространства как примеры «морского берега», «городской сцены», «горного пейзажа» или, скажем, «интерьера дома»30.
Здесь важно еще раз подчеркнуть, что общее значение сцены может быть выделено до детального восприятия отдельных наполняющих ее предметов. Такая возможность быстрой семантической классификации осмысленных сцен, по-видимому, и обуславливает особую успешность их восприятия и запоминания (см. 5.2.1 ). Дело в том, что быстрые и полностью однонаправленные, то есть осуществляемые в режиме bottom-up, процессы глобальной семантической классификации позволяют в рамках известной семантической категории (схемы, или фрейма — см. 6.3.1) осуществлять направленную проверку идентичности вероятного предметного заполнения сцены. Они оптимизируют движения внимания при зрительном поиске, обеспечивают нужное шкалирование гранулярности внимания, позволяют предвосхитить вероятные особенности очертаний предметов и их пространственной локализации. Вместе с другими эффектами контекста, в частности, наряду с так называемыми прай-минг-эффектами (см. 5.1.3), семантическая категоризация позволяет ситуативно модифицировать параметры априорной «заметности» тех или иных фрагментов сцены, существенно дополняя таким образом в предметной осмысленной среде действие классических факторов перцептивной организации (Torralba, 2005).
Второй поставленный нами выше вопрос имеет, прежде всего, философскую подоплеку: если конечный «перцепт» — это продукт наших знаний, ожиданий, умозаключений, то что же в нем от объективной действительности? По мнению некоторых авторов, тяготеющих к философии диалектического материализма и/или к прямому реализму (его придерживаются последователи Гибсона — см. 9.3.1), семантика присутствует в объективном мире как один из его фундаментальных аспектов. По терминологии А.Н. Леонтьева, это его «пятое измерение», наряду с тремя пространственными и одним временным. При такой постановке вопроса семантика не должна с необходимостью рассматриваться как искажающий восприятие фактор. Кроме того, в когнитивных исследо-
30 Более традиционные работы по невербальной семантике (основанные на процедурах классификации и сравнения) выявляют в зависимости от исходного набора картинок несколько иные базовые измерения, в особенности измерение «активности», являющееся одним из трех измерений осгудовского семантического дифференциала (см 2.2 1 и 228 61.2).

ваниях последних лет стало общепризнанным представление о существовании не только статического, связанного со структурой семантических категорий декларативного знания, но и процедурного знания, которое имеет действенный характер и, включаясь в процессы познавательной активности, делает сенсорно-перцептивную обработку и проверку гипотез более эффективной (см. 5.3.2 и 7.2.2).
Наиболее известной попыткой интеграции схематического знания и процессов восприятия является теория перцептивного цикла Улрика Найссера (1981), по его собственному признанию, навеянная общением с Гибсоном. Эта теория, по сути дела, сводится к изображенному на рис. 3.19 круговому взаимодействию окружения, знания («схем») и перцептивной активности. В новейшей истории психологии роль этой теории состояла в объединении конструктивистских представлений о восприятии, как когнитивной интерпретации стимула, со взглядами сторонников Гибсона, согласно которым стимульная ситуация достаточна для того, чтобы полностью определять восприятие. Но сегодня эта теория представляется слишком общей (ср., например, попытку ее дальнейшего развития учеником Найссера Барсалу в 6.4.2). Она не дает объяснения ни специфическим уровневым механизмам, вовлеченным во взаимодействие со средой, ни характеру обратного влияния схем и других когнитивных факторов на наше восприятие.

? Направляет
Рис. 3.19. Теория перцептивного цикла Найссера.

229

Рис. 3.20. «Жена или теща?»: А. Однозначно «жена»; Б. Однозначно «теща»; В. Неоднозначное изображение.

230

В какой степени наше ожидание увидеть что-либо влияет на содержание восприятия? Вообще говоря, такое влияние неоспоримо и зафиксировано в авторитетных источниках: «In the night, imagining some fear, how easy is a bush supposed a bear» («А в темноте, страшилищами бредя, мы куст принять готовы за медведя» — У. Шекспир, «Сон в летнюю ночь», перевод Лозинского). Тем не менее эксперименты выявляют более сложную картину. Эпстейн и Рок (Epstein & Rock, 1960) попытались однажды продемонстрировать роль ожиданий, используя варианты классического (введенного в психологический оборот Борингом) изображения «Жена или теща?» (рис. 3.20). Они изготовили два похожих изображения, одно из которых всегда воспринималось как изображение молодой женщины (Ж), а второе — старой (Т). Вначале испытуемым предъявлялись для распознавания однозначные изображения, причем в фиксированном порядке Ж-Т-Ж-Т и т.д. После примерно 15 таких повторений за изображением «Т» неожиданно следовал показ классической фигуры. Поскольку испытуемые ожидали теперь увидеть молодую женщину, можно было бы предположить, что это ожидание сдвинет баланс восприятия в сторону «жены». Результаты показали, что первой реакцией, как правило, был ответ «Теща!». Следовательно, даже в очень специальной ситуации амбивалентного восприятия существуют факто-

Рис. 3.21. Осмысленный зрительный контекст сокращает количество сенсорной информации, необходимой для узнавания объекта. Глаз при изолированном предъявлении (А), в контексте частей лица (Б), в контексте лица (В) и в контексте человеческого тела (Г).
ры, легко преодолевающие возможное влияние таких переменных, как ожидание31.
Обратимся еще раз к приведенной только что цитате Шекспира. Не случайно речь идет о восприятии в ночных условиях, когда нарушено фокальное зрение, ответственное за восприятие деталей и идентификацию предметов (об этом говорит и характерный для сумерек или тумана амбьентный режим движений глаз, при котором возрастает амплитуда саккад, а длительность фиксаций уменьшается, причем несмотря на резкое увеличение перцептивной нагрузки — см. 3.4.2). Устранение возможности для фокального анализа увеличивает влияние внутренней, «эндогенной» составляющей — но, главным образом, в отношении дополнения отсутствующей физически детальной информации. Следующий пример иллюстрирует этот принцип дополнительности сенсорной информации и семантического знания. На рис. 3.21А обилие деталей позволяет легко узнать глаз. По мере добавления осмысленного контекста (рис. 3.21 Б и В) для этого оказывается необходимым все меньше деталей, пока всякое графическое «упоминание» глаза вообще не становится излишним (рис. 3.21Г). Количество сенсорных данных,

31 Таким фактором в данном случае может быть последействие (прайминг — см. 5.1.3) непосредственно предшествующей обработки, связанной с восприятием «теши» (или «жены»), причем последействие не только восприятия идентичности фигуры, но, например, восприятия ее размеров или ориентации, которые также различают обе интерпретации (Величковский, 1986а). Этот вопрос, безусловно, заслуживает дальнейшего экспериментального анализа.

231

необходимое для узнавания какого-либо объекта, уменьшается при увеличении семантических сведений32.
«Общий смысл» ситуации влияет на решение многих других перцептивных задач, если они имеют выраженную «эндогенную» (причем не только когнитивную, но и эмоциональную — см. 9.4.3) составляющую, как это происходит в случае целенаправленного зрительного поиска и обнаружения. Так, Ирвин Бидерман и его сотрудники (Biederman, Glass & Stacy, 1973) показали в начале 1970-х годов, что нахождение целевого предмета в сложной предметной сцене резко затрудняется при нарушении ее общей простанственно-смысловой организации, даже если локальное окружение, положение и ориентация самого предмета при этом остаются неизменными (см. также 5.1.1 и 7.2.1).

Особенно выраженным влияние семантики оказывается в случае исследований так называемой «слепоты к изменению» {changeblindness). Эти исследования (они будут подробнее рассмотрены в следующей главе — см. 4.4.1) выявили нашу нечувствительность к изменениям предметов и других визуальных особенностей наблюдаемой сцены, когда эти изменения совпадают по времени с глобальными прерываниями восприятия — как искусственными (отключение изображения на 50— 200 мс), так и естественными (саккады и моргания). В результате мы можем долго внимательно смотреть на предъявляющуюся вновь и вновь фотографию, допустим, набережной Сены, не замечая, что с каждым показом Собор Парижской Богоматери оказывается то в левой, то в правой части изображения.
Подобные данные, однако, большей частью получены в условиях, когда критические изменения были иррелевантны с точки зрения опыта деятельности наблюдателей. Кроме того, разные варианты изображений (и даже реальных событий — см. 4.4.1) не меняли общего смысла ситуации. В самое последнее время выполнено несколько работ, в которых анализировалась способность испытуемых видеть семантически релевантные изменения и подмены предметов в ситуациях игры в шахматы, наблюдения за футбольным матчем и поездкой на автомобиле по городу. Хотя эти изменения, как и раньше, вводились в моменты глобального прерывания восприятия, успешность их обнаружения увеличивалась в 3—4 раза, приближаясь к 100% (Velichkovsky et al., 2002a).
Интерпретация этих данных возможна прежде всего в рамках теоретических представлений, которые подчеркивают межуровневые взаи-
32 В истории живописи всегда использовалась эта особенность восприятия, позволяющая обходиться без точной прорисовки деталей. Начиная с работ импрессионистов, передача общего впечатления (фр. impression), основанная на игнорировании деталей, стала одним из основных художественных приемов. Аналогично, в современных фильмах, когда надо показать, скажем, множество охваченных паникой людей на палубе тонущего океанского лайнера, вместо актеров-статистов используются виртуальные персонажи, в об-232 лике которых отсутствуют многие важные при других обстоятельствах части лица и тела.

модействия процессов актуального восприятия физических характеристик объектов и структур схематического, концептуального знания о мире (см. 6.3.1 и 6.4.2). Подобные взаимодействия, очевидно, имеют двусторонний характер — в отношении порядка вовлечения уровневых механизмов они могут протекать как по направлению «снизу вверх», так и по направлению «сверху вниз», причем зачастую это может происходить в одно и то же время, так что перцептивная интерпретация оказывается результатом параллельно-последовательной конвергенции, основанной на учете ограничений и возможностей нескольких различных уровней организации. Исследования последних лет свидетельствуют о том, что одним из важнейших признаков, позволяющих дифференцировать уровневые механизмы восприятия, является их избирательное взаимодействие с сенсомоторными процессами.

3.4. Восприятие и действие
3.4.1 Сенсомоторные основы восприятия (и наоборот)

Хотя уже в исходном варианте компьютерной метафоры познавательные процессы трактовались как активное преобразование информации, сенсорным системам оставлялась роль пассивного интерфейса — своего рода проекционного экрана, сохраняющего в течение долей секунды картинку физического воздействия. Благодаря теоретическим работам Гибсона и Найссера, а также первым масштабным исследованиям целенаправленной глазодвигательной активности, проведенным в 1960-е годы советским биофизиком А.Л. Ярбусом (см. 2.4.2), фокус действенной трактовки сдвинулся в область восприятия. Этот сдвиг был вызван и техническими проблемами, возникшими в когнитивной роботике. Доминирующим направлением здесь постепенно стало создание систем активного зрения, связанных с постоянным выбором фрагментов окружения для более углубленной обработки. Как оказалось, обработка по принципу «широко и глубоко» требует слишком большого количества вычислительных ресурсов и протекает недопустимо медленно (см. 9.2.3).
Обследование окружения и выбор объектов для детальной обработки осуществляется с помощью движений головы и тела, на которые накладывается тонкий узор движений глаз. Классификация видов движений глаз дана в таблице 3.2. Наиболее известной их разновидностью являются неоднократно упоминавшиеся выше саккады — чрезвычайно быстрые скачки баллистического типа, меняющие положение глаз в орбите и позволяющие выделять фрагменты сцены для последующей фиксации. Если фиксируемый объект движется, то глаза начинают отслеживать его в режиме динамической фиксации с помощью гладких, следящих движений. Если при этом меняется еще и расстояние между объектом и 233

Таблица 3.2. Разновидности движений глаз человека и приматов (по: Joos, Rutting & Veiichkovsky, 2003)

234

Название	Стимул	Результат	Скорость
Поисковые (частично произвольные) движения
Саккады	Изменения в периферии поля зрения или намерение	Обследование окружения, ориентировка на новые пели, зрительный поиск	Скорость до 800°/с, сред, частота 3—4 Гц, амплитуда до 60°
Вергентные движения	Бинокулярная диспаратность или намерение	Бинокулярная фиксация объектов переменной удаленности от наблюдателя	Скорость до 10°/с
Стабилизирующие (непроизвольные) движения
Следящие движения (smooth pursuit)	Медленно движущийся объект	Отслеживание движений объекта	Скорость до 80°/с, затем сменяется саккадой
Вестибулярный нистагм	Движения головы	Удержание линии взора в пространстве во время собственных движений	Подобно движениям головы, возвратный скачок до 500°/с
Оптокинетический нистагм	Движение заполняющих поле зрения объектов	Удержание относительно неподвижного изображения объектов на сетчатке	Медленная фаза до 80°/с, возвратный скачок до 5007с
Микродвижения (непроизвольные движения во время фиксации)
Дрейф	Тонические моторные и вестибулярные факторы	«Плавание» глаза во время фиксации, дезадаптация рецепторов	Скорость до 1-2УС, амплитуда до 15'
M и кросаккады	Часто — вызванный дрейфом «уход» глаза с цели	Часто — восстановление фовеальной фиксации. Дезадаптация рецепторов	Скорость до 30°/с, амплитуда до 15'
Тремор	Неконтролируемая неточность работы мотонейронов	Дестабилизация изображения на сетчатке и дезадаптация рецепторов	Частота до 100 Гц, амплитуда < Г

наблюдателем, то в небольшом диапазоне удаленностей (примерно до 3 м) к отслеживанию подключаются так называемые вергентные движения, более известные как конвергенция и дивергенция. Когда наблюдатель сам перемещается в пространстве, относительная неподвижность проекции окружения на сетчатку поддерживается с помощью нистагма: пилообразных движений, медленная фаза которых компенсирует собственное движение, а быстрая — возвращает глаза в исходное положение. Для полноты картины отметим, что наши глаза во время фиксации не остаются неподвижными, а совершают мельчайшие микродвижения нистагмоидного типа, параметры которых также описаны в таблице.
Как движения глаз «встроены» в другие виды активности? Рассмотрим это на примере неожиданного сильного события, скажем, падения предмета со стола или априорно достаточно невероятного попадания самолета в одно из соседних высотных зданий. Сначала такие внезапные события затормаживают текущую активность (об этих ранних компонентах ориентировочной реакции — см. 4.4.1 и 9.4.3) и запускают перераспределение тонуса мышц, которое приводит к движению корпуса и головы — синергии поворота в сторону события. В ходе этого движения генерируется одна или несколько длинных саккад, направленных в критическую область, и только потом разворачивается фокальная обработка, ведущая к идентификации события. Фокальная обработка характеризуется сравнительно продолжительными фиксациями и саккадами небольшой амплитуды. Если связанные с событием объекты продолжают перемещаться в пространстве, фокальная обработка поддерживается следящими и вергентными (для близких расстояний) движениями глаз. Если случившееся событие носит локальный характер, типа упавшей со стола книги, то здесь окуломоторика тесно кооперирует с движениями рук, как это происходит при большинстве трудовых действий и операций. Коррелятом высокоамплитудных саккад является глобальное перемещение руки в пространстве. Зрительной фокальной обработке соответствуют движения кисти и пальцев, приспособленные к особенностям формы предметов.
В этих фазах развертывания ориентировочно-исследовательской
активности легко узнать проявление работы уровней построения движе
ний H.A. Бернштейна, хотя сам он не занимался ни движениями глаз, ни
восприятием (см. 1.4.2). Речь идет о четырех описанных им уровнях —
• от А (простейшие защитные и ориентировочные реакции) до D (пред
метное действие). Не случайно нейрофизиологические механизмы уп
равления движениями глаз обнаруживают выраженную иерархическую
организацию, включающую как субкортикальные (основание мозга,
средний мозг, базальные ганглии), так и кортикальные (теменные и
фронтальные) структуры. В самое последнее время был достигнут изве
стный прогресс в диагностике уровня текущей глазодвигательной ак
тивности. Эти работы демонстрируют связь движений глаз с характером
перцептивной и когнитивной обработки (см. 3.4.2 и 7.4.3). 235

О 140 230 420 S6U 700 840 960 1,120
Длительность фиксации, мс

0 140 280 420 560 700 840 980
Длительность фиксации, мс

1,120

Рис. 3.22. Типичное распределение длительности фиксаций (А) и соответствующих амплитуд саккадических движений глаз (Б).

236

Для иллюстрации возможного подхода рассмотрим отношение длительности зрительных фиксаций и амплитуды саккадических движений глаз (Velichkovsky, 2002). Рис. 3.22А показывает типичное распределение длительностей фиксаций водителей, проезжающих путь средней сложности в городской среде. Эти фиксации включают в подобном динамическом окружении также элементы отслеживания движущихся целей, поэтому они обычно более продолжительны (распределение как бы «растянуто» вправо), чем при рассматривании статичных картин или чтении. На рис. 3.22Б показано отношение между длительностью фиксаций и амплитудами саккад. Легко видеть существование трех различных сегментов длительности фиксаций. Первый из них (< 90 мс) относительно неинтересен: здесь несколько больших саккад просто не долетают до цели, поэтому глаза останавливаются на мгновение и потом совершают незначительное коррекционное движение.
Фиксации из второго сегмента (от 100 до примерно 300 мс) связаны с саккадами, которые довольно велики (> 4°) — больше, чем размеры радиуса парафовеальной области. Это означает, что такие саккады не могут направляться сколь-нибудь детальной, или «фокальной», репрезентацией объектов. Поэтому эти фиксации можно рассматривать как проявление низкоуровневого пространственного, или «амбьентного», модуса зрительного восприятия (аналогичного уровню С, или уровню «пространственного поля» Бернштейна). Напротив, продолжительные фиксации (более 300 мс) обычно предваряются и завершаются сравнительно небольшими саккадами. Эти саккады перемещают глаза внутри парафовеальной области, что облегчает детальное восприятие и поддержание непрерывного внимания. Этот модус обследования сцены может поэтому интерпретироваться как связанный с фокальной обработкой, по крайней мере, того типа, которая нужна для идентификации предметов и событий (уровень предметного восприятия D). Аналогичные сегменты выделяются и при рассматривании сложных статичных изображений,

Рис. 3.23. Варианты фигур, восприятие которых, возможно, определяется характером реально или потенциально осуществляемых по отношению к ним движений.
но при этом (из-за отсутствия «растягивающих» интервалы между сак-кадами следящих движений) границы сегментов сдвинуты в область меньших длительностей фиксаций.
Один из традиционных вопросов в исследованиях восприятия состоит в том, в какой степени оно включает сенсомоторные компоненты и, возможно, определяется ими. Накопленные на этот счет данные довольно противоречивы. С одной стороны, имеется множество косвенных свидетельств влияния движения глаз и локомоции на восприятие. Об этом говорит, например, регистрация движений глаз при восприятии многозначных изображений (см. рис. 3.7,6.3и9.3). Обычно различным вариантам перцептивных интерпретаций в этом случае соответствуют несколько иначе расположенные узоры фиксаций, причем изменение характера движений глаз предшествует смене восприятия (Pomplun, Ritter & Velichkovsky, 1996). Хотя речь идет всего лишь о корреляционных зависимостях, можно предположить, что с помощью частично находящихся под произвольным контролем движений глаз мы научаемся управлять восприятием таких изображений.
Вероятным фактором здесь является внутренняя, идеомоторная активность, позволяющая нам предвосхищать реальные действия и движения. Хорошим примером служат так называемые «фигуры Коп-ферманн», показанные на рис. 3.23. В последовательности этих фигур возрастает вероятность восприятия объемной призмы, а не плоского изображения. Возможная причина состоит в том, что реальная призма может быть увидена как «А» только из определенной позиции полностью обездвиженным наблюдателем. Поэтому предпочтение отдается двумерной интерпретации. В случае варианта «Б» становится возможным двигаться относительно вертикали, и только вариант «В» снимает всякие ограничения на движения наблюдателя33.
Последний пример возможного влияния идеомоторики на восприятие связан с восприятием походки в варианте исследования биологического движения (см. 3.1.2). Как показывают некоторые исследования, в подобных динамических конфигурациях мы почему-то легче узнаем себя, чем наших близких знакомых (Beardsworth & Buckner, 1978). Этот
33 Это объяснение, очевидно, применимо и к другим аналогичным объектам, рассмот
ренным нами выше (см. 3.3.1 и 9.3.2). 237

Рис. 3.24. Схематическое изображение, иллюстрирующее условия экспериментов с симметричными и параллельными движениями ладоней (по: Mechner, 2003).
результат трудно понять, если исходить из предположения о сугубо сенсорной (афферентной) основе узнавания, ведь мы практически никогда не видим себя со стороны. Он, однако, становится ожидаемым, если допустить, что узнавание включает скрытое «проигрывание» наблюдаемых движений.
Нельзя сказать однако, что движения односторонне определяют характер восприятия. Имеются данные, демонстрирующие прямо обратную зависимость. Франц Мехнер из Института психологических исследований общества Макса Планка (Mechner, 2003) проанализировал недавно феномен более простого выполнения движений, симметричных относительно оси тела. Так, если синхронно выполнять параллельные движения пальцами или ладонью со все большей скоростью (рис. 3.24А), то довольно скоро движения сбиваются и превращаются в симметричные (рис. 3.24Б). Если начать с симметричного движения, то спонтанного перехода к параллельному движению не происходит. Можно объяснить это симметричностью моторного оснащения тела — иннервация гомологичных мышечных групп проще, чем иннервация мышц, расположенных на противоположных сторонах ладони. Чтобы проверить это традиционное моторное объяснение, автор просил своих испытуемых повернуть одну из ладоней кверху и выполнять то же задание (3.24В). В этом случае одновременная активация гомологичных мышц ведет к параллельному движению и можно было бы ожидать, что именно оно будет теперь лучше выполняться при высоких скоростях. Но предпочтительным по-прежнему оставалось визуально симметричное движение, хотя оно и было связано теперь с совершенно другой и, казалось бы, более сложной иннервацией34.
Интересны нейропсихологические данные о возможности поддержки и частичной реабилитации нарушенных моторных функций с помощью замены афферентации. Так, существенной компонентой локомоций является их ритмическая организация во времени. Соответствующие «во-
34 Можно предположить поэтому, что такие мануальные движения на самом деле планируются не в координатах тела (уровень В), а в координатах внешнего, эгоцентрически
238 воспринимаемого пространства (уровень С, по Бернштейну).
L

дители ритма», возможно, локализованы или зависят от структур базаль-ных ганглиев. Бернштейн (1947) пытался помочь пациентам с сухоткой спинного мозга (tabes dorsalis), подменяя ритмическую временную организацию недоступной им в полном объеме проприоцептивной информации ритмической организацией видимого окружения в пространстве. Согласно его сообщениям, некоторые их этих пациентов могут испытывать серьезные трудности при движении по ровной, оптически гомогенной поверхности, но относительно легко поднимаются по лестнице (!) — именно потому, как полагает Бернштейн, что в последнем случае оптическая информация, структурированная видом ступенек, становится эффективным источником «зрительной кинестезии» (см. 3.1.2). Ритмическая структура видимого окружения, по-видимому, как-то «переносится» на последовательность двигательных актов.
Эти идеи не получили в свое время должного развития, но очень похожие феномены были описаны недавно для пациентов с болезнью Пар-кинсона. В связи с этим для улучшения ходьбы пациентов предлагается использовать монтирующиеся на очковой оправе устройства расширенной реальности (augmented reality — см. 3.3.2), позволяющие оптически совмещать образ окружения с координатной сеткой или соответствующими пространственно организованными стимулами (Riess, 1998).
В последнее время появились работы, направленные на компенсацию нарушений локомоций за счет привлечения механизмов социальной имитации. Японский исследователь Кори Мияке (Miyake, личное сообщение, октябрь 2003) в поведенческих опытах установил, что два идущих рядом человека обычно начинают постепенно согласовывать ритм своих движений (см. также более раннюю публикацию этой группы исследователей — Miyake, Miyagawa & Tamura, 2001). Чтобы использовать этот эффект для коррекции нарушений, Мияке разработал программную систему (виртуального робота — см. 9.2.3) под названием «Walkmate» — «идущий приятель». Система анализирует ритм и другие особенности походки пациента и вычисляет оптимальную стратегию ее трансформации в относительно стабильную и симметричную (в смысле движений левой и правой ноги) динамическую структуру. Эти промежуточные ритмические «решения» предъявляются затем пациенту в форме акустических сигналов через наушники. Первые сообщения говорят о выраженном стабилизирующем походку эффекте использования подобного электронного спарринг-партнера, в частности, у пациентов с болезнью Пар-кинсона. Конечно, и эти результаты еще должны получить независимую оценку с точки зрения надежности наблюдаемых эффектов.
Возвращаясь к общему вопросу о связи восприятия и моторики, мы хотели бы теперь рассмотреть некоторые новые данные, свидетельствующие о возможности совершенно неожиданного ответа на этот вопрос. Речь идет о группе экспериментов, в которых впервые была предпринята попытка сравнить параметры восприятия объектов, как они отражаются в нашем сознании, с тем, как они реконструируются по косвенным поведенческим признакам выполняемых нами двигательных актов (Milner & Goodale, 1995). Так, в целом ряде исследований последних лет

239

240

изучались особенности движений схватывания элементов конфигураций типа упоминавшейся выше фигуры Мюллера-Лайера (см. 2.3.2). При рассматривании этой фигуры (и других конфигураций, вызывающих так называемые оптико-геометрические иллюзии) возникает отчетливое восприятие различия физически равных элементов. Можно было бы ожидать, что это иллюзорное восприятие будет определять и особенности сенсомоторной активности. Видеорегистрация схватывания центральных отрезков фигуры Мюллера-Лайера показала, однако, что расстояние между пальцами приближающейся к фигуре кисти не зависит от иллюзорной оценки и оказывается одинаковым. В одно и то же время наше зрительное восприятие информирует сознание о различии отрезков, а моторику — об их идентичности!
Аналогичная диссоциация была обнаружена в работах американского психолога Дэниса Проффитта и его коллег (например, Creem & Proffitt, 1999). Проффитт исследовал субъективные оценки крутизны склона холмов (в изобилии встречающихся на юге штата Вирджиния, где он работает). Обычно, пытаясь «на глаз» определить угол наклона поверхности холма, мы переоцениваем его как минимум в 1,5—2 раза. Эта тенденция дополнительно усиливается, когда оценки делаются в состоянии выраженного утомления, например, сразу после многокилометрового забега. Проффитт показал, что можно получить значительно более адекватные оценки, причем совершенно не зависящие от субъективного состояния, если попросить испытуемых «на глаз» (но без зрительного контроля самих движений) установить рукой или ногой подвижную платформу в положение, примерно равное по наклону поверхности холма.
Наиболее неожиданный результат этих замечательных своей простотой экспериментов состоял в том, что адекватность и стабильность сенсомоторных оценок сохранялась лишь до тех пор, пока испытуемые непосредственно смотрели на холм. Достаточно было попросить их-повернуться к холму спиной или на 5—10 секунд закрыть глаза, как и эти оценки начинали приобретать привычные утрированные формы. Таким образом, «восприятие для действия», по-видимому, не имеет собственной памяти и в случае прерываний вынуждено опираться на данные имеющего доступ к памяти «восприятия для познания». Параметры восприятия, выявляемые при выполнении действий, тем самым, скорее соответствуют представлениям Гибсона и его последователей о прямом, не опосредованном знаниями и мышлением характере перцептивного отражения, тогда как более созерцательное «восприятие для познания» — с его зависимостью от фокального внимания, памяти и субъективных состояний сознания — лучше интерпретируется в рамках представлений о перцептивном образе как внутреннем когнитивном конструкте (см. 9.3.3).

3.4.2 Уровни восприятия
В этой главе нами уже упоминалось множество разновидностей сенсорно-перцептивных процессов, начиная с различных модальностей и субмодальностей. Некоторые из использовавшихся различений имели характер частично коррелирующих между собой дихотомических классификаций большей или меньшей степени общности. По сегодняшний день в этих данных остается много неясных деталей, причем даже в знаниях об анатомической организации, казалось бы, вдоль и поперек изученной зрительной системы человека. Одним из наиболее удачных, на наш взгляд, является различение амбьентной и фокальной обработки (см. 3.4.1). Это различение близко другим попыткам выделения двух уровней восприятия, таким как этапы локализации и идентификации, и несколько более специфично, чем классическое описание предвнима-тельной и внимательной фаз обработки, например, в «Когнитивной психологии» Найссера (см. 2.2.2). Оно может быть использовано для описания не только зрительного, но и как минимум слухового восприятия (Scott, 2005).
Остановимся на этих понятиях и стоящих за ними процессах подробнее. Под «амбьентной обработкой» понимаются процессы глобальной ориентации в пространстве и локализации объектов. По-видимому, такой характер имеет вся субкортикальная зрительная обработка, так как ограниченное количество нейронов не позволяет решать более сложную задачу идентификации объектов. Эти данные подтверждают предположение Бернштейна о том, что примитивные формы восприятия пространственного окружения связаны с субкортикальными структурами, в частности, базааьными ганглиями (стриатумом). Но перцептивная переработка пространственной информации существенна и для коры, где в этом отношении главным «специалистом» являются заднетеменные структуры (или так называемый «дорзальный поток» — см. 3.4.1 ). Эти же структуры вместе с премоторными отделами коры участвуют в реализации того, что было названо выше восприятием для действия35.
Как мы только что видели, у восприятия, непосредственно включенного в действие, возможно, нет памяти в привычном смысле слова — оно функционирует в режиме «здесь и теперь»36. Иными словами, хотя
35    Кроме того, накапливаются данные, что именно эти теменные структуры преиму
щественно являются целью так называемых магноцеллулярных (см. 3.2.3) каналов, по
зволяющих сравнительно быстро передавать зрительную сенсорную информацию о круп
ных движущихся объектах (Le et al., 2002)
36    Упоминание памяти «в традиционном смысле слова» обусловлено тем, что в послед
ние годы обнаружено значительное число эффектов так называемой имплицитной памя
ти, проявляющейся косвенно, по изменению параметров перцептивных и сенсомотор-
ных процессов. Отличие традиционной, эксплицитной памяти и имплицитного запоми
нания будет подробно рассмотрено нами в одной из следующих глав (см. 5.1.3). Процес
сы имплицитного запоминания лежат в основе многих форм перцептивного научения, в         „ ..
частности, связанного с адаптацией к сенсорным искажениям (см. 3.4.3). Имплицитное

эти перцептивные процессы требуют определенного времени для их реализации и точного тайминга, функционально они осуществляются как бы в «постоянном настоящем». Восприятие стабильного пространственного окружения также не связано с существованием сколько-нибудь детального, удерживаемого в памяти образа объектов (см. 3.1.1). Вместо этого есть очень быстрый, требующий менее 100 мс процесс локализации самих объектов. Такое отсутствие опоры на память можно объяснить двояко. С функциональной точки зрения «внешний мир — лучшая модель самого себя» (см. 9.3.2). С точки зрения нейроанатоми-ческих связей, перцептивная обработка в дорзальном потоке осуществляется в структурах, удаленных от механизмов, обеспечивающих эксплицитное запоминание, то есть от височных долей и расположенного непосредственно под ними гиппокампа (см. 5.3.2).
Иначе обстоит дело с процессами фокальной, внимательной обработки, ведущими к детальному восприятию и идентификации предметов. Эти процессы вовлекают в основном регионы височных долей, расположенные ниже и несколько спереди от теменных долей коры. Этот «вентральный поток» переработки информации, с одной стороны, контактирует с гиппокампом и его окружением, а с другой — со структурами, обеспечивающими восприятие и порождение речи (см. 7.1.1). Перцептивная обработка опирается здесь не только на сенсорную информацию, но и на семантическую память и одновременно сама служит основой для формирования фиксируемых в памяти репрезентаций отдельных ситуаций и эпизодов. Таким образом, вентральный поток оказывается идеальным субстратом для того, что было названо выше «восприятие для познания». Основные признаки двух зрительных систем приведены в табл. 3.3. Аналогичное разделение, как отмечалось, может быть проведено сегодня также по отношению к подсистемам слухового восприятия.
О связях височных долей с когнитивными механизмами говорят нарушения, возникающие при их поражениях, среди которых, наряду с апперцептивной агнозией (агнозия на форму или объектная агнозия — нарушение узнавания предметов), встречаются также ассоциативная агнозия (неспособность семантически категоризовать предмет, форма которого, судя по зарисовкам, воспринимается), оптическая афазия (неспособность назвать предмет при сохранности практического знания о его применении) и категориально-специфическая агнозия. В последнем случае речь
запоминание характерно также для аффективной информации (см. 5.3.2). Исследования восприятия боли свидетельствуют о том, что и в этом случае оценки интенсивности ощущений не опираются на процессы суммирования во времени. Хирургическая операция, продолжавшаяся лишь 6 минут, может, быть оценена как более болезненная, чем операция, занявшая 66 минут, если некоторое одиночное пиковое состояние боли в первом случае оказалось выше, чем каждый из нескольких пиковых состояний и в целом более 242 высокий болевой фон во втором (Kahneman et al., 1993).

Таблица 3.3. Две зрительные системы — перечень контрастирующих признаков (по: \felichkovskyetal., 2005)

Зрительная система	Фокальная	Амбьентная
Структуры коры	Вентральный поток	Дорзальный поток
Функция	Что	Где/Как
Включенность в движение	Меньше	Больше
Осознание/Память	Больше	Меньше или отсутствует
Временные свойства	Медленая	Быстрая
Чувствительность к освещению	Высокая	Низкая
Пространственное разрешение	Высокое	Низкое

идет о нарушениях узнавания объектов, входящих в определенную семантическую категорию — инструментов, животных или хорошо знакомых лиц. Подобные нарушения возникают при повреждении разных участков нижневисочных отделов коры.
Следует отметить, что некоторые из этих, связанных с поражениями височных долей, нарушений предметного восприятия частично компенсируются в ходе осуществляемых с ними действий. Наблюдения за пациентами с агнозией на форму показывают, что иногда они могут демонстрировать рудиментарное восприятие формы в ходе практических манипуляций с предметами. Так, при инструкции взять предмет, форму которого пациентка не в состоянии определить, она, тем не менее, может иногда правильно адаптировать пальцы подводимой к предмету руки (Milner & Goodale, 1995). Такое различение формы (или, скорее, общих очертаний), однако, оказывается ограниченным, не позволяющим учитывать внутреннюю геометрию предмета (Dijkerman, Milner & Carey, 1998). Этот вопрос продолжает в настоящее время дискутироваться, так как теменные области, безусловно, в основном специализированы на обследовании пространственного окружения и локализации объектов. В особенности структуры, расположенные в их верхних медианных зонах (близких к продольной борозде, разделяющей левое и правое полушарие), демонстрируют поданным функционального картирования мозга повышенную активацию при широком, «амбьентном» обследовании окружения. Селективное — фокальное — внимание к деталям, цвету и форме предметов вызывает подавление такой активации (Raichle, 1998).

243

Анализ случаев агнозии на форму показывает, что нарушения высших форм восприятия оставляют относительно сохранными более элементарные процессы пространственного восприятия. Интересно, что обратное скорее неверно — поражения затылочных долей часто ведут к массивным нарушениям восприятия формы и узнавания. Эти нарушения известны в нейропсихологической литературе как симулътаноагно- ' зия и синдром Балинта11. В всех этих случаях пациенты не могут интегрировать отдельные детали в целостный образ и неспособны увидеть более одного объекта в относительно простой их комбинации (по принципу «либо серп, либо молот» при восприятии старого советского герба, включавшего изображения серпа и молота). Типичны, впрочем, как раз попытки угадать по отдельным деталям целое — пациент видит круглые дуги рукояток ножниц и заявляет, что видит очки. Видимый мир как бы распадается на отдельные детали. А.Р. Лурия оставил классическое описание этих нарушений в эссе о «человеке с раздробленным миром», а один из наиболее ярких его последователей, американский нейропсихолог Оливер Закс описал в своих работах «человека, спутавшего свою жену со шляпой» (проблемы этого пациента, правда, осложнялись также выраженной прозопагнозией, то есть нарушенным узнаванием лиц — см. 3.3.1) .
Приведенные данные говорят об уровневых взаимоотношениях между механизмами восприятия пространственного положения (уровень С) и восприятия предметов (уровень D). Подобные взаимоотношения наблюдаются при восприятии событий, когда развертывание познавательной активности осуществляется в режиме «снизу вверх». В этих случаях говорят также об использовании непроизвольного внимания (см. 4.4.1). Но вовлечение механизмов восприятия в работу часто происходит в противоположном направлении, так сказать «сверху вниз» (или в порядке «обратной иерархии», reverse hierarchy— Hochstein & Ahissar, 2002). Это типично для задач активного поиска, связанных, как принято говорить в психологии, с использованием произвольного внимания (см. 4.4.2). В чисто временном аспекте работа с информацией об индивидуальном предмете (скажем, «будильник?») может предшествовать тогда процессам пространственной локализации («на ночном столике»). Пространственный поиск может легко управляться и абстрактной семантической информацией более высокого уровня ? (например, при поиске «посуды»), а даже иметь ситуативно-творческий характер, включающий элементы мышления (уровень F — см. 8.4.3). Так, пытаясь найти «то, что можно положить под проектор», можно значительно облегчить себе задачу, если
37 У полностью здоровых людей резкое сужение размеров функционального поля зрения, или феномен туннельного зрения, наблюдается при высокой степени эмоционального стресса. Возможно, туннельное зрение объясняется связью дорзальной системы коры (и, следовательно, амбьентного восприятия) с базальными ганглиями, участвующими в 244 регуляции эмоций и стресса и крайне чувствительными к ним (см. 9.4.3).

догадаться, что любая достаточно толстая и раскрытая соответствующим образом книга легко послужит такой подставкой.
Различение уровней восприятия имеет большое практическое значение и за пределами нейропсихологии. Поскольку в условиях слабой освещенности избирательно затрудняется идентификация предметов и событий, тогда как широкое амбьентное восприятие, связанное с ориентацией в пространстве и управлением собственными движениями, может оставаться относительно сохранным, у водителей возникает опасная иллюзия отсутствия каких-либо существенных изменений способности управлять автомобилем в сумерках и скорость движения обычно не снижается. Если при этом внезапно возникает задана идентификации — тени, припаркованной машины или пешехода, водитель может не справиться с ее решением. Число аварий со смертельным исходом в сумерках примерно в 4 раза больше, чем при дневном освещении. Характерно, что в этих условиях примерно 25% водителей, только что сбивших пешехода, утверждают, что вообще никого на дороге не видели38. Разделение двух уровней (или модусов) зрительной переработки информации справедливо рассматривается в прикладной психологии как «скрытый фактор-убийца», ответственный за высокий процент серьезных аварий в ночное время (Leibowitz, 1996).
В самое последнее время появились новые возможности лабораторного исследования восприятия и поведенческих ответов на внезапную опасность. Этот вопрос имеет давнюю историю. На заре научной психологии Уильям Джеймс иллюстрировал восприятие опасности случаем внезапной встречи с медведем в лесу. Примерно в том же плане, но уже экспериментально один из основателей современной когнитивной нейропсихологии Дональд Хэбб исследовал реагирование высших приматов на змею. Конечно, в современном урбанизированном мире эти примеры носят скорее воображаемый характер. Большинство угрожающих нам опасностей имеют техногенное происхождение, и среди них выделяются те, которые возникают при автомобильном движении. Достаточно сказать, что только на дорогах России ежегодно гибнет население среднего по величине города, а США потеряли в автодорожных катастрофах больше людей, чем во всех войнах своей истории.
Для того чтобы экспериментально изучать поведение человека в ситуации опасности, нужно найти некоторый компромисс между воображением и реальностью. Таким компромиссом является упоминавшаяся выше технология виртуальной реальности. В одном из экспериментов мы
38 Надо сказать, что имеются два других фактора, вносящих вклад в эту статистику.
Прежде всего это утомление и сонливость, максимальные в предутренние часы (время,
называемое в голландском языке «собачей вахтой»). Еще одна причина связана с мета-
когнитивными процессами (см. 8.1.1). Пешеход на ночной дороге обычно лучше адаптиро
ван к темноте, чем водитель, полноценной зрительной адаптации которого препятствует
подсветка приборов и яркая зона освещенности перед машиной. Тем не менее пешеходы,
по-видимому, полагают, что если они отчетливо видят движущийся автомобиль, то, по
крайней мере, столь же отчетливо их должен видеть и водитель. 245

246

Рис. 3.25. Две потенциально опасные ситуации в экспериментах с поездками по виртуальному городу А Перекресток со светофором, Б Пешеход на краю дороги (по" Velichkovsky et al, 2002b).
создали в нашей лаборатории условия, при которых можно было длительное время «ездить» при дневном освещении по довольно реалистическому виртуальному городу, время от времени попадая в различные непростые ситуации. Рис. 3.25 показывает два потенциально опасных эпизода — приближение к перекрестку со светофором (А) и пешехода, стоящего на краю дороги (Б). Каждая из подобных потенциальных опасностей могла внезапно превратиться в непосредственную угрозу, когда у самого перекрестка зеленый свет менялся на красный или же пешеход начинал быстро переходить дорогу. Кроме таких опасных событий, зрительное окружение испытуемых постоянно изменялось: в зависимости от скорости (то есть от нажатия ногой на соответствующую педаль) усиливалось или замедлялось оптическое «разбегание» видимой панорамы, по дорогам ездили другие автомобили (иногда по той же полосе," но на приличном расстоянии), а другие пешеходы двигались по пешеходным дорожкам независимо от дорожной ситуации.
Вся эта «жизнь» находилась под контролем нескольких связанных между собой компьютеров. Более того, миниатюрные телекамеры с высокой скоростью и точностью непрерывно регистрировали движения головы и глаз водителя. Нас интересовало, как водитель и его глаза реагируют на оба класса опасных событий. Следующий вопрос состоял в том, насколько стабильными эти реакции остаются во времени. В самом деле, после классических работ психофизиолога E.H. Соколова (подробно изучившего ориентировочный рефлекс, возникающий в ответ на неожиданное изменение ситуации — см. 4.4.1) хорошо известно, что многие реакции организма, связанные с ориентировкой в окружении, могут постепенно ослабевать и даже практически полностью угасать.
Чтобы ответить на эти вопросы, мы попросили 12 опытных водителей в течение 5 последовательных недель «ездить» по одному и тому же виртуальному маршруту. «Статические» компоненты окружения при этом оставались неизменными, все динамические события были более или менее случайными. Каждая такая поездка продолжалась примерно

-4-3-2-1 0

2 3 4 5

-4-3-2-1012345

Рис. 3.26. Изменение продолжительности зрительных фиксаций до, в момент и после возникновения опасного события в случаях успешного реагирования А. Красный свет светофора, Б Переходящий улицу пешеход (по. Velichkovsky et al., 2002b).

40 мин. Рис. 3.26 показывает динамику продолжительности зрительных фиксаций непосредственно до (4 фиксации), в момент (эта фиксация обозначена «0») и сразу после критического события во всех тех случаях, когда водители успешно тормозили или объезжали (эпизоды с пешеходом) опасность. Три горизонтальные линии соответствуют референтным (baseline) порогам 5, 50 и 95% средних продолжительностей фиксаций на различных участках поездок, не содержавших опасные эпизоды. Легко видеть, что оба класса критических событий вызывают мощную и единообразную реакцию удлинения фиксации, причем эта реакция совершенно не угасает со временем. Относительно продолжительные фиксации после события (от +1 до +3) коррелируют с произвольными движениями, в данном случае нажатием на педаль торможения. Особенно интересны те чрезвычайно редкие случаи (< 1%), когда водители не успевают отреагировать на острую опасность, пересекая перекресток на красный свет (N = 12; рис. 3.27А) или проезжая сквозь идущего пешехода (N = 9; рис. 3.27Б). Эти ошибки не могут быть объяснены недостатком времени на принятие решения, так как скорость обычно была даже несколько ниже нормативных (и достаточных) 50 км/час. Нельзя их объяснить и различиями оптических условий — на самом деле, совершая ошибки, водители часто прямо смотрели на светофор или на пешехода. Поскольку число таких наблюдений было столь незначительным, традиционный статистический анализ был невозможен. Однако его вполне заменяет прямое сравнение с референтными пороговыми значениями: продолжительность фиксаций в момент опасности явно превышает порог 95%, особенно для более драматического эпизода с пешеходом. Единственное реальное отличие по сравнению с данными, когда водители правильно реагировали на опасность, состоит в том, что при ошибочных ответах критическому событию предшествуют две-три короткие фиксации, продолжительность которых оказывается на уровне или ниже порога 5%.

247

-4-3-2-10 1 2 3 4 5

-4-3-2-1012345

248

Рис. 3.27. Продолжительность фиксаций до, в момент и после возникновения опасного события в случаях совершения ошибки:'А. Проезд перекрестка на красный свет; Б. Наезд на пешехода (по: Velichkovsky et al., 2002b).
Почему эти непосредственно предшествующие опасному событию фиксации ассоциируются с ошибками? Для ответа на этот вопрос нужно вернуться к рассмотренным выше данным о возможной связи между длительностью фиксации и уровнем обработки (см. 3.4.1). Фиксации, непосредственно предшествующие ошибкам, имеют длительность порядка 200 мс и, следовательно, принадлежат сегменту ам-бьентного восприятия. В случае адекватных реакций фиксации перед критическим событием с их средней длительностью около 400 мс свидетельствуют о фокальном, или внимательном, анализе ситуации. Причина ошибок состоит, видимо, именно в переключении с фокальной на преимущественно амбьентную обработку. Такие переключения, могут кратковременно наблюдаться и при рассматривании картин Рембрандта, но в условиях дорожного движения они дополнительно провоцируются постоянными изменениями видимого окружения — появлением новых объектов, изменением их взаимного положения и т.д. Водители не успевают своевременно идентифицировать опасность, поскольку критические события случаются во время перцептивной обработки, задачей которой является нечто другое, прежде всего общая пространственная ориентация. Эти новые данные позволяют надеяться на возможность ранней диагностики эпизодов с высокой вероятностью ошибки и на ее использование для адаптивной технической поддержки водителя (см. 7.4.3).

3.4.3 Развитие и специализация восприятия
Исследования раннего онтогенеза восприятия относятся к числу наиболее увлекательных глав экспериментальной психологии, нейрофизиологии и философии. Длительное время именно философские позиции определяли характер ведущихся по этой проблеме дискуссий. Эмпирицисты, прежде всего Джордж Беркли, выдвинули тезис о полной неорганизованности ранних сенсорных впечатлений младенца, которые упорядочиваются только в ходе их ассоциации с моторными ощущениями. Эта точка зрения особенно сильно повлияла на психологию. В 19-м веке ее разделяли Гельмгольц и Джеймс, который писал, что окружающий мир представляет собой для новорожденного «bloomingboozingconfusion» (читатели, знающие английский язык, могут попытаться перевести это замечательное определение сами). Жан Пиаже — крупнейший специалист прошедшего столетия в области психологии развития — также по сути дела солидаризировался с данной точкой зрения. Он, в частности, высказал предположение, что до опыта двигательных манипуляций с предметами у младенца нет их восприятия как некоторых объективных, независимых от него сущностей.
Во всех этих пунктах противоположной (и первоначально столь же малодоказательной) точки зрения придерживались представители направлений, тяготеющих к кантианскому рационализму (гештальтпсихо-логия) и к прямому реализму (экологический подход Гибсона). Философским основанием для отрицания роли эмпирического, в частности двигательного, опыта в процессах восприятия были взгляды Канта на априорный, то есть существующий до всякого опыта характер наиболее общих категорий нашего рассудка, таких как пространство и время (см. 1.1.3). Когнитивные исследования восприятия впервые позволили проверить справедливость этих взглядов на природу ранних перцептивных достижений.
При проведении подобных исследований приходится целиком опираться на косвенные, поведенческие и физиологические индикаторы восприятия. Большое значение имеют также сравнительные, в том числе и нейрофизиологические эксперименты на животных. Все эти источники говорят о том, что сенсорные возможности новорожденного сильно редуцированы — очень низка острота слуха и зрения, нет восприятия цвета, нет и достаточной бинокулярной координации, которая развивается в течение первых 6 недель жизни39. Наконец, предельно ограниченными длительное время остаются сенсомоторные возможности,
39 Тем не менее, по-видимому, возможна очень ранняя, в первые недели после рожде
ния, имитация сенсомоторного поведения другого типа высовывания языка в ответ на
многочисленные показы языка взрослым. Считается, что в основе этой имитации может
лежать активность зеркальных нейронов, расположенных в нижних отделах премоторной
коры (см. 2.4.3). Эти результаты, как и вообще все результаты, полученные в исследова
ниях с младенцами, требуют тщательной перепроверки. 249

так что, например, устойчивое схватывание предмета наблюдается начиная примерно с 4 месяцев. Вместе с тем, экспериментальные данные отнюдь не подтверждают тезис о полной неорганизованности самых первых восприятий. Напротив, вырисовывающаяся картина свидетельствует о поразительной перцептивной компетентности младенца уже в первые дни и недели жизни, особенно в отношении интермодального восприятия пространственного положения объектов.
В одном из экспериментов Джером Брунер и Барбара Козловска показывали младенцам в возрасте 3 недель на различном расстоянии яркие цветные предметы, которые отличались размером. Хотя в этом возрасте устойчивое схватывание объекта еще невозможно, исследователи обнаружили повышенную моторную активность в плечевом поясе при предъявлении именно тех предметов, размеры и удаленность которых позволяли бы их схватить тремя месяцами позже. В другой известной работе был проведен анализ того, как младенцы этого же возраста реагируют на совпадающую и на противоречивую интермодальную информацию о пространственном положении. Если при приближении лица матери младенец слышал ее голос в совершенно другом направлении, это приводило к изменению обычно положительной эмоциональной реакции, о чем можно было судить по учащению ритма сердцебиений.
Ученик Гибсона Томас Бауэр (1981) провел эксперименты, в которых попытался прямо проверить предположение Пиаже о первоначальном солипсизме восприятия младенца. В этой работе ребенку в возрасте до 4 месяцев показывалась яркая игрушка. После того как становилось ясно, что игрушка замечена и вызвала интерес, она на глазах у малыша помещалась за стоящий перед ним непрозрачный экран. Исходный феномен, описанный Пиаже, состоит в том, что при этом младенец теряет интерес к игрушке и не предпринимает попыток ее достать. Это наблюдение, конечно, может говорить о том, что предмет, исчезающий из поля зрения младенца, перестает для него существовать. Возможными остаются, однако, и другие объяснения, например, что поведение ребенка обусловлено слабостью его сенсомоторных возможностей, а не отсутствием знания о постоянстве существования предмета. Поэтому Бауэр продолжил эксперимент. Через короткий интервал после исчезновения игрушки (интервал был коротким, чтобы не тестировать память вместо восприятия) экран поднимался и ребенок мог видеть либо игрушку, либо пустое место. Если бы ребенок не знал о продолжении существования предмета вне его восприятия, появление игрушки должно было бы вызвать у него реакцию удивления. Если же предметы субъективно существуют независимо от актуального восприятия, то удивление должно было бы вызвать отсутствие игрушки за экраном. Именно этот последний результат и был получен в эксперименте40.
40 В качестве показателей удивления в этих и аналогичных экспериментах использовались психофизиологические признаки ориентировочной реакции, которая будет рассмот-250 рена в следующей главе (см. 4.4.1).

финиш

старт

старт
Рис. 3.28. Траектории движений глаз младенца при рассматривании лица: А. Первые 2—3 недели жизни; Б. От 4 недель и старше.
Таким образом, многое в восприятии представляется врожденным, причем в плане самых общих категорий, таких как интермодальное пространство и постоянство существования предметов. Чувствительность к нюансам в пространственной области сочетается со слабостью в восприятии формы. В самом деле, регистрация движений глаз показывает, что в первые недели жизни младенец фиксирует лишь наиболее заметные элементы внешних очертаний предметов и лиц (рис. 3.28). Поэтому предмет, положенный на другой предмет, несколько больших размеров перестает им восприниматься41. Даже когда к концу первого месяца жизни младенец начинает фиксировать внутренние детали обращенного к нему лица, его интерес привлекают прежде всего глаза — независимо от того, сколько глаз находится на лице и как они распределены по его поверхности. Это заставляет сделать вывод, что описанная в предыдущих разделах этой главы дорзальная система восприятия (уровень С, без его моторных компонентов) в большей степени готова к функцио-

41 Близкие наблюдения многократно описаны в нейропсихологической литературе и в исследованиях поведения приматов с удаленной зрительной корой. Поэтому не исключено, что речь идет о субкортикальных эффектах. Интересно, что фактически они реализуют правило, согласно которому «в одном месте пространства в данный момент времени может находиться только один предмет». Дальнейшее уточнение этого правила к концу первого — началу второго года жизни связано в разных культурах с использованием игрушек «матрешечного типа», когда из одного предмета внезапно появляется другой (Бауэр, 1981).

251

252

нированию к моменту рождения, чем вентральная система (уровень D), которая дозревает и, возможно, отчасти формируется в течение первого полугодия жизни (см. 9.4.2).
Еще один аргумент против моторных теорий развития восприятия связан с наблюдениями за развитием детей с серьезными врожденными аномалиями опорно-двигательного аппарата. При условии полноценной социальной поддержки, их перцептивное и интеллектуальное развитие не обнаруживает никаких выраженных отклонений от нор,мы. По-видимому, невозможность осуществлять собственные движения может быть компенсирована выполнением совместных действий с другими людьми. При такой широкой трактовке можно сохранить представление о том, что перцептивное развитие происходит в русле осуществляемой активности, которая «проявляет» и усиливает существующие задатки, но, правда, тем самым иногда ограничивает их спектр. В главе, посвященной речи (см. 7.1.1), будут рассмотрены данные о восприятии и произнесении фонем. Эти данные свидетельствуют о том, что специфическое языковое окружение ведет к исчезновению первоначально присутствовавшего различения некоторых речевых звуков. Так, столь важные для европейцев различия фонем /р/ и /л/ не являются смыслоразличительными в японском языке. Поэтому взрослые носители этого языка не способны к их дифференциации ни при произнесении, ни при узнавании.
Первые недели и месяцы жизни являются критическим периодом в развитии восприятия, когда формируются его основные нейрофизиологические механизмы. Однако пластичность восприятия сохраняется на годы и десятилетия, о чем свидетельствуют эксперименты на адаптацию к сенсорным искажениям. Обычно в этих экспериментах, начало которым положил в конце 19-го века один из американских учеников Вунд-та Джордж Стрэттон, испытуемые должны были в течение более или менее длительного времени носить специальные очки, или призмы, меняющие отображение видимого окружения на сетчатку. Даже наиболее радикальные из таких искажений, переворачивающие ретинальное изображение на 180°, как правило, сопровождаются восстановлением двигательных координации и практически нормального восприятия через несколько недель после начала ношения призм.
Адаптация к сенсорным искажениям, по-видимому, осуществляется прежде всего в рамках той заднетеменно-премоторной подсистемы восприятия, которая была названа выше «восприятием для действия». Разнообразные исследования этого рода, в том числе с животными, демонстрируют важную роль сенсомоторной активности в возникновении наблюдаемых адаптивных изменений (Held & Hein, 1963). Однако в отличие от опытов с животными, где собственная моторная активность в сочетании с вызывающими ее сенсорными изменениями оказывается необходимым условием адаптации, эксперименты с людьми выявили

еще один возможный подход, ведущий к коррекции сенсорных искажений даже при собственной моторной пассивности испытуемого. Для этого испытуемый, похоже, может использовать речь, управляя своими перемещениями в пространстве при помощи другого человека. В соответствии с данными о раннем онтогенезе мы можем предположить, что не только моторные акты сами по себе, но и в особенности жтенцио-нальные, в том числе речевые действия (см. 7.1.2), выполнение которых может быть поддержано другими лицами, существенны для становления и перестройки перцептивных механизмов42.
Интерес представляют и другие результаты, полученные в исследованиях адаптации к оптическим искажениям. К ним относится, в частности, определенная последовательность наблюдаемых коррекций. Эти «стадии» особенно заметны при значительных искажениях типа инверсии ретинального изображения. Как правило, самые первые признаки положительных изменений возникают при локомоциях и выполнении действий с предметами. Затем постепенно «подтягиваются» особенности феноменального восприятия. При этом учитывается и семантическая информация — свечка, видимая сначала в перевернутом положении, вдруг воспринимается правильно, если ее поджигают и пламя начинает указывать направление «вверх»; точно так же «переворачивается«· чашка, в которую начинают наливать воду, и т.п. (O'Reagan & Noe, 2001). В течение длительного времени после, казалось бы, наступившей адаптации внимательный интроспективный анализ ведет к выводу об инвертированное™ восприятия. Внезапные рецидивы искажений также вполне возможны на этих поздних стадиях адаптации, причем часто они связаны с восприятием фрагментов символьной информации, таких как названия газет, вывески и номера автомобилей. Когда в конце концов искажающие восприятие оптические устройства снимаются, видимое окружение снова начинает казаться дезориентированным, но реадаптация происходит значительно быстрее.
Эти наблюдения привели к ряду работ, направленных на выявление особенностей памяти и научения, лежащих в основе адаптации к сенсорным искажениям. В этих экспериментах испытуемые должны были время от времени снимать искажающие линзы. Продолжительность интервалов с линзами и без оных варьировалась, а прогресс адаптации измерялся с помощью объективных тестов. Основной результат состоял в демонстрации относительной иррелевантности общего времени эксперимента и практического отсутствия забывания — адаптация происходила только при непосредственном сенсомоторном и перцептивном взаимодействии с окружением и при наличии линз, причем каждое новое их надевание продолжало ход адаптации примерно в прерванной ранее точке. Периодически заменяя пару линз, можно было даже добиться двух разнонаправленных адаптации при сохранении третьего, нормального
42. Понятие речевых действий (речевых актов — англ. speech acts) является одним из
центральных для современных философских исследований в области лингвистики и праг
матики Оно будет рассмотрено нами подробнее в главе, посвященной речи и ее механиз
мам (см 7.1.2). В следующей главе мы также остановимся на возможной роли речевых
действий в процессах оперативного контроля выполняемых действий (см. 4.4.2). 253

254

модуса восприятия в одно и то же (макро)время (Welch et al., 1993). Эти данные напоминают результаты, полученные при изучении формирования навыков чтения инвертированного текста (см. 5.1.3) и при анализе узнавания больших массивов сложных зрительных сцен (см. 5.2.1). Они подтверждают предположение о том, что в основе адаптационных эффектов лежат механизмы, отличающиеся от тех, которые известны из традиционных исследований памяти и обучения. Эти различия будут подробно рассмотрены в следующих главах.
Как ни любопытны в целом данные об адаптации к сенсорным искажениям, не менее драматические изменения происходят в процессах нормального развития. Речь идет о формировании и шлифовке, иногда в течение десятилетий, перцептивных компонентов наших знаний и умений. Так, все мы обычно являемся экспертами в области восприятия и узнавания лиц, причем особое умение целостного схватывания выражения лица (его индикатором служит иллюзия Тэтчер — см. 3.3.1) оказывается сравнительно поздним достижением, проявляющимся лишь к началу подросткового возраста. Точно так же значительные изменения претерпевают процессы, включенные в чтение. На поздних этапах развития этого навыка зрительная обработка и обслуживающие ее движения глаз могут обеспечить узнавание слов и даже выделение общего смыслового содержания фразы без детального анализа отдельных букв и их последовательности (см. 7.2.1).
Еще одним ярким примером перцептивного обучения являются скорость и удивительная надежность идентификации опасных ситуаций автомобилистами. Даже в намеренно усложненных условиях одного из описанных выше исследований (см. 3.4.2) опытные водители вовремя замечали свыше 99% опасных событий. Эти и другие, более специальные примеры (распознавание шахматных позиций гроссмейстерами или фотографий тундры геологами) говорят о том, что перцептивное обучение приводит к чрезвычайно быстрому автоматическому выделение осмысленных, целостных признаков и их изменений (см. 4.3.2 и 8.3.3).
Начав с анализа восприятия новорожденных, естественно кончить упоминанием изменений восприятия в старческом возрасте. Исследования показали, что на этом возрастном сегменте наблюдается неожиданный рост корреляции интеллекта, памяти и внимания с простейшими показателями работы сенсорных систем, такими как острота зрения и слуховая чувствительность (Baltes & Lindenberger, 1997). Поскольку эта зависимость является корреляционной, ее объяснение пока остается загадкой. Возможно, она объясняется уменьшением количества ресурсов внимания — этот общий фактор начинает лимитировать успешность решения как перцептивных, так и когнитивных задач (см. 4.2.1). Другое объяснение состоит в том, что ослабленные зрение и слух превращают простейший акт восприятия в сложную когнитивную задачу. Возможно

также, что внешний мир должен во все большей степени использоваться как источник поддержки ослабленным когнитивным механизмам. В частности, ухудшение произвольной памяти может вести ко все более выраженной опоре на воспринимаемое предметное и социальное окружение, выполняющее функцию своеобразной «внешней памяти» (см. 5.4.1 и 9.3.3).

Ваш комментарий о книге
Обратно в раздел психология

Библиотека Гумер - психология

Библиотека

Теология

Конфессии

Иностранные языки

Другие проекты

Величковский Б. Когнитивная наука: Основы психологии познания

ОГЛАВЛЕНИЕ

ГЛАВА 3. СЕНСОРНО-ПЕРЦЕПТИВНЫЕ ПРОЦЕССЫ

3.1 Пространство и время восприятия

Зрительная пространственная локализация

Восприятие движения и времени

Перцептивные взаимодействия и маскировка

3.2 Взлет и падение «иконы»

Иконическая память

Эхоическая память

Микрогенез как альтернатива

3.3 Распознавание конфигураций

Традиционные психологические подходы

Влияние нейронаук и информатики

Роль предметности и семантический контекст

3.4. Восприятие и действие

Сенсомоторные основы восприятия
(и наоборот)

Уровни восприятия

Развитие и специализация восприятия

3.1 Пространство и время восприятия
3.1.1 Зрительная пространственная локализация

3.1.2 Восприятие движения и времени

3.1.3 Перцептивные взаимодействия и маскировка

3.2 Взлет и падение «иконы»
3.2.1 Иконическая память

3.2.2 Эхоическая память

3.3 Распознавание конфигураций
3.3.1 Традиционные психологические подходы

3.3.2 Влияние нейронаук и информатики

3.4. Восприятие и действие
3.4.1 Сенсомоторные основы восприятия (и наоборот)

Поиск по сайту

Библиотека Гумер - психология

Библиотека

Теология

Конфессии

Иностранные языки

Другие проекты

Величковский Б. Когнитивная наука: Основы психологии познания

ОГЛАВЛЕНИЕ

ГЛАВА 3. СЕНСОРНО-ПЕРЦЕПТИВНЫЕ ПРОЦЕССЫ

3.1 Пространство и время восприятия

Зрительная пространственная локализация

Восприятие движения и времени

Перцептивные взаимодействия и маскировка

3.2 Взлет и падение «иконы»

Иконическая память

Эхоическая память

Микрогенез как альтернатива

3.3 Распознавание конфигураций

Традиционные психологические подходы

Влияние нейронаук и информатики

Роль предметности и семантический контекст

3.4. Восприятие и действие

Сенсомоторные основы восприятия (и наоборот)

Уровни восприятия

Развитие и специализация восприятия

3.1 Пространство и время восприятия 3.1.1 Зрительная пространственная локализация

3.1.2 Восприятие движения и времени

3.1.3 Перцептивные взаимодействия и маскировка

3.2 Взлет и падение «иконы» 3.2.1 Иконическая память

3.2.2 Эхоическая память

3.3 Распознавание конфигураций 3.3.1 Традиционные психологические подходы

3.3.2 Влияние нейронаук и информатики

3.4. Восприятие и действие 3.4.1 Сенсомоторные основы восприятия (и наоборот)

Поиск по сайту

Сенсомоторные основы восприятия
(и наоборот)

3.1 Пространство и время восприятия
3.1.1 Зрительная пространственная локализация

3.2 Взлет и падение «иконы»
3.2.1 Иконическая память

3.3 Распознавание конфигураций
3.3.1 Традиционные психологические подходы

3.4. Восприятие и действие
3.4.1 Сенсомоторные основы восприятия (и наоборот)