Главное меню
Главная
Новости
Материалы
Справочник
 
Главная arrow Материалы arrow Психодиагностическое изучение мышления arrow Руководство к прогрессивным матрицам Равена
Руководство к прогрессивным матрицам Равена Печать E-mail
 
 
 
 
 
 
 
 

 

РУКОВОДСТВО К ПРОГРЕССИВНЫМ МАТРИЦАМ РАВЕНА

 
 
 
Дж.К.Равен, Дж.Х.Курт, Дж.Равен

 

 

 

 

Раздел 1

Общий Раздел Руководства

Дж.К.Равен, Дж.Х.Курт, Дж.Равен. Руководство к прогрессивным матрицам Ранена и словарным шкалам. Разд.1. Общая часть руководства: 1997-82 с.

Общий раздел Руководства включает обзор и теоретическое обоснование всей батареи тестов Равена. Обсуждаются вопросы конструктной валидности Прогрессивных Мат­риц, история их создания, принципы построения, границы приме­нимости для разных прикладных областей. Описана структура всех разделов Руково­дства.

© J.С.Raven Ltd.1995

ISBN 5-89353-004-7 (рус.) ISBN 1 85639 016 0 (англ.)

ЛР№ 064615 от 03.06.96 г.

Подписано в печать 15.04.97. Формат 60 х 84 /8. Гарнитура "Ареал1 Усл. печ.л. 10.4. Уч.изд.л. 7.45. Тираж 150 экз. Заказ № 121

Отпечатано с готового оригинал-макета в типографии ИП РАН 129366 Москва, ул. Ярославская 13 Первая публикация —1976 С исправлен и я или и дополнениями — 1978

Стереотипное издание — 1979 С исправлениями и дополнениями — 1985 С исправлениями дополнениями — 1986 Полностью обновленное издание — 1991 С исправлениями дополнениями — 1993 С исправлениями дополнениями — 1995

АВТОРСКИЕ ПРАВА

Вся корреспонденция, касающегося авторского права, включая запросы на лицензии для производства специальных бланков для ответов при диагностике дизлексии или проведении стандартизации, должны быть адресованы Джону Маклохлину (John McLaughlin).

КОНСУЛЬТАЦИИ И ПУБЛИКАЦИИ

Все российские пользователи тестов Равена могут посылать копии своих публикаций и отчетов непосредственно Джону Курту.

КВАЛИФИКАЦИЯ ПОЛЬЗОВАТЕЛЕЙ

Для того, чтобы обеспечить ответственное использование психологических тестов и для повышения качества диагностических обследований, проводимых дома, в школах на работе и в общественных местах, контингент лиц, которым продаются Прогрессивные Матрицы и Словарные Шкалы Милл Хилл не ограничивается только психологами. Однако, как и во всех случаях, когда принимаемые решения затрагивают жизнь и карьеру отдельных людей, полученные при тестировании результаты должны быть должным образом обработаны и интерпретированы людьми, обладающими достаточной мудростью им опытом. (Ниже будут изложены причины, по которым мы придерживаемся данной политики, а краткое их обсуждение содержится в работе Равена (Raven, 1981)).

ПРЕДИСЛОВИЕ К ПОЛНОМУ РУКОВОДСТВУ

Чтобы облегчить процесс непрерывного обновления Руководства, оно публикуется в виде нескольких Разделов, которые можно заказывать как отдельно, так и в любом наборе.

Тем, кто использует только Матрицы, без Словарных Шкал, будет достаточно иметь в своем распоряжении Общий Раздел плюс Разделы 2, 3 и 4 Руководства.

Пользователям Словарных Шкал Милл Хилл и Крайтон будет нужно изучить Разделы 5А, 5В и 6 Руководства.

Третья Часть Руководства включает данные, полученные в ходе большого числа нормативных и психометрических исследований, объем и содержание которых выходит за полезный минимум такого рода данных, приведенный в основных разделах Руководства. Часть III состоит из Раздела 7 и ряда Исследовательских Приложений. Их содержание, также как и содержание остальных частей Руководства, постоянно меняется. Однако, вышедшее в 1995 году издание Раздела 7 содержит краткий обзор всех выявленных на конец 1994 года исследований, затрагивающих вопросы валидизации, надежности и популяционных норм, вместе со ссылками на литературные источники, упоминавшиеся во всех последних на то время Разделах и Приложениях к Руководству. Исследовательское Приложение № 1 включает полное описание ирландской 1972 года и британской 1979 года стандартизации Стандартных Прогрессивных Матриц и Словарных Шкал Милл Хилл. Исследовательское Приложение № 3 содержит детали американских и международных норм и обзор по использованию Матриц для нейропсихологической диагностики. Исследовательское Приложение № 4 содержит дополнительные данные о нормах, о надежности и валидности результатов, полученных в разных странах и в разных школьных округах США.

В 1995 году был издан также Указатель, призванный помочь пользователям в поиске интересующего их материала.

Количество исследований, проведенных с тестами ПМР и СШМХ, столь велико, что привести все ссылки на них в рамках настоящего Руководства не представляется целесообразным. Литературные источники, приведенные в Части III, ограничены теми ссылками, которые были приведены в том или другом из Разделов Руководства. Чтобы дополнить этот список, была составлена Исследовательская Библиография. Эта Исследовательская Библиография включает короткие резюме всех опубликованных исследований, где тесты ПМР или СШМХ были использованы для каких-то содержательных целей. Эти описания хранятся в базе данных, периодически распечатываются и распространяются в бумажной форме или на дисках. Получить Библиографию можно за плату у Джона Корта.

Пользователям может быть будет интересно узнать о той последовательности, которую проходят библиографические ссылки на статьи, прежде чем они начинают цитироваться в Руководстве. Прежде всего, они в виде резюме публикуются в Исследовательской Библиографии, Ссылки на те их них, которые прямо касаются надежности или валидности тестов или содержат нормативные данные, включаются в последующую публикацию Исследовательского Приложения. Самые существенные из работ начинают упоминаться в обновленной редакции соответствующего Раздела Руководства.

Разделы Руководства со 2 по 6 содержат и некоторые из первоначальных норм, которые были собраны в Великобритании ещё Дж.К.Равеном с коллегами. Но Руководство включает также и большое количество более современных данных, собранных в Великобритании, Австралии, Бразилии, Канаде, Китае, Чехословакии, Германии, Гонконге, Японии, Перу, Испании, Швейцарии и США. Кроме того, во многих других исследования сообщаются нормативные данные для специфических возрастных, этнических и профессиональных групп, которые также важны для решения частных вопросов. Таким образом, издание Раздела 7 1995 года дает краткое описание размеров выборок и принципов организации всех известных исследований, так что пользователи мог сами решать об их важности и потенциальной пригодности для их собственных нужд. Среди опубликованных норм включены и такие, которые использовали процедуру ограничения времени решения Стандартных Прогрессивных Матриц, хотя, как отмечается в Руководстве, обычно предпочитается процедура без ограничения времени.

Авторы настоящего Руководства продолжают обновлять его и сами тесты Равена в сотрудничестве с другими исследователями. Все интересующиеся психологи могут оказать помощь в этой деятельности если пошлют нам: (1) отчет о завершенной работе, лучше с резюме; (2) цели и задачи тех исследований, которые только проводятся в настоящее время, чтобы мы могли связать авторов этих исследований с другими исследователями, работающими над сходными проблемами; (3) неопубликованные материалы, которые могли бы быть полезны при составлении новых нормативных таблиц, отображающих результаты разных групп в разных странах, или при дальнейшей доработки самих тестов; (4) задумки будущих исследований и обследований, которые, по их мнению, необходимо провести.

Джин Равен выполнила основную работу по редактированию данного издания Основного Раздела и продолжает вести библиографический указатель. Кроме того, мы глубоко признательны Дирку Фросту, Марку Куку, Ролю Майерскауф и Роберту Мак-Генри за прочтение рукописи и сделанные ими замечания.

КРАТКАЯ ИНФОРМАЦИЯ О НАБОРЕ ТЕСТОВ, ИХ ИСПОЛЬЗОВАНИИ И ОБЩЕЙ СТРУКТУРЕ РУКОВОДСТВА

В прошлом, немало заблуждений было связано с нечетким общим представлением о всем наборе используемых тестов, о их взаимосвязях между собой, целях и практике их применения и их связях с разными Разделами Руководства. Поэтому был написан краткий путеводитель по Руководству, который распространяется и независимо от данного Раздела в форме отдельной листовки, В последующих Разделах использованные термины получат более широкое толкование.

ТЕРМИНОЛОГИЯ

Прогрессивные Матрицы Равена и Словарные тесты используются уже на протяжении более чем 50 лет. На протяжении этого времени данные тесты претерпели ряд видоизменений и были дополнены двумя новыми сериями, которые были разработаны для специальных целей, Вслед за Стандартными Прогрессивными Матрицами (1938) были разработаны Цветные Прогрессивные Матрицы (1947), расширяющие диапазон применимости теста за счет детей младшего возраста, пожилых и интеллектуально неполноценных людей. Чтобы иметь возможность диагносцировать и высшие проявления способностей, в 1941 году были сконструированы Продвинутые Прогрессивные Матрицы, которые начали понемногу использоваться только начиная с 1947 года. Поскольку принцип прогрессивного развития не всегда мог быть реализован теми пользователями, которые применяли только одну форму теста, то термин "Прогрессивные Матрицы" стал использоваться и без уточнения какой-либо одной из трех серий. Каждая из серий пересматривалась по несколько раз с применением анализа ответов на отдельные задания, чтобы расположить их в правильной последовательности и чтобы укоротить Продвинутую серию с 48 до 36 заданий.

Эти последовательные ревизии стали источником некоторой путаницы, когда ряд исследователей начал ссылаться на дату выпуска теста для его обозначения, например, "ПМ 1938" или "ПМ 47". Так, "ПМ 47" может относиться как к первой редакции Цветных Прогрессивных Матриц, так и к оригинальным Продвинутым сериям. Сходным образом, "ПМ 56" может относиться и к обновленной версии Стандартных серий, и к Цветным сериям.

Эти, а также другие, еще более своеобразные способы ссылок на тесты, привели нас к мысли предложить унификацию их наименований при использовании в научном обиходе.

Когда нет необходимости делать дополнительные уточнения, то о всём семействе тестов в целом следует говорить как о Прогрессивных Матрицах Равена (или ПМР).

Говоря о Цветных сериях, следует называть их Цветные Прогрессивные Матрицы (или ЦПМ).

Стандартные серии следует называть Стандартными Прогрессивными Матрицами (или СПМ).

О Продвинутых сериях нужно говорить как о Продвинутых Прогрессивных Матрицах (или ППМ). Серии I и II Продвинутых Прогрессивных Матриц должны называться ППМ I и ППМ И.

Различные разновидности Словарных Шкал Милл Хилл также не имеют общепринятой номенклатуры названий. Имеются девять или десять (если учитывать и варианты с машинной обработкой результатов) версий словарного теста Равена. Каждый из них пересматривался несколько раз, а недавно был предложен и их американский вариант.

Базовая форма этого теста состоит из 88 слов в формате с незаконченными предложениями. Она известна как вариант Определения, или Открытые Вопросы из теста "Словарная Шкала Милл Хилл" (СШМХ).

Наиболее широко распространены версии теста, полученные на основе формы Определения. Каждая из них содержит половину слов в формате открытых вопросов, а другую половину - в формате закрытых вопросов. Существуют разновидности теста, названные формами для Младшего возраста и формами для Старшего возраста. В этом формате созданы четыре теста; Младший 1, Младший 2, Старший 1 и Старший 2. Исследователи должны не только указывать форму используемого теста, но и дату его редакции, и страну редакции (Великобритания или США).

Все версии теста с закрытыми вопросами были разработаны для американского рынка и, в комплекте с бланками для легкой оценки результатов, используются в Великобритании совместно с Профессиональной версией ППМ. Версия для машинной обработки также имеет формат закрытых вопросов.

Словарная Шкапа Крайтон (СШК) создана для использования вместе с ЦПМ и связана с СШМХ теми же отношениями, что и ЦПМ с СПМ. Удалены более трудные слова, а несколько более легких и однозначно трактуемых слов - добавлены. И здесь исследователи должны указывать дату и страну используемой редакции теста.

Укороченная форма СШМХ сконструирована таким образом, что включает каждое пятое слово из исходной формы теста Определения. Испытуемых просят не только определить слово, но и привести пример его использования в предложении. Этот тест предназначен для изучения вербальных дисфункций и его следует называть СШМХ (Укороченная форма).

ПРЕДИСЛОВИЕ К ИЗДАНИЮ 1995 ГОДА

Чтобы помочь читателю сориентироваться в изложенном ниже материале, мы предлагаем здесь краткое изложение содержания Общего Раздела настоящего Руководства.

Сначала дается обзор теоретических основ тестов Равена "Прогрессивные Матрицы" и "Словарные Шкалы". Эти тесты были разработаны для исследовательской работы в области генетических и средовых причин психических нарушений. Они были предназначены для измерения двух компонентов выделенного Спирманом (Spearman) фактора g, а именно, продуктивную и репродуктивную способности. Продуктивная способность включает способность к осмысленному разрешению противоречий; способность изобретать невербальные по своей природе конструкты, помогающие найти решение в сложных ситуациях. Репродуктивная способность включает знакомство с сохраняемыми в культуре эксплицитными, вербализованными знаниями.

Последующие разделы описывают взаимосвязи между продуктивной и репродуктивной способностями, фактором g, общим интеллектом и общей способностью. Это делается по двум причинам. Во-первых, потому что Прогрессивные Матрицы Равена широко использовались для некорректного практического применения и интерпретации как инструмент для измерения "способности", тогда как на самом деле люди со сходными оценками продуктивной или репродуктивной способности могут существенно отличаться между собой по другим своим способностям. Во-вторых, потому, что тестовые измерения - и продуктивная способность в частности - часто совершенно неправильно используются в исследовательской работе. Излишняя обобщенность тестовых оценок приводила ко множеству несправедливостей в практике образовательного, социального и профессионального отбора. Основной причиной необоснованных выводов, сделанных по результатам проведенных исследований, является недопонимание того факта, что продуктивная способность включает целый набор разных перцептивных и познавательных психических процессов, надстраивающихся один над другим и включающих как аффективные, так и волевые компоненты. Строго говоря, продуктивная способность не является полноценным эквивалентом ни для "общей когнитивной способности", ни для "способности к решению задач".

Далее изложение касается вопросов оценки тех аспектов окружающей среды, которые влияют на продуктивную и репродуктивную способности. Выясняется, что гораздо больше известно о переменных, влияющих на продуктивную способность, и мало что - о подобного рода влияниях на репродуктивную способность. Было обнаружено удивительно большое увеличение оценок продуктивной (но не репродуктивной) способности у испытуемых одного и того же возраста на протяжении последних 50 лет. Ранее даже не подозревали, что на продуктивную способность оказывают влияние такие факторы как, с одной стороны, качество питания и гигиены и, с другой - более демократическое содержание детей дома и в школе. В процессе рассмотрения этих данных становится ясно, что то, что ранее понималось как снижение продуктивной способности с возрастом испытуемого, правильнее представить как ее увеличение вместе со смещением даты рождения.

Эти результаты имеют огромное теоретическое и практическое значение. Они показывают, что получаемые оценки испытывают определенные влияния, что этнические и другие различия в средних оценках могут, в принципе, и изменяться (но не за счет каких-то новомодных или рядовых процессов), и что при практическом использовании теста нужно сопоставлять получаемые результаты с самыми современными нормами, подходящими для данного исследования по цели, социально-экономическому и этническому составу обследуемой группы. Они также лишают достоверности выводы многих исследований и смещают аргументы с технических вопросов конструирования теста на аргументы, относящиеся к сфере социальной и образовательной политики.

Поскольку приведенные ранее данные показывают необходимость рассматривать оценки ПМР и СШМХ в контексте (i) более широкой информации о способностях тестируемых людей и (ii) обсуждения возможных достоинств и недостатков альтернативной образовательной, социальной и профессиональной политики, излагаемый далее материал более подробно освещает вопросы тестирования и места психолога в обществе. Высказываются аргументы в пользу того, чтобы, с одной стороны, психологические тесты были более доступны для родителей, учителей и менеджеров, предоставляя им инструментарий для более углубленного понимания талантов их детей, учеников и подчиненных, и, с другой стороны, чтобы психологи настаивали на больших инвестициях в научно-исследовательские разработки, необходимые для повышения эффективности диагностики, и чтобы они значительно лучше готовились к борьбе с политикой применения их работ в образовательной и социальной сферах.

Далее рассматриваются вопросы идентификации дополнительной информации, нужной для представления полученных диагностических результатов и развивающих программ, и дается обзор применения тестов в обучении, в клинике и в профессиональной сфере. Показано, что для получения объективной оценки нужно рассматривать результаты по ПМР и СШМХ в более широком информационном контексте, доступ к которому бывает достаточно труден и который, вероятно, включает в себя как новые представления о человеческих способностях, так и новую психометрическую модель. Доказывается упрощенность традиционных моделей валидизации и применения теста. Реальная сложность окружающего мира требует от психологов, работающих в этих областях, дальнейших напряженных усилий для уяснения своей новой роли. Обсуждается природа и содержание данных, необходимых для проведения более глубокой и полезной практической диагностической работы в образовании, в клинике и в сфере профессиональной деятельности.

После этого общего теоретического введения изложение смещается на обсуждение более частных вопросов, касающихся различных форм ПМР и СШМХ, методов их конструирования, важности "проблемного поля" при выборе "правильного" ответа, роли циклической последовательности предъявления, использованной формы анализа отдельных заданий теста и способов ее применения для создания "одномерной" тестовой шкалы. Содержится призыв, чтобы пользователи проявляли осторожность при выборе той формы теста, которая наиболее подходит для решения стоящих перед ними задач.

Во избежании ненужных затруднений при пользовании ранее опубликованными оглавлениями и для разгрузки основного раздела текста, обзор недавно опубликованных работ, поддерживающих теоретический подход и практическое применения ПМР, включен в Приложение к изданию 1995 года.

Теоретические основы тестов Равена "Прогрессивные Матрицы" и "Словарные Шкалы"

Спирман (Spearman 1923, 1927) был первый кто отметил, что результаты тестирования таких учебных способностей как, например, способности к арифметике, чтению и правописанию, обнаруживают тенденцию к взаимной корреляции на уровне от 0.7 до 0.8. Это подтверждают и современные данные, приведенные в Таблице ИПЗ ВАЛ1 в Исследовательском Приложении № 3. Спирман сделал вывод, что такие корреляции можно объяснить наличием в основе умственных способностей некоего единого, или общего "фактора д" и предположил, что различные тесты в разной степени апеллируют к этой базовой способности.

Тесты Равена Прогрессивные Матрицы и Словарные Шкалы были разработаны как инструменты для максимально простой и непротиворечивой оценки двух составляющих фактора д, обозначенных Спирманом как продуктивная способность и репродуктивная способность.

Продуктивная умственная деятельность включает в себя разрешение сомнений, формирование нового видения проблемы, выход за пределы имеющихся данных с целью увидеть скрытое или неочевидное, формирование (чаще в невербальной форме) понятийных конструктов, облегчающих осмысление сложных проблем со многими взаимозависимыми переменными. Именно эти способности необходимы детям при усвоении ими в форме "чувства языка" множества неписаных языковых правил, или менеджерам международного класса в процессе принятия ими того или иного решения.

Репродуктивная умственная деятельность включает заучивание, воспоминание и воспроизведение преимущественно вербального материала, представляющего собой культурный запас эксплицитного, зафиксированного в языковой форме, знания.

Тесты Равена Прогрессивные Матрицы и Словарные Шкалы были разработаны с перспективой на изучение вклада генетических и средовых факторов в природу этих двух способностей, а также их личностных и социальных последствий.

Написав в 1927 году, что:

"Понимание особой природы процессов выведения и воспроизведения знания - в их резком контрасте, в их повсеместном взаимодействии, в их генетической взаимосвязи -означало бы, что психология индивидуальных способностей начинает обретать азы мудрости", Спирман пришел к выводу, что природа, происхождение и проявление этих двух способностей имеют очень существенные различия. Ни одна из них не является "кристаллизованной" формой другой, но они действительно тесно взаимодействуют, поскольку и восприятие и мышление в общем зависят от сформированных конструктов, да и способность оперировать информацией часто зависит от способности найти смысл в противоречивой части рассуждения.

Разрабатывая тесты, которые были бы полезным инструментом для идентификации генетических и средовых причин интеллектуальных отклонений, Дж.К.Равен (J.С.Raven, 1936) сознательно ставил перед собой задачу создания таких тестов, которые были бы теоретически обоснованы, однозначно интерпретируемы, просты для проведения и обработки, пригодны как для лабораторных, так и для полевых экспериментов, а также удобны для массовых обследований, проводимых на дому, в школах, на производстве и сопряженных с временными ограничениями .

УТОЧНЕНИЕ ОСНОВНЫХ ПОНЯТИЙ

Бесконечная путаница возникает из-за близости и взаимной подмены таких терминов как "Фактор д", "Продуктивная Способность", "Репродуктивная Способность", "Общие Способности", "Общий Интеллект", "Интеллект" и "Способность Решать Задачи". Ошибочное понимание взаимосвязей между этими основными понятиями ведет к неадекватному применению и ошибочной интерпретации тестов. На последующих страницах мы намереваемся прояснить эти взаимосвязи, а также обсудить степень обоснованности тех заключений, которые могут быть сделаны по результатам анализа тестовых данных.

Общие способности

Для начала следует указать, что подмеченная Спирманом высокая корреляция между теми способностями, которые первоначально рассматривались как различные, обычно значительно снижается при выходе за пределы традиционной "учебной" области или даже при перемещении в другую академическую сферу. Хотя мы не имеем возможности сослаться здесь на конкретные цифры (поскольку нет хороших измерительных процедур для таких качеств, как инициатива, лидерство, способность к эффективной коммуникации, способность успокаивать и ободрять других — для их оценки потребовалась бы новая психометрическая модель), но анализ индивидуальных случаев, наблюдений и некоторых исследований, проведенных на дому, в школах или на производстве, предполагает, что такая корреляция будет порядка 0.2. (Многие индивидуальные случаи рассмотрены в обзоре Равена 1984 года (Raven, 1984, также см. Taylor, 1976; Guilford, 1977; Hatch and Gardner, 1990; Raven, 1977; Raven, Johnstone and Varley, 1985). Такая слабая корреляция означает, что 96% разброса переменных не перекрывается, и что люди, получившие низкий результат в одних областях, имеют хороший шанс получить высокие оценки в других. Более того, хотя тесты Общего Интеллекта и Фактора g имеют прогностическую валидность около 0.7 в рамках так называемой "учебной" сферы, их прогностическая валидность в области профессиональных достижений не превышает, в целом, 0.3 (Cook, 1988; Hunter and Hunter, 1984), объясняя, таким образом, только около 10% дисперсии1. Эти данные наводят на мысль, что в то время как "Фактор g" действительно является очень полезным конструктом для оценки одной важной, хотя и ограниченной области человеческих способностей, популярное понятие "Общие Способности" - в сочетании с понятием "Умственного Возраста", являющимся центральным для коэффициента интеллектуальности (IQ), а также разнообразные образовательные технологии и технологии отбора кадров, которые ассоциируются со "Способностями", "Умственным возрастом" и IQ - не имеют достаточной объяснительной силы и не стоят того внимания, которое уделяют им многие психологи, менеджеры, педагоги и теоретики от образования.

Продуктивная и репродуктивная способности

Продуктивная способность

Продуцирование знания - это процесс выведения, или извлечения новых инсайтов и новой информации из того, что уже было воспринято или известно.

Для выделения любой проблемы необходимо увидеть ее в определенном контексте. Человек всегда изначально настраивается на поиск определенного "гештальта", на целостное восприятие предъявленной информации. Таким образом, он изначально обладает схемой, которая "предоставляет ему возможность одновременно держать в голове несколько вещей". Именно по этой причине не совсем верно было бы утверждение, что ПМР измеряют только способность держать в уме несколько вещей одновременно.

Значимость мгновенного целостного понимания как основы для дальнейшей деятельности показана не только в отношении визуального материала. Спирман отметил, к примеру, что

1 Хотя анализ генерализации валидности, который корректирует данные с учетом ненадежности критерия, позволяет пересмотреть эту цифру и повысить ее до 0.5, необходимость применения этого значения корреляции не достаточно обоснована, и даже корреляция 0.5 объясняет только 25% дисперсии. непосредственное воспроизведение прочитанного отрывка является скорее сжатым осознанием его сути, нежели воспоминанием любой из его частей. Если содержание прочитанного вызывает особый интерес, то может возникнуть чувство его генерализации и выхода за пределы актуального контекста.

В своих исследованиях природы ошибок, где Матрицы Равена применялись в сочетании с "кубиками Кооса" и "Стик Тестом" (Stick test) Гольдштейна и Ширера, Мэстре (Maistriaux, 1959) пришел к похожим выводам: большинство исходных ошибок - если они не корректировались при помощи обратной связи - вызвано неспособностью сосредоточится на решаемой проблеме и доминированием сиюминутных впечатлений. Позднее появляются ошибки, связанные с неспособностью анализировать и, еще позже, синтезировать, полученную в результате анализа информацию. И только затем возникают ошибки, обусловленные нежеланием сделать усилия, необходимые для предварительного, ещё до начала каких-либо реальных действий, анализа и мысленного переструктурирования материала. Многие люди не готовы к этому, предпочитая манипулировать фрагментами задания только на основе впечатления о целом или сумме частей. При дальнейшем изложении мы будем постоянно возвращаться с вопросу о важности как ценностных, так и волевых (усилие, упорство) компонентов при осуществлении • мыслительной реконструкции наглядной ситуации.

Придя к решению, что представляет собой объект, на который он смотрит, человек переходит к анализу ситуации. Этот анализ может привести его к выделению проблемы, в нашем случае — это пространство внутри Матрицы, которое должно быть заполнено. Если люди не склонны действовать аналитически, они предпочитают заполнять пустое пространство путем репродукции целого, а не выбирать фрагмент для дополнения матрицы. Другими словами, их задача ограничивается конструированием целого, его опознанием. Из этого следует, таким образом, что опознание " проблемного целого" является существенной предпосылкой аналитической деятельности.

/ Чтобы анализировать, субъект должен быть способен воспринять больше, чем полный

Гештальт. Он должен иметь гипотезы (возможно невербальные) относительно того, на какие части целого важно обращать внимание. Анализ не предполагает случайного поиска путем проб и ошибок. Он означает изучение потенциальных взаимосвязей, существование которых предполагается на основе определенного понимания целого. Необходимо иметь также символические представления о линиях, кругах, квадратах и треугольниках. Как мы убедимся далее, это не значит, что обязательно нужно знать слова для их описания. Способность воспринимать эти фигуры базируется на приобретенном опыте и культурном научении. Большинство же членов обществ с высоким уровнем грамотности имеют богатый опыт обращения с линиями, овалами и подобными фигурами, приобретенный при разглядывании печатных материалов. Поэтому различия в результатах их деятельности должны быть отнесены за счет других факторов.

Матрицы измеряют способность выявлять взаимосвязи. Это потому, что сами "переменные", взаимосвязи между которыми выделяются, не очевидны. Необходимым условием опознания переменных является выделение взаимосвязи. В "гудении", "жужжании" и путанице исходных сенсорных данных нужно увидеть или извлечь множество переменных и взаимосвязей между ними. Это то, что Спирман имел в виду когда сказал, что восприятие переменной мгновенно влечет за собой знание взаимосвязи и наоборот.

Эти наблюдения объясняют внутреннюю связь восприятия с символическим мышлением. Они также объясняют, почему в отдельных задачах на Матрицы единственный неправильный ответ, выбранный значительным числом людей, является при ближайшем рассмотрении правильной фигурой неправильного размера. Эта ошибки не могут быть прощены в силу "простой невнимательности", поскольку в этом случае Характеристические Кривые (см. далее) для этих заданий пересекли бы прочие. Напротив, пункты, в которых допущены ошибки такого рода, правомерно занимают свое место на шкале. Это указывает на важность точного восприятия целого и внимания к деталям, а также опровергает тех, кто уверяет, что исходный "Гештальт" матриц дает испытуемому ложную установку. Без Гештальта, без восприятия целого, испытуемый не смог бы ничего увидеть, а уж тем более проанализировать. Далее, символические ассоциации, служащие фундаментом восприятия, более важны, чем сырые сенсорные данные. Нас же больше интересует не умение видеть сходства и различия, а способность к выявлению конструктов, которые обеспечивают возможность такого видения.

Заявления, что Матрицы измеряют способность удерживать в голове одновременно несколько переменных, дают неверную ориентировку. Это можно проиллюстрировать работами Якобса и Вандевентера (Jacobs and Vandeventer, 1968; 1972), которые опубликовали один из лучших на сегодняшний день анализ процессов концептуализации, используемых для решения задач. Среди прочих их выводов высказывается предположение, что решение более трудных заданий требует большего числа одновременных умственных действий. К сожалению, набор тестовых заданий, построенных на этих принципах, не поддается шкальному упорядочиванию (в терминах Item Response Theory (IRT) - Теории Выбора Ответов). Хорнке (Hornke, 1984) также установил, что трудность отдельных заданий нельзя предсказать исходя из правил их построения, С другой стороны, как показано в Приложении, помещенном в конце данного раздела Руководства, Фодегель-Матцен (Vodegel-Matzen) удалось, используя концептуальную схему Карпернтера и др. (Carpenter, Just and Shell, 1990), сконструировать набор заданий, трудность которых можно было предсказать на основе этих правил. Она также обнаружила, что те испытуемые, которые получили более высокие оценки, тратили больше времени на рассматривание матриц перед принятием решения. Это наводит на предположение, что лучшие из выполнявших тест способны удерживать в краткосрочной памяти больше информации. Впрочем, возможно они просто затрачивают больше усилий при решении заданий теста.

Более точная формулировка гласит, что Матрицы измеряют способность формировать конструкты высокого уровня, которые облегчают осмысление сложных ситуаций или событий. Суть этого утверждения можно проиллюстрировать исследованиями Пиаже по сохранению объема: это не "способность удерживать в голове одновременно параметры длины, высоты и ширины", по которым можно вычислить объем, а собственно понятие объема. Это самостоятельное целостное понятие позволяет объединить три размерности, а также позволяет, при необходимости, провести разложение по данным трем размерностям.

Продуктивная деятельность требует, чтобы перцептивные процессы носили скорее активный, нежели аналитический или репродуктивный характер. Это включает проблематизацию - обнаружение неясностей в знакомом - а также решение задачи и получение удовлетворения от того, что определенное решение согласуется со всеми данными, доступными на текущий момент.

Такие процессы часто носят невербальный характер, завися от вспышек внезапного озарения, слишком быстрых для фиксации в языковых единицах. Хорошей иллюстрацией этому может служить работа Бродбента и Эстона (Broadbent and Aston, 1978), которые обнаружили, что способность управлять компьютерной имитационной моделью британской экономики не связана со способностью отвечать на вопросы о ней, сформулированные в языковой форме. Они показали, что хотя вербальная логика не способна предоставить средства обращения с системами, в которой так много сложных, взаимодействующих и охваченных обратными связями контуров, некоторые люди все-таки научаются управлять ими. Коле (Coles, 1986) также показал, что люди обычно не способны вербализовать логику сложных моральных правил, которыми они руководствуются в своем поведении.

Репродуктивная способность

Как мы уже видели, Прогрессивные Матрицы были сконструированы прежде всего для измерения продуктивной способности, а сам способ измерения хотя и зависит существенно от овладения символами и конструктами, позволяет получать такие результаты, которые максимально малочувствительны к межличностным и групповым различиям в степени знакомства с культурно-специфическими символами.

Напротив, Словарная Шкала Милл Хилл была разработана для выявления различий людей в знании и способности воспроизведения культурного запаса вербальных понятий. Успешность решения многих задач, особенно тех, которые включены в учебные экзамены, зависит от знания этого набора идей и легкости обращения с ними. Следует, однако, проявлять осторожность и различать между способностью понимать идею и способностью к ее передаче. Продуктивная способность позволяет нам сформировать понимание. Для перевода этого понимания в слова необходима легкость вербализации.

Дальнейшее развитие идеи о существовании продуктивной и репродуктивной способностей

Хотя приведенные до сих пор данные подтверждают истинность выводов Спирмана, основная полемика развернулась вокруг факторно-аналитической модели, которая наилучшим образом подходит для описанного паттерна корреляций между тестами, и относительно того, существует ли общий фактор, определяющий умственные способности, как альтернатива идее накопления шаблонов, адекватных решению задач определенных типов. В частности, Перкинс и Саломан (Perkins and Saloman, 1989) опубликовали обширный обзор из которого следует, что действительно существует такой общий фактор для способности к рассуждению. Кроме того, было проведено множество исследований где предпринимались попытки связать "фактор д" с "ментальной скоростью" или "энергией" (см. обзор Kranzler and Jensen, 1989). Приложение, сум­мирующее исследования последних лет в этой области, включено в Руководство издания 1995 года.

Значительно меньше попыток было предпринято для проверки утверждения Спирмана и доказательства различной природы продуктивной и репродуктивной способностей. Одно из не­многих исследований в этой области уже было упомянуто (Broadbent and Aston, 1978). В этой работе Бродбент и Эстон утверждали, что вербальная логика способна одновременно опериро­вать только с двумя наборами понятий и не может решать сложные проблемы, включающие множество взаимодействующих переменных и реципрокных связей. Они стремились показать, что способность отвечать на вербальные вопросы касающиеся сложных систем не связана со способностью управлять такими системами. Хотя вербальное инструктирование могло обеспе­чить определенный эффект, оно вовсе не обязательно развивало способность управлять таки­ми системами. Эти результаты идут в одном русле с заключениям о роли языка при решении за­дач ПМР и относительно влияния языковых инструкций.

Ограничения, связанные с применением Матриц

Продуктивная деятельность сопряжена с преодолением трудностей и требует определенных усилий. Но люди, в целом, не склонны развивать, совершенствовать и демон­стрировать свои способности за исключением тех случаев, когда деятельность, в которую они вовлечены, является для них значимой. Следовательно, чтобы достаточно надежно оценить вы­сшие проявления продуктивной способности, необходимо разработать такие измерительные процедуры, с помощью которых ее можно будет идентифицировать непосредственно в процес­се выполнения людьми значимых для них задач, В этом пункте можно согласиться со Стерн-бергом (Sternberg, 1985, 1986), подчеркивающим существование разных "типов" интеллекта. К сожаление, работа Стернберга:

а) не предлагает концептуальных подходов к пониманию психологической природы познавате­льной деятельности. Мы утверждаем, что она неизменна, несмотря на разнообразие прояв­лений в процессе достижения разных целей;

б) признает только академический, практический и социальный интеллект, тогда как мы предпо-

лагаем, что существует множество различных видов деятельности, которые могут быть зна­чимы для людей и для успешной реализации которых люди могут применять свои продуктив­ные и репродуктивные способности;

в) имеет дело преимущественно с репродуктивной, нежели продуктивной способностью. Чтобы

исследовать поведение, нацеленное на открытие причинных связей или закономерностей, необходимо найти пути оценки именно тех процессов, которые нужны для порождения зна­ний в данных конкретных областях;

г) не было предложено средств распознания высших уровней невербальной продуктивной

способности, которая вносит существенный вклад в выполнение квалифицированной практической деятельности.

Эти комментарии не являются критикой работы Стернберга, которую мы рассматриваем как шаг в верном направлении; они лишь указывают на потенциальные области для будущих ис­следований. Без таких исследований, нужных для преодоления ограниченности сферы применения Матриц, на основании тестовых данных будут и дальше делаться ошибочные за­ключения.

Продуктивная способность и "Фактор g"

Мы уже отметили, что продуктивная способность концептуально отлична от фактора д. Хотя последний термин используется более широко, похоже, он менее полезен. Представ­ляемый как общий элемент, задействованный во "всех" тестах, он предстает в обличье важного свойства, независимо от того, восхваляют его или критикуют. Использование этого термина при­вело даже некоторых людей к утверждению, что поскольку тесты с высокими нагрузками на этот фактор обнаруживают сильную взаимную корреляцию, то они просто измеряют "одно и то же" и, следовательно, являются взаимозаменяемыми. Насколько ложно такое утверждение легко ви­деть на примере: вес и рост коррелируют между собой не в меньшей степени, чем учебные спо­собности, но очевидно, что рост и вес не являются "одним и тем же". Наконец, приписывание слишком большой объяснительной силы терминам "фактор g" или "общие способности" обус­ловлено ещё и тем, что слишком большое число людей интуитивно считает достаточным, если их приятелей можно расклассифицировать на "умных/смышленых" или "глупых/тупых". Соответ­ственно, термин "продуктивная способность" дает впечатление о более ограниченной сфере применения.

Продуктивная способность и "Интеллект"

Сам по себе тест Прогрессивных Матриц никогда не предназначался для измерения "фактора g", а тем более "Общего Интеллекта". Тем не менее, как показано в исследованиях, суммированных в следующих Разделах настоящего Руководства, факторно-аналитические ис­следования вновь и вновь демонстрируют, что Прогрессивные Матрицы - одна из лучших из доступных одиночных методик для измерения g.

Последнее утверждение может, однако, служить источником серьезных ошибок в интерп­ретации, отчасти потому, что "фактор д" часто понимается как синоним общих академических способностей. Но "академические" способности операционально определяются при помощи тес­тов, которые оценивают скорее способность воспроизводить фактическую информацию, нежели тестов, оценивающих такие вещи как критическое мышление, способность формировать сужде­ния, а также стремление и способность искать и подбирать доказательства. Для оценки "акаде­мических" способностей в более узком смысле наивысшую прогностическую валидность имеет Словарная Шкала - тест, оценивающий репродуктивные способности. То же вывод может быть сделан и на основании работ, где проводили корреляцию между Матрицами и Словарными Шкалами, с одной стороны, и полномерными тестами "Интеллекта" -с другой. Корреляции с ПМР достигали значений в диапазоне от 0.6 до 0.8, тогда как со СШМХ -от 0.8 до 0.95. Это позволяет предположить, что полные тесты "Интеллекта" измеряют преиму­щественно репродуктивную способность. Коэффициенты корреляции между показателями СШМХ и ПМР внутри возрастных групп достигали значений 0.5 - 0.6.

Эти результаты имеют серьезное практическое значение. Во-первых они показывают, что люди, способные генерировать и проверять новые творческие идеи, инсайты, часто испытывают трудности при переводе своих открытий в словесную форму. Таким образом, коллективная ра­бота не является единственным условием для достижения "прорывов" в понимании, поскольку критерии, используемые для продвижения ученых по академической лестнице, недостаточно ориентированы на продвижение именно тех, кто лучше других способен генерировать новые идеи. Во-вторых, наша система образования в целом недостаточно делает для поощрения и продвижения тех, кто наиболее способен генерировать новые идеи и осознавать суть происходящих социальных процессов. Если Прогрессивные Матрицы используются, как это часто делается, для отбора учащихся на образовательные программы для "одаренных", то отобранные в итоге студенты не обязательно покажут блестящие результаты, если эти програм­мы будут придерживаться традиционных учебных установок. Для воспитания и развития в уча­щихся таких способностей потребуется определенного рода "многопрофильная" программа раз­вития талантов. Наконец, такие результаты означают, что поскольку (как заметил Спирман) даже различные виды когнитивных способностей не очень сильно коррелируют между собой, то более корректное исследование сможет, вероятно, обнаружить широкий диапазон ранее не рас­познанных оригинальных талантов.

Общий Интеллект и Фактор g

Спирман никогда не подразумевал, что фактор g включает в себя все способности, необ­ходимые для интеллектуальной деятельности, и тем более не предполагал, что термины g или "Интеллект" могут быть использованы вместо термина "способности", или наоборот. Общий Ин­теллект с действительно требует способности понимать смысл новых ситуаций и способности вспоминать релевантную информацию, но он также нуждается в таких качествах как формирование суждений и хранение достаточного количества специальной информации. Для практических целей понятие Общего Интеллекта, наполненное весьма разнородными система­ми знаний, мотивационными диспозициями и способностями, не представляется особенно по­лезным. Разные люди решают поставленные перед ними задачи различными способами, поэто­му интегральный индекс их способностей не дает каких-то особо ценных знаний, пригодных для v* практического использования. Мы скорее должны задаться вопросом; "В какие виды деятельно­сти люди склонны спонтанно включаться и какие компоненты компетентности - включая продуктивную способность - они демонстрируют в процессе выполнения этих деятельностей?"

Продуктивная способность и Способность к Решению Задач

Мы уже убедились, что продуктивная способность включает в себя значительно больше, чем просто способность к решению задач. Эффективная познавательная деятельность требует идентификации проблемы, переформулирования всего проблемного поля {а не только самой задачи), а также мониторинг пробных решений с точки зрения соответствия их всей имеющейся информации. Вопреки этому, существует значительное число программ, ставящих своей целью обучение студентов "стратегиям" решения Матриц для улучшения их "способности к решению задач" (или даже развития "интеллекта" или "фактора g"). ПМР иногда используют также в качестве зависимой переменной для оценки эффективности других программ, направленных на развитие "способности к решению задач". К сожалению, за исключение работы Фоерштайна (Feuerstein), многие из этих работ были начаты при отсутствии адекватного понимания природы продуктивной способности, а особенно ее связей с восприятием и концептуализацией. Даже ра- бота Фоерштайна в области исследований развития продуктивной способности страдает недо­статочной обоснованностью.

Постановка проблемы и ее решение - это трудная деятельность, требующая постоянного контроля. Она включает в себя такие вещи, как внезапные пробуждения по ночам с вопросом о беспокоящих тебя смутных чувствах на задворках сознания и последующие попытки перевести их в центр внимания, чтобы определить их причины и следствия. Она включает использование этих неясных ощущений для инициации основанного на интуиции процесса "экспериментально­го взаимодействия со средой", или "переговоров с проблемой" для получения дополнительной информации о природе проблемной ситуации. Она включает в себя использование переживаний, возникающих при первоначальных попытках разобраться в проблеме, чтобы видоизменить само понимания ситуации и применяемых для решения стратегий. Необходимо использовать отточенные навыки контроля внимания, а также те навыки и схемы мыслительной деятельности, которые позволяют быстро "проскакивать" стандартные варианты действий в кон­кретных обстоятельствах. Деятельность по решению проблем включает также обеспечение доступа и использование уникальной информации, получаемой непосредственно от других специалистов. Наконец, она включает в себя и экстраординарные обязательность, упорство и настойчивость.

Ясно, что никто не включится в такие нагрузочные и самомотивированные виды деятельности, а тем более не будет их совершенствовать и развивать, если не будет высоко це­нить задачу, над решением которой работает. Именно необходимость затрачивать усилия при решении задач привела Спирмана и других исследователей к связи "фактора д" с "ментальной энергией", а в работе Мэстрё" этот факт определяет общую основу как энергетических, так и цен­ностных компонент и коррелят. Важно также отметить, что, согласно нашим наблюдениям, ког­нитивная деятельность не является сугубо когнитивной, но в существенной степени опирается также на аффективный и волевой компоненты. Стоит приостановиться и задуматься над следу­ющим: должны ли мы при оценке когнитивной способности первым делом выявить виды деяте­льности, которые интересуют выполняющего их человека, и лишь после этого изучать когнитив­ное поведение, которое он демонстрирует в процессе реализации этих деятельностей. Весьма вероятно, что этом случае обнаружиться гораздо больше, чем принято думать, людей, вовлече­нных в процессе своей повседневной жизни в познавательно-творческие процессы высокого уровня.

Приведенные выше комментарии отнюдь не означают, как в этом стремятся убедить нас ряд авторов (Greeno, 1989; Braun, Collins and Dugurd, 1989 и другие), что решение задач требует использования разных когнитивных процессов для достижения различных целей. Медь ведь не становится чем-то иным, когда соединяется с другими химическими элементами, как бы различ­но не выглядели или не вели себя вещества, полученные в результате такого соединения. Смысл этих комментариев состоит в том, что если кто-то желает оценить "способность к реше­нию задач" (включая и способность к идентификации проблемной ситуации), то выполнить одно из двух:

а) либо следовать заложенной в ПМР стратегии и стремиться оценить базовые способности -например, способность использовать чувства, развертывать понятия, направлять и удержи­вать внимание, контролировать восприятие, проверять умозаключения, проявлять настойчи­вость - на материале решения такой задачи, которая принимается большинством людей;

б) либо использовать двустадийную процедуру, первая часть которой посвящена выявлению того, что именно является значимым для людей, а вторая - какие из процессов, нужных для обеспечения эффективного решения задач, они фактически используют в процессе реализа­ции данных видов деятельности.

До настоящего времени никто не попытался использовать второй подход, и более того -"просмотрели" даже саму возможность пойти таким путем. Два психолога - Пиаже и Мэстрё, бо­льше других сделавшие в этой области, исследовали процесс решения по отношению к состав-

ленному психологом набору заданий, а не в отношении деятельности, являющейся значимой для самих обследуемых. Мэстрё, однако, провел два выдающихся исследования, напрямую свя­занных с развернутым выше тезисом. Первое было посвящено детальному изучению стратегий, используемых людьми для решения Прогрессивных Матриц, Кубиков Коса и заданий Стик-теста (Stick Test) Гольдштейна-Ширера. Было установлено, что основной причиной совершаемых ис­пытуемыми ошибок было нежелание тратить умственную энергию на решение абстрактных задач. Во втором исследовании оценивалась взаимосвязь между тестовыми оценками по ПМР и субъективной ценностью интеллектуальной (в отличие от практической) деятельности. В результате использования метода табуляции выявилась на удивление высокая корреляция меж­ду оценками по ПМР и субъективной ценностью процесса осмышления и развития системы знаний о деятельностях, событиях и используемых средствах.

Продуктивная способность, Общий Интеллект, Общая Способность

и Компетентность

Как мы уже видели, понятия "Общая Способность" или "Интеллект" не обладают той объ­яснительной силой, которую им приписывают психологи, менеджеры или педагоги. ПМР и СШМХ в совокупности объясняют лишь 10% (сторонники генерализации валидности сказали бы 25%) всей вариативности профессиональных достижений. Задача поиска источников и оценива­ния 90% оставшейся дисперсии, даже если она определяется факторами среды, есть тема, с которой психологи обычно до сих пор не склонны были связываться.

Автор настоящего руководства исследовал природу высших форм компетентности (таких как лидерство, инициатива, способность эффективно организовать совместную деятельность людей и т.п..), развитие таких качеств в домашних условиях, в школах, на рабочих местах, воз­можные методы их оценки, а также их последствия для людей - носителей этих качеств, для организаций, в которых они работают, и для общества в целом (Raven, 1980, 1984, 1985, 1991).

Выяснилось, что все качества такого рода - как, например, способность к решению задач - могут быть определены как мотивационные диспозиции. Как таковые они являются ценност­ными образованиями и имеют сложную психологическую природу. Каждое из них требует приме­нения широкого диапазона компетентностей высокого уровня - склонности и способности пред­видеть будущие проблемы и находить пути их преодоления; эмоциональной сензитивности и эмоциональной регуляции; способности получать помощь от других людей; настойчивости и т.д. Дополняя и компенсируя друг друга, эти компоненты компетентности работают на обеспечение эффективного поведения. Если мы хотим найти способы их оценки, то первым делом необходи­мо создать ценностно-ориентированную, внутренне гетерогенную модель измерения.

Другой вывод, который необходимо сделать на основании данной работы, заключается в следующем: как показало наше обсуждение проблемы "решения задач" дальнейшие исследова­ния формирования знаний, решения задач и продуктивной способности должны проводится в рамках той же концепции фундаментальных ценностей. В дополнение к работам автора (Raven, 1977, 1982), целый ряд исследователей (Sigel, 1986; Miller, Kohn and Schooler, 1978, 1982; Maistriaux, 1959; Jaques, 1976; Tharp et al, 1984; Gallimore, 1985; McGillicuddyDeLisi, 1985; и дру­гие) ясно показали, что когнитивные способности и, особенно, когнитивное развитие неразрывно связаны с ценностями. Правильно понятая работа Стернберга и Гарднера (Sternberg, Gardner) подталкивает к тому же выводу. Дальнейшей задачей является принятие основанной на ценностях модели измерения и отказ от требования использовать ценностно-независимые, "объективные" методы.

Эта установка имеет и важное практическое применение в области реформы образова­ния, отбора управленческих кадров, процессов руководства, размещения и профессионального развития персонала, а также организации деятельности структур социального управления. Во всех этих областях повышенное внимание к репродуктивной способности должно быть смещено

11 не просто на развитие и использование продуктивной способности, но также и на все вышеупо­мянутые виды компетентности.

ПРОДУКТИВНАЯ И РЕПРОДУКТИВНАЯ СПОСОБНОСТЬ, НАСЛЕДСТВЕННОСТЬ И СРЕДА

Принято считать, что используя термины "интеллект" и "фактор g", психологи предполага­ют врожденность и неизменность этих характеристик. Действительно, такие допущения были включены в бертовское (Burt, 1957) определение "интеллекта" как "врожденной общей когнитив­ной способности". В противоположность этому, Дж,К.Рааен (J.С.Raven) ставил целью своего ис­следования выделение средовых, а так же генетических причин умственных отклонений. В сво­их работах (например, Raven, 1959) Дж.К.Равен настойчиво протестовал против введения допу­щения о врожденности в определение интеллекта. В качестве первостепенной он ставил перед собой задачу разработки тестов, которые были бы теоретически обоснованы и легко интерпре­тируемы, и оценки которых минимально зависели бы от различий в образовании и жизненном опыте среди представителей западного общества. Второй его задачей было использование этих тестов, чтобы попытаться выделить специфический вклад генетических и средовых источников вариативности тестовых оценок, особенно у людей, принадлежащих к сходным социо-экономи-ческим группам или у детей из одной и той же семьи. Дальнейшие разделы настоящего Руково­дства проиллюстрируют успешность такого подхода. Но прежде чем перейти к ним, имеет смысл обсудить важные, но непростые для понимания влияния среды на врожденные характе­ристики.

ВЛИЯНИЕ СРЕДЫ НА НАСЛЕДУЕМЫЕ ХАРАКТЕРИСТИКИ

Вероятно наиболее важным для понимания является тот факт, что степень выраженности врожденных качеств всегда может быть видоизменена под воздействием определенных факто­ров среды. Если, например, выращивать в различных условиях продукты скрещивания разных сортов пшеницы и измерять их высоту или урожайность, то ранговый порядок оценок будет меняться в зависимости от выбора критерия. Некоторые сорта будут проявлять себя "лучше" в одних условиях, другие - в иных. Более того, все сорта могут быть выше или ниже, более или менее урожайны в одних определенных условиях, нежели в иных. Даже корреляции между раз­мерами и урожайностью значимо варьируют в зависимости от условий среды. Очевидно, что среда оказывает существенное влияние как на индивидуальные переменные, так и на взаимосвязи между ними. Однако, многие различия между видами в одних и тех же условиях, а также характер изменчивости, проявляющейся в различных условиях среды, определяются фактором наследственности. Впрочем, наследственность не предполагает отсутствие изменчи­вости. Как это следует из вышеприведенной краткой иллюстрации, а также более подробного обсуждения того же вопроса Ангоффом (Angoff, 1988), когда дело касается характеристик чело­века не следует даже задаваться вопросом, играет ли среда существенную роль, а нужно ис­кать ответ на вопрос, какой из аспектов среды влияет на реализацию врожденных характерис­тик.

Важной практический вывод из настоящего обсуждения состоит в том, что тестовые пока­затели не могут не зависеть от влияния культуры. Существует потребность в тестовой методике, которая могла бы показывать больше, чем тот очевидный факт, что знания и умения людей зависят от опыта, приобретаемого ими дома, в школе, на рабочих местах и в обществен­ных организациях. Безусловно, способность оперировать с задачами, поставленными в Матри­цах, зависит от степени знакомства с точками, углами и линиями, а также от привычки проявлять настойчивость при осмыслении абстрактных конструкций. Практически каждый представитель общества с высоким уровнем грамотности приобретает опыт такого рода деятельности с такими

12 понятиями. Однако, хотя Дж.К.Равен был достаточно проницателен, чтобы анализировать тес­товые показатели ПМР с учетом ценностного контекста (см. Psychological Principles, 1966), ока­залось, что различия в субъективном отношении людей к работе с абстракциями сказывается на тестовых оценках даже больше, чем он предполагал. Напротив, их зависимость от других факторов, таких как уровень образования или домашняя обстановка, оказалась значительно ни­же, чем считалось ранее.

ВЛИЯНИЕ СРЕДЫ НА РЕЗУЛЬТАТЫ В ТЕСТАХ ПМР И СШМХ

Наилучшую иллюстрацию влияния среды на тестовые показатели ПМР дает работа Флин-на (Flynn, 1984, 1987), которая показала, что во многих частях света тестовые оценки (наряду с другими измерениями вербального и невербального мышления) повышаются примерно на одно стандартное отклонение за поколение. Отсюда следует, что, будучи оценены в соответствии с современными нормами, примерно 50% наших дедушек и бабушек в Америке получили бы реко­мендации о направлении в специальные учебные заведения для лиц с трудностями в обучении. Бувье (Bouvier, 1969), Торндайк (Thorndike, 1977) и Шайе {Shaie, 1983) показали, что многие дру­гие способности также развиваются, но не в той же степени. С другой стороны, репродуктивная способность, измеряемая Словарной Шкалой Милл Хилл и другими словарными тестами (как англоязычными, так и разработанными для других языковых культур), остается практически не­изменной, а словесная беглость постоянно и значимо падает. Такие различия в тенденциях под­держивают точку зрения Спирмана, что продуктивная и репродуктивная способности имеют раз­ные средовые и генетические корни.

Неудивительно, что полученные Флинном данные приводят его к постановке вопроса о конструктной валидности ПМР и других интеллектуальных тестов. Упрощая, его точка зрения звучит следующим образом: "наши предки не могли быть настолько глупы". Хотя его результаты и выводы сильно поколебали позиции приверженцев широкого использования тес­тов интеллекта, наиболее важный их эффект был связан с опровержением той чрезмерной объ­яснительной силы, которую многие психологи и представители общественности приписывали понятиям Общие Способности, Интеллект и Фактор g. Работа Флинна подтверждает достоверность того, что уже было сказано о (а) значимой, но не доминирующей, роли, которую играет продуктивная способность в творчестве, решении задач, а также в отношении широкого диапазона различных видов компетентности; и (6) наследственности и изменчивости продуктивной способности, репродуктивной способности и психологических характеристик в це­лом.

Обнаруженное Флинном повышение тестовых норм может быть отнесено только за счет действия средовых факторов. Но что это за факторы? Как утверждал Йенсен {Jensen, 1969, 1980), никто пока не представил убедительных доказательств, что какой-либо аспект процесса воспитания, обучения или материальных условий жизни сочетается с изменениями интеллекту­альных способностей, достигающими целого стандартного отклонения. Не достигали такого значительного успеха и попытки повысить интеллект при помощи специальных образователь­ных программ или лучших систем воспитания. Шпитц (Spitz, 1986) утверждает, что лишь сравни­тельно небольшое количество таких программ вообще достигло хоть какого-нибудь реального улучшения.

Приведенные далее в настоящем Руководстве данные показывают, что сходные тестовые нормы по ПМР имеют страны и сообщества с весьма различными образовательными системами, практикой дошкольного воспитания и доступностью телевидения, Отсюда следует, что отмеченное Флинном значительное повышение норм с течением времени не может быть объяснено за счет такого рода переменных. Прирост оценок по ПМР идет параллельно с увели­чением роста людей и их атлетических возможностей за тот же период. Изложенные в Исследо­вательском Приложении № 4 работы позволяют предположить, что вероятной причиной и того, и другого прироста является улучшение питания, здравоохранения и гигиены. Данные Бувье

13 (Bouvier, 1969) показывают, что именно показатели групп с низким социо-экономическим стату­сом выросли наиболее значимо.

Что данные Флинна показывают очень четко, так это возможность воздействия на такие общеизвестные и доказанные этнические различия (Shuey, 1966), которые некоторые люди - по­добно психологам и членам общественных организаций - полагают неизменными. Фактически, современные нормы для практически всех этнических групп Америки соответствуют британским нормам за период с 1938 по 1979 год. Эти результаты наглядно подчеркивают важность рассмотрения индивидуальных данных по ПМР или другим "Интеллектуальным Тестам" в кон­тексте информации о ценностях, мотивациях и компетентностях тестируемого субъекта.

Данные Флинна и других исследователей свидетельствуют, что вариативность тестовых оценок сохраняется стабильной или лишь незначительно изменяется со временем. Сегодня лю­ди отличаются друг от друга по своим способностям не в больше, чем 40 - 50 лет назад; увеличились лишь средние показатели. Это дает основание предположить, что факторы, кото­рые ответственны за повышение средних нормативных оценок, отличны от тех, которые влияют на вариативность внутри социо-экономических групп или внутрисемейную вариативность. Будь это одни и те же факторы, разброс оценок закономерно уменьшался бы. Другими словами, дан­ные Флинна не умаляют значения наследственности.

Данные Флинна подчеркивают необходимость использования современных норм. Исполь­зование устаревших норм влечет за собой серьезные ошибки в оценке индивидуальных показа­телей и порождает существенные просчеты в исследовании. К примеру, при оценке эффективности некой развивающей программы обнаруживается, что экспериментальная группа показала в ПМР результаты выше опубликованных норм, на основании чего делается вывод, что нововведение "работает". На самом же деле, правильное объяснение более скромно - экс­периментальная группа принадлежит к более молодой возрастной когорте, нежели та, которая использовалась при создании норм. Подобным же образом эти данные проясняют, что резуль­таты типа представленных на Рисунке 1, которые привлекались для демонстрации снижения продуктивной способности после 25-летнего возраста, фактически показывают рост полученных на взрослых тестовых оценок в соответствии с датой рождения. Из подобного рода результатов следует, что разработчики и издатели тестов должны поддерживать нормы на самом современ­ном уровне, а пользователи тестов - аккуратно проверять дату сбора нормативных данных, ко­торые они собираются использовать. Кроме того, пользователи тестов должны быть готовы к то­му, что им придется в будущем платить больше за тестовые материалы для покрытия расходов на более частое обновление норм.

Сделанный Флинном обзор подчеркивает также, что нужно воздерживаться от слишком частого редактирования или изменения тестов. Очень немногие тесты сохранились в том же самом виде, как они выглядели 50 или более лет назад {если, конечно, они еще находятся в упо­треблении), так что очень немногие тесты могут предоставить убедительное подтверждение то­го феномена, что с течением времени тестовые оценки значимо растут, а не остаются неизмен­ными или, тем более, не понижаются. Исследователи должны сопротивляться искушению экспе­риментировать с ПМР ради сиюминутных преимуществ, чтобы предоставить возможность како­му-нибудь последователю Флинна провести аналогичное сравнение где-нибудь в 2035 году.

Наконец, стоит отметить, что усталость, плохое самочувствие и стресс оказывают значи­тельный неблагоприятный эффект на скорость аккуратной работы (оценки теста ПМР с ограни­чением времени), несколько меньшее влияют на интеллектуальную продуктивность (оценки тес­та ПМР без ограничения времени) и, в наименьшей степени - на выполнение словарных тестон. В свою очередь, тренировка и практика оказывают максимальное положительное влияние на скорость аккуратной работы и минимальное - на вербальную способность. Хотя существуют об­стоятельства, в которых было бы важно оценить эффективность аккуратной работы людей в условиях ограничения времени, наиболее общепринятым требованием к тесту является оценка самой способности.

14 ПРОДУКТИВНАЯ СПОСОБНОСТЬ, ВОСПИТАНИЕ И ОБРАЗОВАНИЕ.

Многие исследования (например, Raven, 1980; Chan, 1981; Miller, Kohn and Scholter, 1985; McGillicudy-DeLisi et al, 1987; Sigel and Kelly, 1988) показали, что у детей развитие продуктивной способности протекает наиболее благоприятно, если родители вовлекают их в совместную мыс­лительную деятельность. Другими словами, родители, добивающиеся наибольшего эффекта, вместе со своими детьми пытаются найти смысл в сложных ситуациях, демонстрируют им способы использование эмоций или предчувствий для регуляции исследовательской деятельно­сти, привлекают детей к разрешению ценностных конфликтов и к учету долговременных соци­альных последствий своих действий. Все это приводит к тому, что родители передают детям со­бственное понимание механизмов работы общества и своей роли в нем. Дети, таким образом, получают представление о мыслительном процессе, который концептуален в своей основе и который связывает мысль и действие. Помимо всего прочего, такие родители более склонны \ также относиться к своим детям с уважением и понимать, что они должны заслужить (а не толь-/ ко требовать) уважение своих детей. Это заставляет их включиться в циклический процесс, в

I котором они открывают актуальную компетентность своих детей, получают дополнительный импульс чтобы поместить их в ситуации, требующие компетентности более высокого уровня, где дети получали бы возможность упражнять и развивать такого рода компетентности. Такие роди­тели более склонны читать своим детям истории, затрагивающие моральные проблемы, чтобы дети сопереживали различным персонажам и, таким образом, формировали собственную мора-

\ льную позицию. На важность такого чтения для формирования у детей моральных установок и умения рассуждать по аналогии настаивали в своих работах Jackson (1986) и Vitz (1990).

Равен (Raven, 1980, 1989) и Выготский (Vygotsky, 1956, 1981) обнаружили, что вышеопи­санное является частью более общего процесса, посредством которого добросовестные и чуткие родители создают среду для мотивов, зарождающихся талантов и проблем своих детей и таким образом способствуют развитию уникального для данного ребенка набора компетентно-стей высокого уровня. Как показал Пломин (Plomin, 1987, 1988), в этом как раз и состоит один из способов усиления средовых различий для детей внутри одной семьи, которые, накладываясь на вариативность врожденных характеристик, оказывают значительное влияние на их развитие. Как отметили Скарр и др. (Scarr et al, 1981), похожий результат получается, когда дети сами выбирают себе различные условия среды. Очевидно, что если мы хотим идентифицировать те генетические и средовые переменные, которые влияют на психическое развитие, то нам нужно будет разработать более сложную модель данного процесса.

Постоянно отмечается существование взаимосвязи между учебными стратегиями и разви­тием продуктивной способности (смотри, например, Hess and Shipman, 1965; Brandis and Bernstein, 1974). Учителя и другие специалисты признают, что трудно согласовать ценностно-ориентированную направленность предметных стратегий с желанием создавать якобы свободные от ценностных установок оптимальные условия для "когнитивного развития". Одна из основных проблем многих родителей, учителей, менеджеров и политиков заключается в недо­статке компетентности, необходимой для взаимодействия с независимыми, думающими детьми или подчиненными, которые задают вопросы, вникают в работу организации и устройства об­щества и действуют независимо. Учителя, способствующие развитию таких качеств, создают тем самым серьезные проблемы для родителей, других учителей и менеджеров. Другая пробле­ма, подробно описанная автором, а также Миллером с соавторами (Miller, Kohn and Schooler, 1985, 1986), заключается в том, что когнитивное развитие происходит более эффективно, если дети реализуют деятельность, мотивированную их собственным любопытством. Такие виды де­ятельности создают непредвиденные проблемы, решение которых опирается на продуктивную способность и подпитывает её. При некоторых обстоятельствах, однако, такие виды деятельно­сти могут иметь и опасные последствия. Связи между "когнитивным развитием" и ценностями и порождаемые ими дилеммы более подробно рассмотрены Равеном в его работе 1987 года (Raven, 1987), а общие проблемы, которые ставит перед образовательной системой ценностно-

15 ориентированная природа компетентности (включая и продуктивную способность), освещены им в работах 1977, 1989, 1990, 1991 годов.

Многие авторы (Stallings and Kaskowitz, 1974; Nickerson et at, 1985; Miller, Kohn and Schooler (1985, 1986); Raven, Johnstone and Varley, 1985) исследовали развитие продуктивной способности в школах, хотя далеко не все они пользовались для этого ПМР. Сталлингс с коллегами обнаружил, что по крайней мере некоторые формы "открытого" или "прогрессивного" обучения способствуют развитию продуктивной способности. Миллер и Равен с коллегами установили, что и учебная самостоятельность (т.е. принятие учениками ответственности за свое образование и за поступки), и включение в более сложную учебную деятельность (например, работа в рамках проекта или исследования) стимулируют циклическое развитие познавательной способности. Больший акцент на самоконтроле и развитии нового взгляда на вещи благоприятствует формированию компетентности учащихся, которая, в свою очередь, повышает их желание в большей мере контролировать собственную жизнь и подкрепляет готовность учи­теля доверять способностям учеников.

Важно отметить одно обстоятельство, которое некоторые могут интерпретировать как не­благоприятный результат такого рода работы. Образовательная практика, способствующая раз­витию продуктивной способности, снижает тестовые оценки по традиционным тестам чтения, письма и арифметических навыков (Stallings and Kaskowitz, 1974; Sigel, 1986). Однако, такие тес­ты, используемые для измерения "учебной" компетентности, нацелены скорее на исследование репродуктивных, нежели проактивных компонентов этих способностей. Математические тесты, к примеру, не оценивают способности использовать математику для осмысления новых пробле-м, для ситуации общения или для обобщения доказательств. Тесты навыка чтения не чувствительны к контекстному мышлению, а письменные тесты не оценивают способность эф­фективно передавать свои мысли при помощи таких средств как аллюзии, косвенные намеки или способность обращаться к чувствам читателя. Равен (1991) приводит много примеров того, как совершенно неадекватные стратегические решения принимались на основе исследований, в которых использовались тесты с "низким потолком". Исследования, проведенные непосредственно на рабочем месте (Kohn and Schooler, 1978, 1982; Jaques, 1976; Lempert, 1986, 1990), обращают внимание на важность такой работы, которая требует способностей для при­нятия важных решений, высокой ответственности и умения контролировать и решать мораль­ные дилеммы.

Экспериментальные попытки создания благоприятных условий для развития продуктивной способности

Эксплицитное обучение стратегиям, которые считаются необходимыми для решения мат­ричных задач, оказывает впечатляющее влияние на тестовые оценки (см. Budoff et al, 1964; Budoff and Gorman, 1976; Wortman, 1968; Jacobs, 1977; Feuerstein, 1979; Haywood et al, 1982). Однако совсем не очевидно, что такая тренировка значимо улучшает продуктивную способность. Джакобс и Вандервентер (Jacobs and Vandeventer, 1971) даже обнаружили, что овладение заученными стратегиями решения матриц одного типа не обязательно улучшает спо­собности работать с другими их типами. Гутке (Guthke, 1982, 1984, 1986) и Эндрих (Andrich, 1991) показали, что специальная тренировка и практика фактически не влияют ни на скорость работы конкретного индивида, ни предельный для него уровень сложности выполняемых зада­ний. Было также установлено (Alderton and Larson, 1990; Baltes and Lindenberger, 1988; Dickstein and Ayers, 1973; Difon, 1980), что тестовые показатели характеризуются стабильностью даже не­смотря на тренировку.

Работы Фойерштайна (Feuerstein, 1979, 1980, 1988, 1990) заслуживают более детального обсуждения. Его программы Инструментального Обогащения (FIE) вклинивались в процесс ког­нитивного развития на значительно более ранней стадии, чем это делали выше цитированные авторы. В этих программах участников поощряли обращать внимание и разыскивать линии, углы

16 и треугольники. Их стимулировали искать сходства и различия и приходить к пониманию того, что мир скорее упорядочен, чем случаен. Подчеркивалась важность убежденности, что выбран­ное решение согласуется со всеми известными на данный момент обстоятельствами.

К сожалению, как было детально проанализировано Шпитцем (Spitz,1986), результаты оценки программ FIE, равно как программы Хидштарта (Headstart) и других программ когнитив­ного обогащения {см. Raven, 1980), часто оставляют желать лучшего. Например, не является достаточно убедительным основное требование Фойерштайна - чтобы те, кто прошел полный курс обучения по его программе, даже много лет спустя получали более высокие ПМР баллы, нежели их сверстники (при условии исключения эффекта тренировки путем использования новых тестовых заданий).

Даже если отвлечься от возможных недостатков при организации исследований по оценке программ обогащения, остается недостаточно понятным, какое влияние тренировка оказывает на разные подгруппы в рамках одной возрастной когорты. Будут ли все действовать одинаково успешно? Если нет, то насколько сохранится ранговый порядок оценок при повторных тестиро­ваниях? Будет ли повышение оценок (Потенциал Обучаемости, согласно определению некото­рых авторов, например, Wortman, 1968) одинаковым для всех, или же оно будет больше для на­ходящихся у нижнего конца шкалы?

Учитывая эти очевидные проблемы с FIE, представляется интересным тот факт, что Фойерштайн и его коллеги вынуждены были отказаться от своих программ в пользу Опосредо­ванного Обучения (Feuerstein et al., 1988, 1990). Этот термин указывает на совокупность видов деятельности, аналогичных тем, которыми пользуются родители, добившиеся наибольших успехов в развитии у своих детей продуктивной способности. Особый акцент делается на отборе, структурировании, объединении и установлении временных, пространственных и при­чинно-следственных связей. Особо важное значение приписывается пяти видам деятельности Первая - опосредование интенциональности - вовлекает ребенка в процесс постановки целей и планирования действий по их достижению. Вторая опосредованная деятельность - трансцен­дентность, предполагает организацию условий, помогающих ребенку развить способность формировать новые потребности. Третья включает в себя опосредование процессов констру­ирования значений, формирования символов и схем. Содержанием четвертой является опосре­дование процесса имитации, чтобы ребенок обращал внимание на людей, демонстрирующих компетентности высокого уровня (и таким образом обучался соответствующему поведению). Пя­тая состоит из опосредованных рефлексий на результаты действий и развитие у ребенка чувст­ва самостоятельности, уверенности в своем праве задавать вопросы и т.п. Направление рабо­ты, выбранное в итоге Фойерштайном, представляется вполне оправданным, постольку такое изменение приоритетов: (i) поддерживает его изначальное настойчивое требование, чтобы учи­теля изменили стратегии преподавания, вместо того, чтобы полагаться на имеющийся методический арсенал; (и) хорошо согласуется с суммированными выше практическими выводами из результатов исследований детского развития; (Hi) поддерживает основной вывод, сделанный в обзоре (Savell et al, 1986), содержащем результаты оценки различных FIE про­грамм. Там было отмечено, что хотя многие из FIE программ имели незначительный эффект, от­дельные их варианты показали в итоге существенное повышение ПМР баллов. Причем программы, оказавшие максимальный эффект - это как раз те, которые подчеркивают роль Опо­средованного Обучения.

Пределы Эффективности Программ Активного Обучения

Подчеркивая важную роль, которую отдельные родители и учителя могут сыграть для создании благоприятных условий развития продуктивной способности, нужно отметить, что бо­льшинство попыток внедрить такого рода деятельность в школу натолкнулось на невозмо­жность изменить поведение учителей (см. НМ1, 1980; Farley, 1981; Raven et al, 1985). Попытки изменить поведение родителей постигла та же участь (Raven, 1980). Почти наверняка именно в

17 этом состоит причина, что попытки оценить эффективность программ активного обучения (см., например, Bock et al, 1977; Spitz, 1986) - подобных "Мозговому Старту" (Headstart) или "К Новым Вершинам" (Follow-Through) - показали их недостаточную успешность. Как выяснилось, непосредственные ведущие этих программ не делали того, что должны были делать. Если Фойерштайн смог заставить ведущих изменить свое поведение, то это и привело к тем положительным эффектам, которые лишь немногие кроме него смогли достичь. К сожалению, наша собственная работа показывает, что безуспешные попытки многих родителей и учителей применять более эффективные стратегии обучения обусловлены не только недостатком знаний, понимания или компетентности. Они определяются также недостаточными возможностями окружающей среды, принижением ценности умения задавать вопросы, неспособностью руково­дить самостоятельно мыслящими и задающими вопросы детьми, недостатком методик, помога­ющих учителю определить мотивы учащихся и отследить развитие их талантов и, наконец, об­щей неспособность системы образования создавать необходимые условия, которые способствовали бы достижению разнообразных и значимых для ребенка целей (см. Raven, 1991).

Одна существенная оговорка, касающаяся "обучения" решению задач в школах, заключа­ется в следующем: по причинам, рассмотренным выше, такое обучение ориентированно скорее на инструментальный подход и не будет оказывать влияния на развитие мотивации и сензитив-ности, нужных для облегчения идентификации и решении учащимися значимых для них задач. Безуспешность осуществляемых до сих пор попыток внедрить методы творческого решения задач во все сферы образования значительно затрудняет формирование таких учебных планов, где решение задач составляло бы одну из центральных учебных целей.

НЕКОТОРЫЕ ИТОГИ

Имея перед глазами обзор материалов, демонстрирующих важность некоторых разви­вающих и образовательных детских программ для создания благоприятных условий формирования продуктивной способности, мы приходим к выводу, что роль среды здесь менее значительна. Но ни один из указанных выше психологических или образовательных процессов не влияет настолько, чтобы объяснить доказанное Флинном повышение оценок ПМР от поколе­ния к поколению. Более того, ни один из видов деятельности, описанных в опубликованных на сегодняшний день исследованиях, не может значимо снизить внутригрупповую или внутрисе­мейную вариативность тестовых баллов. Причем внутрисемейная вариативность покрывает до двух третей общей вариативности тестовых баллов. Похоже на то, что средовые факторы, кото­рые в наибольшей степени влияют на продуктивную способность, имеют не психологическую и не образовательную природу и, по-видимому, они оказывают незначительный эффект на ее на­следуемость. (Последнее удивительное доказательство, подтверждающее наследуемость не­ожиданно широкого спектра человеческих характеристик- включая и показатели по ПМР - при­шло из Миннесоты и построено на основе материалов близнецового исследования, проведенно­го Бушардом и соавторами (Bouchard et al, 1990).

ЭТНИЧЕСКИЕ И СОЦИО-ЭКОНОМИЧЕСКИЕ АСПЕКТЫ

ПРОБЛЕМЫ

Тест Прогрессивных Матриц был разработан для такого измерения продуктивной способности, который минимизировал бы влияние различий в уровне знаний тестируемых на ре­зультат оценки. Уже самые первые результаты показали, что многие люди, живущие в общес­твах с низким уровнем грамотности, в частности, в Африке, не имеют привычки смотреть и обра-

18 щать внимание на круги, квадраты, треугольники или линии, которые задают проблемные ситуации в ПМР. Еще более существенно то, что они не имели привычки думать в двумерном плане и рассуждать в категориях вертикалей и горизонталей, привычных при чтении и счете. Да­же фотографии людей не распознавались ими как изображения людей (смотри Price-Williams, 1962; Silvey, 1972). Другие исследования (например, Ombredane and Robaye, 1953; Vernon, 1966; Majumdarand Nundi, 1972) показали, что при отсутствии соответствующей стимуляции развитие логического мышления происходит в латентной форме или оно развивается в более позднем возрасте.

Учитывая тот факт, что существуют культуры, в которых настоящий тест просто не работа­ет, мы должны рассмотреть возможность, что разница в тестовых оценках, полученных предста­вителями разных этнических групп в рамках западного общества, может быть объяснена аналогичным образом.

Многочисленные данные относительно причин различий между этническими группами в обществах с традиционно высоким уровнем грамотности представлены в Исследовательских Приложениях к настоящему Руководству. Тем не менее, будет полезно суммировать и здесь эти результаты, особенно потому, что нередко утверждается "культурная независимость" теста Прогрессивных Матриц. Мы предоставим здесь столько доказательств, сколько нужно чтобы продемонстрировать, когда такое утверждение оправданно, а когда - нет.

Один из наиболее впечатляющих результатов заключается в том, что несмотря на удиви­тельное повышение с течением времени суммарных оценок, обнаружена очень высокая степень сходства между нормами, полученными в различных культурах в одно и то же время, К примеру, нормы, полученные в 1980 году в Великобритании, Восточной и Западной Германии, Чехослова­кии, Австралии, Новой Зеландии, в городах континентального Китая, а также у представителей белого населения США, очень похожи как по средним значениям, так и по величине дисперсии.

Однако, некоторые этнические группы демонстрируют значительное отставание от этих международных норм. Они включают жителей Бразилии, Ирландии, Пуэрто-Рико, а также пред­ставителей черного и коренного населения Америки. Оуэн (Owen, 1992) показал, что согласно данным по Южной Африке имеются огромные различия в показателях между чернокожими и белыми (на уровне 3 Стандартных Отклонений), и между мулатами и белыми (на уровне 1,5 Стандартных Отклонений), но не между индейцами и белыми. Крайне низкие нормы были выяв­лены в исследовании, проведенном в изолированном горном районе Перу. Во всех странах мира нормы для детей из менее привилегированных социо-экономических групп и из сельской местности были ниже, чем у остальных. Особенный интерес представляют различия между бе­льгийцами, говорящими голландском и французском языках, которые оставались практически постоянными с 1957 по 1968 год.

Наиболее частое объяснение этих различий заключается в том, что данный тест не вызывает интереса людей, выросших в неблагоприятной среде, и требует от них мыслительных усилий, к которым они не привыкли. Однако, трудно согласовать такое объяснение с широким диапазоном разброса тестовых оценок у людей, выходцев из самых различных сред и классов, а также членов большинства семей. Еще более важно, что данное объяснение не справляется с тем фактом, что тестовая шкала остается той же самой (то есть сохраняет ранговый порядок сложности отдельных пунктов) для людей - выходцев из совершенно разных культур. И хотя су­ществуют незначительные различия между шкалами, полученными в Великобритании, Новой Зеландии, Австралии и Чехословакии, средняя корреляция между сложностью отдельных пун­ктов, рассчитанных независимо в каждой из этих стран, составляет 0.99. Внутри Великобрита­нии и Соединенных Штатов корреляция между сложностью пунктов, рассчитанных независимо для разных социо-экономических и этнических групп, варьирует в пределах от 0.98 до 1.0. Оуэн (Owen, 1992) представил похожие результаты в отношении черных, мулатов и белых из Южной Африки. Таким образом, тест сходным образом работает во всех этнических и культурных груп­пах. Если бы это было не так, то пункты теста не демонстрировали бы инвариантности индексов

19 сложности. Более того, было обнаружено, что тест имеет одинаковую прогностическую валид-ность для ряда критериев внутри каждой из этих групп. Таким образом, даже в самом общем смысле не может быть справедливым утверждение, что тест предлагает "непривычный стиль мышления" для людей из любой из этих групп. Однако, нужно добавить, что существует множе­ство индивидуумов, чьи тестовые оценки не отражают реального уровня их способностей.

Как мы уже отмечали, наиболее вероятное объяснение факта изменения норм с течением времени заключается в улучшении питания, уровня благосостояния и гигиены. Факт, что в США различия в тестовых оценках по ПМР для разных социо-экономических и этнических групп изменяются параллельно с различиями в весе детей при рождении, детской смертности и ран­ней детской заболеваемости, свидетельствует о сходных источниках этих различий. Результаты многих других исследований (Baird and Scott, 1953; Scott et al, 1956; Vernon, 1969; Benton and Roberts, 1988; Eysenck and Eysenck, 1991) подтверждают эту гипотезу: качество питания связано с весом при рождении, детской смертностью, оценками по ПМР, и с ростом как внутри социо-экономических групп, так и между ними. При этом использование в системе питания людей вита­минов усиливает продуктивную (но не репродуктивную) способность, измеряемую с помощью ПМР или других тестов. Впрочем, важно отметить, что проблема состоит не просто в исключе­нии влияния неблагоприятных факторов. Не только люди маленького роста становятся выше в результате процессов акселерации, но и высокие люди тоже. Тем не менее, хотя гипотеза каче­ства питания дает разумное объяснение многим этническим различиям, в том числе стремите­льно сглаживающимся различиям между жителями США - американцами европейского и латиноамериканского происхождения, хотя она и может объяснить сохранение многих различий вопреки повышению средних оценок по всем группам, но она не в состоянии объяснить сохра­няющееся в течение нескольких лет различия между голландско- и франкоговорящими бельгий­цами. Скорее всего это конкретное различие следует приписать влиянию различий в практике воспитания детей.

Различия между оценками, полученными детьми из различных социо-экономических групп, значительно меньше, чем у их родителей. Генетические процессы склонны приближать крайние характеристики к среднему по популяции при переходе от родителей к детям. Однако, с психологической точки зрения больший интерес представляет тот факт, что некий трудно объяс­нимый социальный процесс селекции и распределения как бы рассортировывает детей для вос­произведения основных различий между взрослыми социо-экономическими группами. Этот про­цесс действует в обществах с широким разнообразием социо-экономических структур. Фирковска-Манкевич с коллегами (Firkowska-Mankiewicz et al., 1982) предоставили впечатля­ющую демонстрацию его работы в пригородах Варшавы, где проживают люди с сильно различ­ающимся социо-экономическим статусом. Однако, этот процесс может быть ускорен или замед­лен посредством определенных социальных или образовательных мероприятий. К примеру, Хоуп (Норе, 1985) показал, что американцам требуется 34 года, чтобы достичь той степени свя­зи между профессиональным статусом и Интеллектом, которой шотландцы достигают за 6 - то есть примерно ко времени, когда ребенку исполняется 11 лет. В обоих странах около 60% соци­альной мобильности, в конечном итоге, статистически высчитывается по оценкам "Интеллекта".

Похожие социальные процессы наблюдаются и вне интеллектуальной сферы. В 1959 году Кон (Kohn) продемонстрировал факт, что люди, принадлежащие различным профессиональным группам, исповедуют совершенно разные ценности. Так называемый "средний класс" склонен подчеркивать значение оригинальности, ответственности и инициативы, тогда как представите­ли "рабочего класса" более заинтересованы в послушании, обучении и наличии четких правил.

2 В своей книге Хоуп показал, что около 60% случаев изменения социального статуса - как вверх, так и вниз - мож­но было предсказать на основе детских оценок теста интеллекта (но не их учебных достижений), на основе учитель­ских оценок креативности (отрицательная корреляция), настойчивости и ряда других прогностических признаков. К одиннадцати годам школьная система Шотландии уже отсортировывала детей в соответствии с прицелом на их будущий социальный статус. В отличии от Шотландии, школьная система США слишком демократична и подвер­жена постоянным инновациям, так что прогнозы, сделанные на основе тепа интеллекта у американского ребенка, лишь к 40 годам достигали 60% соответствия интеллекта и социального статуса. (Примечания редактора).

20 Кон полагал, что эти различия являются результатом профессионального опыта, но автор про­демонстрировал широкий разброс систем ценностей у детей, выросших в сходном окружении, а также то, что система ценностей в юношеском возрасте в большей мере определяется группой, в которую индивид войдет в будущем, нежели той, которой он принадлежит по рождению {смот­ри также Kohn, 1977; Kohn and Schooler, 1978, 1982; Miller, Kohn and Schooler, 1985, 1986), Kohn, Slomcszynski and Schoenbach (1986) представили впечатляющую демонстрацию работы процес­са социального распределения среди взрослых. Но наиболее удивительными остаются резуль­таты, которые были получены Кинси (Kinsey) в 1948 году. Сексуальное поведение и социальные установки подростков в большей мере определяются группой в которую они войдут, нежели той из которой они вышли. Трудно понять, как это могло бы произойти путем обсуждения, явного обучения или моделирования в какой либо форме. Похоже, имеет место некий важный, хотя и трудный для понимания социальный процесс, в результате которого люди стремятся работать с теми, кто обладает интеллектуальными способностями их уровня, а также разделяет их соци­альные и профессиональные ценности.

Последствия этого процесса, однако, далеко не удовлетворительны. Хоуп (Норе, 1984), Наттгенс (Nuttgens, 1988), Хоган (Hogan, 1990) и сам автор (Raven and Dolphin, 1978; Raven, 1984) продемонстрировали в своих работах, что из числа тех кто продвинулся по службе на вли­ятельные должности, значительную долю составляют люди, которые, судя по их вкладу в эффе­ктивность функционирования их организаций и общества в целом, не могут быть охарактеризованы иначе, чем некомпетентные. Решение этой проблемы потребует разработки лучших систем оценивания ценностно-ориентированных мотивационных диспозиций.

Итак, в данном разделе обсуждались исследования этнических различий в оценках ПМР. Флинн показал, что (а) общая тенденция изменения оценок с течением времени опровергает предположение о наследуемости этнических различий; (б) эти временные изменения не связаны с изменениями деятельности {измеренной, например, числом зарегистрированных па­тентов). Недавно, (1989, 1991) Флинн обнаружил, что впечатляющие академические и профес­сиональные достижения американцев азиатского происхождения не могут быть отнесены за счет их более высокой продуктивной способности. Они скорее обусловлены их преимуществом в других способностях и мотивациях. Это подтверждает результаты ранней работы Макклелан-да (McClelland, 1961), что различные успехи в образовательной и профессиональной сфере представителей разных культур обусловлены главным образом их ценностными установками и способностью формировать и развивать в себе множество взаимодополняющих видов компете­нтности для эффективного достижения значимых для них целей.

Вытекающие из данного обсуждения практические выводы для социальной и образовате­льной политики будут рассмотрены ниже (см. раздел "Социальные и Психологические Аспекты Применения Тестов Интеллекта".

СОЗРЕВАНИЕ ПРОДУКТИВНОЙ СПОСОБНОСТИ

Было бы поучительно начать обсуждение этой проблемы с привлечения внимания читате­лей к следующему неразрешенному пока противоречию.

На основе качественных наблюдений процесса развития способностей, необходимых для решения входящих в тест ПМР заданий, Дж.К.Равен и другие предположили, что умственное развитие напоминает скорее "скачки форели в потоке жизни", чем последовательное ровное продвижение вверх по ступенькам лестницы. Как бы удобна ни была последняя гипотеза для ко­личественного оценивания или статистических вычислений, она, похоже, мало отвечает реаль­ности психической жизни ребенка, который совершает множество повторных попыток преодо­леть интеллектуальное затруднение до тех пор, пока внезапно с легкостью не разрешает его, после чего без труда переходит к следующей проблеме. Эта гипотеза подкрепляется анализом

21 решения отдельных заданий. Она предполагает, что необходимые для решения заданий спосо­бности формируют целый континуум качественно различных способностей, которые встра­иваются и накладываются на смежные способности, но каждая из них, психологически говоря, является отдельной, "самостоятельной способностью".

Однако, рисунки ИП4.С1 и ИП4.С2 из Исследовательского Приложения № 4, которые отображают трудности отдельных тестовых заданий по данным Эндрича и Довс (Andrich and Dawes), использовавших схему анализа Раша (Rasch), показывают постепенное нарастание трудности заданий. Там нет ни следа эффекта "скачков и плато", которые предполагаются гипо­тезой "прыжков форели". В противоположность тому, что утверждал Дж.К.Равен, оказывается возможным так сконструировать тестовые задания, чтобы они в точности соответствовали за­данной степени трудности. Также, наклоны Характеристических Кривых Заданий (обсуждаемые подробнее ниже и представленные на рисунках ИП1.1, ИП1.10 из Исследовательского Приложения № 1 и ЦПМ2, ЦПМ5 из Руководства к Цветным Прогрессивным Матрицам) пока­зывают, что способности, необходимые для решения определенного тестового задания, законо­мерным образом согласованы с теми способностями, которые требуются для решения предыду­щих и последующих заданий. Это указывает, что по мере улучшения способности решать любое из тестовых заданий, то же происходит и со способностями решать соседние задания; таким образом, не существует резких скачков в успешности решения.

Кажущееся противоречие между этими двумя системами наблюдений заключается в раз­ных уровнях анализа и концептуализации, используемых в исследованиях, особенно в отношении возрастного контроля.

Изучение норм {см., к примеру, Таблицу СПМ IV) показывает, что 10% детей семи с поло­виной лет достигают более высоких тестовых показателей, нежели 10% пятнадцатилетних. Во­сьмилетние демонстрируют практически все уровни, состояния, формы и стадии развития продуктивной способности, измеряемые данным тестом. Эти наблюдения ставят под сомнение положения, связывающие развитие продуктивной способности с опытом, и, еще в большей сте­пени, положения, связыващие интеллектуальное развитие со стадиями, которые сами опреде­ляются через возраст. Адекватная проверка гипотезы "прыжков форели" не может быть прове­дена методом грубых возрастных срезов, но требует лонгитюдного исследования развития продуктивной способности у отдельных детей.

Хотя соответствующее лонгитюдное исследование и было опубликовано Вилсоном (Wilson, 1983) (который также показал, что однояйцевые близнецы имеют одинаковый характер­ный паттерн опережений и задержек в развитии), стоит отметить, что доказательства, на поиск которых нацелены такого рода исследования, выглядят не столь уж очевидными. Ребенок мо­жет не справиться с решением сложных заданий одного типа, и в то же время управляться с бо­лее легкими заданиями следующего типа. Это тот случай, когда "менее способный" ребенок мо­жет быть в состоянии решить только простейшие перцептивные задания, а затем "перескочить" на решение простейших заданий на аналогии, не будучи в состоянии решить промежуточные за­дания, Другими словами, монотонное возрастание сложности тестовых пунктов, проиллюстриро­ванное на рисунках ИП4.С1, ИП4.С2, может быть результатом того, что разные дети на каждом типе заданий показывают способности разного уровня. Эти графики совершенно не обязательно должны говорить нам о том, в каком порядке конкретный ребенок будет справляться с задани­ями, так что гипотеза "прыжков форели" не может быть признана опровергнутой. К сожалению, возможно, что возраст действительно оказывает влияние на порог трудности для каждого типа заданий. Эта гипотеза на самом деле подтверждается данными, представленными на рисунках ИП1.6 и ИП1.8. Тенденция к бимодальности указывает на созревание различных способностей, и отмечается возрастающая прогрессия в отношении обоих пиков с увеличением возраста.

Гипотеза "прыжков форели" получила свое подтверждение в двух исследованиях, прове­денных Эндричем и Стайлзом (Andrich and Styles). В первом они обнаружили, что обучение не д-елает детей способными работать с более трудными заданиями; оно только снижает количество

22 ошибок, допускаемых до того, как они сталкиваются с барьером трудности, которого не могут преодолеть. В другом исследовании (Andrich and Styles, 1993) детальный анализ показал весомые данные о периодах возрастного ускорения.

Установление различий между самыми первыми заданиями на обнаружение "гештальта" и последующими более сложными заданиями на "аналогии" - независимо от того, используется ли метод наблюдения или факторный анализ - может быть полезным для каких-то конкретных целей, но не имеет большого смысла для доказательства того, что продуктивная способность охватывает, вероятно, целый веер психологически разных способностей, а способность разви­вать каждую из них полностью зависит от наличия уже развитых ранее способностей, включен­ных в ту же единую цепь.

Дж.К.Равен выделял по крайней мере пять качественно различных периодов развития ин­теллектуальной способности:

1. Сперва дети способны лишь различать идентичные фигуры от различных фигур, а по­зднее - сходные фигуры от несхожих.

2. Некоторое время спустя они становятся способны оценивать ориентацию фигуры в от­ношении самих себя или других объектов, находящихся в перцептивном поле.

3. Далее, они обретают способность сравнивать аналогичные изменения воспринимаемых свойств объектов и принимают ее на вооружение как логический метод рассуждения.

4. Следом за этим, они становятся способны анализировать воспринимаемое целое через выделение основных его элементов или свойств, а также понимать различие между тем, что да­но, и тем, что они сами додумывают.

5. Наконец, они приобретают способность воспринимать две или более дискретных фигу­ры как формирующих нечто целое, или организованную индивидуальную сущность.

Дж.К.Равен следующим образом связывал эти периоды развития с возрастом ребенка:

К моменту достижения детьми возраста 3-х лет они, получив планшетную форму теста, обычно могут вставить один из подвижных фрагментов в прорезь матрицы. Сначала лю­бой фрагмент, который входит в прорезь, доставляет им удовольствие и дети будут многократно пробовать по очереди разные варианты, каждый раз удивляясь, что любой фрагмент подходит к вырезанной части, или что впадина была сделана для того, чтобы удерживать вкладываемые фрагменты. Некоторые дети успешно дополняют рисунок в первых двух или трех матрицах Серии А и оставляют правильный фрагмент в нужной позиции.

К возрасту 4-х лет ребенок обычно замечает, что один из фрагментов выглядит также, как рисунок сверху от него. Сначала значение имеет только сходство рисунка, а действительный размер или ориентация элементов рисунка не кажутся существенными. Ребенок будет часто до­полнять рисунок, состоящий из горизонтальных линий, похожими вертикальными линиями и вес­ти себя так, как будто он полностью удовлетворен результатом, даже после того как увидит за­вершенную композицию. На следующей стадии развития, внимание обращается уже и на раз­мер, и на ориентацию, и ребенок обычно учитывает их, делая первый выбор фрагмента для за­вершения рисунка матрицы. Научение на основе попыток размещения фрагмента в прорезе рисунка проявится на более поздних стадиях развития. Начиная с этой стадии и далее, "пробы и

Смотри раздел об Анализе Пунктов, где обсуждается неадекватность последней процедуры для анализа мощности

тестон.

Например, кососимметричные по отношению к наблюдателю или объектам в его перцептивном поле фигуры (см. задание Abl 1 из ЦПМ) труднее дополнять до целого, чем те же фигуры вертикальной или горизонтальной ориента­ции. Важность ориентации в развитии восприятия принимали во внимание многие исследователи (Piaget, 1947; Ghent, 1961). Решение пяти из десяти заданий, отвергаемых на первой стадии, требует восприятия наклонной ориен­тации, без которого они были бы решены путем формирования относительно простого Гештальта.

23 ошибки" используются ребенком как основной метод работы. Он нуждается лишь в инструкции, чтобы, по возможности, попытаться выбрать правильный фрагмент с первой пробы.

К возрасту 5-ти лет дети иногда удовлетворяются результатом своих действий, если помещенный в прорезь фрагмент дополняет рисунок только в одном направлении. Позднее они начинают выбирать фрагменты, которые дополняют рисунок в двух направлениях одновремен­но. "Умные" дети могут начать спонтанно манипулировать тестовыми материалами для развле­чения. Поместив в прорезь нужный фрагмент, такие дети иногда сознательно удаляют его толь­ко для того, чтобы проверить как будут в ней смотреться другие варианты.

К возрасту 6-ти лет дети часто выбирают фигуры, которые правильно дополняют рисунок даже тогда {как в задании А8), когда искомая фигура (№2), не похожа ни на одну из час­тей дополняемого рисунка. Начиная с этой стадии развития, независимо от возраста, "неумные" дети, начинают допускать ошибки. Их усилия направляются на повторение части данного рисунка и на принятие этой стратегии в качестве стандартного метода работы. Даже когда расположение фрагмента в прорези выглядит как очевидно ошибочный ответ, такие дети часто удовлетворяются достигнутым результатом.

К возрасту 7-ми лет дети обычно уже способны воспринять дискретные объекты (такие как на матрицах Серии АЬ) как пространственно организованное целое, но, бесспорно, испыты­вают трудности при анализе составляющих их компонентов. Если не выбирается фрагмент, ко­торый повторяет одну из трех частей рисунка, то может быть выбран фрагмент на основе це­лого рисунка, включая как изображенную, так и требуемую часть. Например, в качестве ответа на задание АЬ4 может быть выбран фрагмент № 2. Способность выбрать часть, дополняющую дискретный рисунок до целого, развивается, похоже, несколько позже. Любопытно, что некото­рые дети при выполнении теста в планшетной форме удовлетворяются выбором целого квад­рата или круга, вместо того, чтобы подставить недостающий четвертый угол квадрата или квадрант круга. Выяснилось, что на их суждения почти не оказывает влияние, предлагается ли им тест в планшетной или буклетной форме.

К возрасту 8-ми лет трудности возникают преимущественно к концу Серии В. Наводящие примеры, предназначенные для тренировки в метода рассуждения, похоже, не оказывают ребенку помощи в решении этих заданий. Вместо выбора соответствующей всем требованиям фигуры, восьмилетний ребенок обычно повторяет одну из фигур из уже представленных на матрице и принимает эту стратегию работы как приемлемую. Если, например, ребенок выбирает вариант № 5 в качестве правильного ответа на задание В8, его ответы на последующие задания будут иметь тенденцию к выбору фрагмента, повторяющего фигуру, находящуюся сбоку или сверху от пропущенной.

Те дети в возрасте семи с половиной или восьми лет, которые поняли идею соответствия для дополнения матрицы фигурой, оказываются способны решать многие задания из набора Стандартных Прогрессивных. Матриц тем же способом, как и взрослые. По-видимому, до тех пор пока данная способность находится в процессе становления, задания в конце Серии В кажутся детям практически бессмысленными, но те же самые задания становятся самоочевидными для тех, у кого данная способность уже сформировалась. Это доказывает особую трудность конструирования заданий, занимающих промежуточное положение между такими, которые успешно решаются с помощью выбора фигуры для дополнения группы дискретных фигур, понимаемых как пространственно связанное целое, и теми, в которых необходимо сравнить две фигуры и логически вывести форму четвертой фигуры исходя из существенных признаков третьей. Для зрелого интеллекта эти два вида заданий представляются очень похожими и, очевидно, решаются с помощью более менее сходного способа рассуждений. Для ребенка они явно различаются и, похоже, требуют использования разных психических процессов. Это может объяснить бимодальность распределения нормативных данных (смотри графики в Исследовательском Приложении № 1), а также

24 причины того, что в некоторых исследованиях, особенно проведенных на детях, СПМ, выявляют "k" фактор, который обычно не проявляется в исследованиях, проведенных на взрослых.

Фактический возраст, в котором впервые проявляется способность ребенка рассуждать по аналогии, является менее важным, нежели развивающаяся у него на этой основе собственно способность к абстрактному мышлению.

С 10 пет и далее, ответы испытуемых, получающих высокие, средние и низкие тестовые оценки, начинают все сильнее отличаться друг от друга. Когда дети не способны выполнить задание, они стремятся повторять то, что они уже восприняли и усвоили. Во-вторых, они склонны делать ошибки в выборе ориентации и воспроизведении соответствия. Кроме того, они склонны менее адекватно схватывать перцептивное поле и, наконец, часто прибегают к спорному выбору в зависимости от близости фигуры к заполняемому пробелу в матрице или, в более редких случаях, от ее близости к ним самим.

"СНИЖЕНИЕ" ПРОДУКТИВНОЙ СПОСОБНОСТИ В ЗРЕЛОМ ВОЗРАСТЕ

Одно время считалось, что продуктивная способность начинает снижаться в возрасте более 25 лет. Данные, которые можно было бы интерпретировать как подтверждение этого заключения, были опубликованы в ранних редакциях настоящего Руководства и подтверждены -для более высоких средних оценок - в недавних исследованиях Дельтура (Deltour, 1984) во Франции и Чанга с коллегами (Zhang et ai, 1989) в Китае. Данные стандартизации СПМ 1992 года, показывающие "снижение" начиная с 35-летнего возраста, представлены на рисунке О1.

Однако когда на графике одновременно нанесены как современные, так и более ранние данные как функция даты рождения, а не только возраста (Рисунок О2), то оказывается, что распределение баллов по популяции 1922 года рождения в обоих исследованиях остается практически неизменным, несмотря на то, что в одном случае хронологический возраст испытуемых равен 20 годам, а в другом - 70. Обнаруживается отчетливое и устойчивоеповышение тестовых оценок с датой рождения, независимо от даты тестирования и 50-летнего различия в возрасте респондентов.

С целью разрешить все еще остающиеся сомнения относительно адекватности выборки в обоих упомянутых исследованиях, данные третьего исследования, проведенного примерно в промежутке между ними, были наложены на наши собственные результаты на рисунке ОЗ.

На рисунке О4 данные по китайскому городскому населению наложены на британские данные. Очевидно, что китайская популяция отстает примерно на 20 лет.

Эти данные

представляют особый интерес, поскольку таблица ИП4 СПМ2 показывает, что нормы для китайских школьников, протестированных в тот же год, что и взрослые, похожи на нормы, полученные для их британских сверстников. Возникает вопрос о причине такого отставания у взрослых - в частности, обусловлено ли оно такими факторами как питание и образование.

Рисунок О1 может породить и другие ошибочные представления. Одно из ограничений Матриц как инструмента измерения продуктивной способности заключается в том, что они ставят проблемы, не задевающие ценностей, на которые ориентируются испытуемые, и не позволяют им использовать сложные невербальные конструкты, привлекаемые для решения значимых для них задач. Отсюда следует, что плато в развитии, которое казалось бы наблюдается на протяжении юношеского возраста, может являться артефактом измерения. В случаях, когда продуктивная способность измерялась с учетом видов деятельности, представляющих значимость для конкретного испытуемого, то, как показывают результаты многих исследований (Jaques, 1961, 1964, 1976; Kohn and Schooller, 1978; Lempert, 1986), при соответствующих условиях среды обнаруживается явное улучшение продуктивной способности в течение всей жизни.

РЕПРОДУКТИВНАЯ СПОСОБНОСТЬ, ВОЗРАСТ И ДАТА

РОЖДЕНИЯ

Рисунок О5 отображает оценки по Словарной Шкале Милл Хилл, полученные при срезовом тестировании популяции взрослых в процессе стандартизации шкалы в 1992 году. Очевидно, что хотя продуктивная способность имеет тенденцию к снижению с возрастом, репродуктивная способность повышается, за исключением самых отсталых. Это было подтверждено Делтором (Deltour, 1984), использовавшим французскую версию СШМХ, а также Бувье (Bouvter, 1969) и Шайе (Schaie, 1983,1986), применявшими другие тесты.

Рис.О5. Репродуктивная способность и возраст

Данные как Бувье, так и Шайе показывают, что хотя большинство способностей, включая такие как способность решать административные задачи, проворство при выполнении ручных заданий и атлетические способности, улучшаются с течением времени, способность к рассуждению, независимо от того, измеряется ли она вербальными или невербальными

28

тестами, улучшается в наибольшей степени, а словарные - в наименьшей. Лишь некоторые способности, такие как вербальная беглость, демонстрируют ухудшение с течением времени.

На рисунке Об сравниваются данные 1992 года с более ранними. Можно убедиться, что 50-ый процентиль практически не изменился с 1947 по 1992 годы. 90-ый и 95-ый процентили для 1992 года оказываются ниже, чем прежде, но повышаются у людей старше 60 лет. 5-ый и 10-ый процентили оказываются явно выше по отношению к прошлому их уровню для всех возрастов, причем, чем больше возраст, тем больше это повышение.

Перегруппировка данных в соответствии с датой рождения не обнаруживает существенных тенденций. Однако можно увидеть, что тестовые баллы людей, рожденных в 1922 году - кому было, соответственно, 25 лет при первом тестировании и 70 при втором -определенно улучшались во всех случаях, за исключением 5-ого процентиля, хотя и не так сильно, как следовало бы ожидать на основании графика на рисунке Об. Максимальным было улучшение у тех, кто изначально имел высокие оценки.

Данные эти переворачивают с ног на голову вопрос, который с такой настойчивостью ставил Флинн. Загадкой является то, почему когда столько различных способностей, включая физический рост и атлетические способности, увеличиваются столь значительно, такого не наблюдается для репродуктивной способности.

Здесь мы можем повторить, что было бы значительно труднее установить истинность этих выводов, если бы данный тест в практически неизменном виде не использовался в самых разных исследованиях, проведенных во многих странах в течение длительного периода времени. Поэтому, для исследователей крайне важно противостоять соблазну создавать новые модификации известных тестов, которые может быть и лучше отвечают целям их конкретных исследований, но закрывают возможность включать получаемые с их помощью результаты в международный банк данных для сравнительных исследований.

29

СОЦИАЛЬНЫЕ И ПСИХОЛОГИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ

ТЕСТОВ ИНТЕЛЛЕКТА

Вопросы этнической принадлежности и равенства, поднятые в связи с разработкой критериев направления на специальное обучение в США, неожиданно вовлекли психологов в оппозиционную политическую активность. Все больше и больше психологов требовалось для участия в такого рода исследованиях, и все больше усилий направлялось на разработку эффективных и предоставляющих равные возможности программ обучения, а также программ повышения профессиональной квалификации и отбора персонала, Для иллюстрации этого процесса, мы можем отметить, что одно из направлений деятельности, приобретающее особое значение в обезвреживании минного поля этнической принадлежности, включает разработку образовательных программ, которые выявляют, развивают и обеспечивают признание все большему числу разнообразных талантов у все большего числа учащихся. Эта работа включает в себя прояснение природы тех компетентностей, которые следует развивать, механизмов их формирования, а также методов их оценки. Определенно, что это является задачей для психологов. К сожалению, это одна из тех задач, которую мало кто из психологов готов поставить перед собой, хотя придается особое значение извлечению исследовательских приоритетов из прикладных проблем и существует большая готовность поддерживать тех, кто желает и способен путешествовать в непознанное для развития принципиально нового взгляда на вещи и для конструирования средств поиска новых решений, пусть на первый взгляд и уводящих немного в сторону, но влияющих на актуальные социально-политические проблемы.

Эти исследования по сути своей более фундаментальны и важны, чем может показаться после прочтения предыдущего параграфа, Приведенное в начале настоящего раздела Руководства обсуждение проблем природы продуктивной способности, её отношения к Общим Способностям, ограничений при использовании Матриц, а также природы, развития и оценки других видов компетентности, имеет самое серьезное практическое значение при применении критериев оценки качественных особенностей людей, а также образовательных программ и программ повышения квалификации персонала. Качество оценки или измерения не определяется (как пытается нас убедить Объединенный Комитет по разработке Стандартов Педагогической Оценки (Joint Committee on Standards for Educational Evaluation, 1981)) точностью информации, полученной относительно одной или двух переменных. Оно заключается, скорее, в содержательности этих переменных, т.е. в убедительности представления ими хотя бы грубого контура всех важнейших характеристик обследуемого индивида или всех важнейших результатов образовательной программы, программы повышения квалификации персонала или развития организации. Было бы неправильным использовать термин "объективная" для такой оценки конкретного испытуемого, когда зарегистрированы только те способности, которые характеризуют его не с лучшей стороны, и не представлен список его актуальных и потенциальных достоинств и преимуществ. Подобным же образом, нельзя признать справедливой такую оценку образовательных программ и программ повышения квалификации персонала, в которой отсутствует учет их достоинств и недостатков, объясняемый их "неуловимостью и трудностью для измерения", или тем, что они "не оказывают влияния" на результаты измерений, полученных посредством надежных и доступных тестов.

Из этих наблюдений следует, что различия между людьми и между программами нужно проводить преимущественно по их достоинствам и отличительным характеристикам, вместо того чтобы ориентироваться на тестовые оценки, отражающие лишь небольшое число внутренне непротиворечивых переменных. Они также предполагают, что при планировании проведения оценочных исследований нужно посвящать столько же времени анализу и измерению средовых переменных (например, условиям образовательного процесса или процесса развития, в их конкретном воплощении дома, в школе или на производстве), сколько и разработке проблем измерения результата. Наиболее важная цель оценочных исследований

30 такого рода заключается не в том, чтобы выяснить, "работает" или нет программа, а в том, чтобы определить способы ее работы, а также почему не работают те факторы, которые могли бы работать.

Здесь не место для более детального рассмотрения этих вопросов или для развертывания широкой картины их практического применения чтобы показать, как психологи определяют свою роль а обществе и как они планируют исследования, которые могут быть социально востребованы. Те, кому это интересно, могут обратится к работам Равена (Raven, 1985, 1989, 1991)5.

Имеется, однако, еще одна прикладная область, которую стоит упомянуть. Мы уже видели, что более эффективное "взращивание" продуктивной способности часто включает в себя изменение дисциплинарных стратегий, а это, в свою очередь, ставит проблемы, требующие от родителей, учителей и менеджеров высокой управленческой компетентности. Это только один пример ценностно значимых последствий, которые всплывают на поверхность сразу, стоит лишь только предпринять попытку ввести в действие образовательные программы, способствующие развитию компетентности высокого уровня. Для идентификации таких скрытых барьеров, препятствующих внедрению эффективных образовательных программ, большую пользу может оказать применение средств организационной психологии к анализу деятельности служб социального обеспечения. Как только это будет сделано, то на удивление быстро обнаружится (Raven, I989), что для решения этих проблем будет нужно развивать новые формы бюрократии и демократии, а также новые ожидания у работников социальных служб и политиков. Эти социальные задачи очень важны для роли, которую психологи, как они полагают, играют в обществе, и образа этой роли, который они создают в глазах общественности.

Приведенные примеры иллюстрируют ту полемическую политизированную деятельность, в которую психологи втянули себя в процессе отстаивания ценностных установок, всплывших на поверхность в связи с отбором детей на программы Специального Обучения. Но это только верхушка айсберга проблем, с которыми психологи в самом скором времени вынуждены будут иметь дело. К сожалению, большинство академических ученых, включая и психологов, не достаточно готовы к этому. Другими словами, большинство психологов сами испытывают недостаток тех видов компетентности, которые наиболее важны для эффективного выполнения их собственной работы. Следовательно, те, кто отвечает за подготовку психологов на младших курсах университетов, должны пересмотреть свою деятельность и поставить на первое место задачу формирования таких личностных черт, ожиданий и компетентностей, которые в будущем будут крайне нужны психологам.

Обрисовав обширный круг задач, ожидающих психологов, нам следует упомянуть об одной, которой они могут недосчитаться в ближайшем будущем.

Многие психологи верят, что тестирование является исключительно их сферой деятельности.

Однако, если внимательно изучить те сферы, в которых тестирование находит свое основное применение - а именно, руководство, развитие и размещение детей, учащихся и персонала - то можно обнаружить, что львиная доля работы выполняется друзьями, родителями, учителями и менеджерами. Работы должно быть сделано так много, причем работы повседневной, что у психолога нет никакой возможности выполнить ее самостоятельно. Более того, значительная доля работы, которую непсихологи делают в этих областях, составляет существенную часть их собственной работы. Одним из важнейших признаков, отличающих более успешных родителей, учителей и менеджеров от менее успешных, является то, что они думают о мотивах и зарождающихся талантах своих детей, учащихся или подчиненных, изобретают индивидуализированные программы их развития, создают

Некоторые из них опубликованы в журналах, которые не имеют широкого международного распространения. Тем не менее, автор будет рад переслать копии тем, кому трудно получить их иным способом.

31 развивающую среду, перераспределяют их таким образом, который способствовал бы повышению внутренней мотивации к развитию этих талантов, а также предоставляют гарантии, что развивающиеся способности будут использованы и вознаграждены. Они отслеживают результаты своих воздействий для оценки правильности ответной реакции учеников, детей или практикантов, предпринимают корректирующие действия по мере необходимости, а также находят пути, чтобы гарантировать развиваемым мотивам и талантам признание всеми заинтересованными лицами. (Данные, подтверждающие эти утверждения, можно найти в работах Raven, 1980, 1984 и Raven, Johnstone and Variey, 1985).

Другими словами, поскольку в этой области должно быть сделано так много, что психологи принципиально не могут сделать больше какой-то небольшой её части, эффективное выполнение всей оставшейся работы и реализация других ролей зависит от тех, кто так или иначе связан с выполнением насущных задач диагностики, руководства, размещения или развития.

Из вышеизложенного следует, что роль психологов заключается в развитии соответствующих знаний и разработке методических приемов, доступных другим профессиональным группам. Психологи должны будут также обеспечивать специальную научную поддержку в тех ситуациях, когда возникающие проблемы слишком сложны для тех, кто сталкивается с ними непосредственно и по роду службы обязан их решать. Это не значит, однако, что психологи должны держать свои концепции и тесты при себе. В процессе тщательного обследования компетентный психолог легко сможет выявить тех, кто был обучен ответам на любой конкретный тест. В любом случае, неправильно будет полагаться только на защиту теста от доступа потенциальных обследуемых как на гарантию против получения ненадежных результатов, поскольку всегда были и будут "учебные" конторы, помогающие сделать карьеру тем, кто готов платить за такую помощь. Проблемы, возникающие в связи с широким распространением тестов, наилучшим образом решаются все же через профессионализм специалистов, а не посредством усложнения защиты теста.В любом случае ограничение может оказаться деструктивным за счет того, что ведет к созданию консультационных и диагностических агентств, из которых не все будут комплектоваться профессиональными психологами. До тех пор, пока профессионалы будут стараться лишить такие агентства возможности использовать научные версии тестов, они будут вынуждены использовать методики более низкого качества. Поскольку нет оснований требовать от широкой публики, чтобы они были способны отличать хорошие тесты от плохих, то такая политика ограничений будет отрицательно сказываться на профессиональном сообществе в целом.

Сами психологи, сдерживая процесс расширения сфер применения тестирования, непреднамеренно вносят свой вклад в усиление тенденции к социальной дисфункции. Поскольку психологи не разрабатывают необходимые концепции и измерительные средства, многие таланты остаются нераспознанными в школах, а некомпетентные, руководствующиеся исключительно эгоистическими мотивами люди, выдвигаются на влиятельные позиции в обществе. Все это вносит определенный вклад узаконивание существующего социального порядка, при котором огромная разница в доходах оправдывается разницей в "способностях". Кроме того, оценки образовательных программ, которые претендуют на объективность только потому, что строятся на основе стандартизированных тестов, не могут зафиксировать всех тех результатов, которые лежат за пределами узкого и привычного диапазона легко измеримых эффектов. Вследствие этого общество продолжает использовать неэффективные (а, на самом деле, личностно и социально опасные) программы, игнорируя те, которые имеют больший потенциал. Более детальное и полное обсуждение данного вопроса можно найти в книге Равена: "Трагическая Иллюзия: Тестирование в Образовании" (Raven, 1991).

КАК ПРЕДСТАВЛЯТЬ РЕЗУЛЬТАТЫ: ТРЕБОВАНИЯ К КОНТЕКСТУАЛЬНОЙ ИНФОРМАЦИИ

Психологи несут ответственность за то, чтобы их клиенты имели представление об ограниченности информации, которая может быть получена в результате тестирования, а также о ее возможном социальном использовании.

Чтобы проиллюстрировать, что под этим подразумевается, мы приведем лишь некоторые соображения, более подробно освещенные в заключительных параграфах Исследовательских Приложений № 3 и № 4. Представленные в этих Приложениях материалы показывают, что при оценке целесообразности направления на специальные и углубленные программы обучения в США, ответственные за это лица должны выбирать соответствующие отборочные нормы с учетом возможных социальных последствий такого выбора. Например, если специальное обучение рассматривается как благо, поскольку от этого выигрывают как отобранные "слабые" дети, так и их одноклассники (хотя бы потому, что обычные классы становятся меньше), то можно увеличить число детей, отбираемых на эти программы, используя национальные (а не локальные или этнические) нормы. Напротив, если рассматривать специальное обучение как нечто плохое, в силу того, что на детях ставится "ярлык неполноценных" и они лишаются базовых знаний, которые могут им понадобиться при будущих тестированиях, то процент детей, отбираемых на эти программы, может быть уменьшен путем использования локальных, этнических норм. Обе процедуры могут быть аналогичным образом использованы для максимизации или минимизации потока федеральных бюджетных средств, направляемых в заинтересованные школьные округа.

Более фундаментальные вопросы касаются использования терминов "способности", "общие способности" и "умственный возраст". Социальные последствия от поддержки одномерной модели "Способностей" заключается в воспроизведении социального порядка, при котором многие таланты не развиваются и не используются, а грубое неравенство в доходах и качестве жизни смиренно принимается как данность.

Мы подчеркиваем важность, чтобы психологи обсуждали такие вопросы со своими клиентами, не только из-за возможных социальных последствий от отсутствия такого обсуждения, но и из-за необходимости создания между ними доверительной атмосферы, в которой будет проще обосновать необходимость исследований, нужных для разработки средств внедрения индивидуализированных, ориентированных на множественность талантов, программ в сфере образования, размещения и профессионального развития персонала, и которая дала бы психологам возможность выносить более содержательные и объективные суждения о способностях и талантах людей. Вопрос, следовательно, не в гражданской ответственности психологов за обсуждение этого широкого круга вопросов с клиентами, а в том, что для них важно поступать так, если они претендуют на компетентное поведение профессионалов-психологов, (Более полное обсуждение этих вопросов можно найти в работах Равена [Raven, 1989, 1991, 1991]).

Что касается собственных ограничений ПМР и СШМХ, то пользователи должны понимать; (i) ограниченную объяснительную силу самого конструкта "интеллект"; (И) диапазон применимости понятий "продуктивная" и "репродуктивная" способность; и (Ш) роль среды в развитии, проявлении и реализации этих качеств. Чтобы избежать излишних обобщений и тенденции придавать чрезмерный вес малым различиям в на шкале балльных показателей, мы настоятельно рекомендуем, чтобы результаты тестирования представлялись в категориях восьми широких, вербально сформулированных групп (например, "суперинтеллектуал"), описанных в каждом Разделе Руководства, или, в крайнем случае, в виде процентильных групп.

В Исследовательском Приложении № 3 мы специально предостерегаем от представления результатов в терминах IQ. Это понятие поощряет необоснованную веру в единство и объяснительную силу Интеллекта как конструкта и в стабильность и неизменность тестовых оценок. Оно создает ложное впечатление точности и поощряет пользователей проводить необоснованно четкие различия. Оно поддерживает также понятие Умственный Возраст (понятие, которое самим своим постоянным использованием предполагает, что Умственный Возраст является всеобъемлющей характеристикой, затрагивающей все аспекты психических способностей) и поощряет предубеждение, что люди более сходны с теми, кто соответствует им по умственному возрасту, чем со своими хронологическими ровесниками. Это привело к использованию таких ошибочных практик как группировка детей в соответствии с их умственным возрастом, вместо попыток создать почву для роста тех разнообразных талантов и способностей, которые обнаруживаются у людей сходного хронологического возраста. Наконец, разброс значений IQ питает веру в то, что человеческие способности следуют, или должны следовать, нормальному гауссову закону распределения. Это допущение не подкрепляется эмпирическими данными, но ведет к таким сомнительным практикам, как аппроксимация нормативных данных кривой Гаусса с целью определить точные процентили на хвостах распределения, где протестировано малое количество людей. (См. Исследовательское Приложение №3 и работу [Raven, 1989]). Эта техника может привести к абсурдным результатам. Один и тот же ребенок, отвечавший на один и тот же тест и оцененный в соответствии с одной и той же нормативной выборкой, может получить IQ = 47, если результаты обрабатывались при одной системе статистических допущений, и IQ = 60, если при обработке нормативных данных была принята другая система допущений (Dockrell, 1979). Сходным образом, при оценке достижений и измерении познавательных способностей использование IQ ведет к несправедливой для определенных этнических групп практике, такой как намеренная ориентация на гауссово распределение, а не на какие-то варианты распределения типа "кривой научения" (Mastery Learning) (Raven, 1989, 1991).

Независимо от того, запрашивают ли пользователи ПРМ и СШМХ какую-либо информацию кроме полученных баллов, такая дополнительная информация необходима. Отчеты о тестировании должны уточнять, имел ли испытуемый какие-то особые возможности для развития оцениваемых способностей, в каких видах специального обучения он участвовал, а также любые другие обстоятельства, которые могут исказить полученные оценки. Например, у тестируемого могут быть развиты такие формы продуктивной и репродуктивной способности, к которым не были чувствительны использованные тесты.

Матрицы не дают преимущества тем, кто использует свои способности для разработки новых типов невербальных стратегий. Такие стратегии, необходимые, например, при игре в шахматы, разработке математической теории или управлении сложными организациями, позволяют людям решать задачи, которые не могут быть решены другим путем. Это ограничение присуще, конечно, большинству тестов, оценки которых накапливают ошибки от получаемой неспециалистами случайной информации,.

Если обобщить сказанное, то мы настоятельно рекомендуем психологам анализировать

показатели продуктивной и репродуктивной способности в контексте информации о других

компетентностях высокого уровня и мотивационных диспозициях испытуемого. Дж.К.Равен

предлагал собирать такого рода информацию с помощью клинического интервью или, что более

i подходит молодым людям, при помощи метода контролируемой проекции. Автор настоящего

• руководства предлагает использовать Интервью Поведенческих Событий (McClelland, 1978),

интерпретируемое в соответствии со схемой, представленной в книге «Компетентность в

современном мире» (Raven, 1984). В настоящее время ведется работа по разработке (1) бланка

регистрации информации, полученной в ходе таких интервью и путем наблюдений, а также (2)

над созданием компьютеризированных методик, которые позволили бы выявить ценности

испытуемых и компетентности, которые они демонстрируют в значимых для них видах

деятельности.

34 В книгах Равена "Компетентность в современном мире" (1984) и "Трагическая иллюзия" (1991) детально обсуждается положение, что информацию о проявлении компетентностей высокого уровня необходимо рассматривать в контексте данных о том, связана ли ситуация наблюдения с ценностями тестируемого человека и побуждает ли она его к демонстрации присущих ему видов компетентности. Такая информация может были получена при помощи различных версий Эдинбургских Опросников.

ДИАГНОСТИКА ОШИБОК МЫШЛЕНИЯ

Время от времени психологи пытаются использовать ПМР и СШМХ для выявления информации о когнитивном стиле и природе ошибок, допускаемых при решении задач. Хотя они и не разрабатывались для этой цели, с помощью ПМР и, особенно, СШМХ можно получить некоторую полезную информацию на этот счет.

В Матрицах ошибочные ответы на каждое задание не отбирались специально, чтобы запутать испытуемого или чтобы выявить информацию о типе ошибок, совершаемых испытуемым. Тем не менее, особенность совершаемых ошибок может иногда указать на то, что именно вызывает трудности у данного человека и, в какой-то степени, почему возникают эти затруднения. Таким образом, обнаруженные у индивида ошибки могут подсказать, какие еще дополнительные тесты следует выбрать для более аккуратной диагностики его интеллектуальных проблем. Сравнительные исследования ошибочно выбранных фигур (в частности, Van Dam, 1973) показывают, что быпо бы полезно привлечь сюда:

а) Гештальт-тест, предназначенный для оценки степени способности испытуемого воспринимать дискретные части как единое целое, безотносительно к его способности к рациональным умозаключениям;

б) Тест Блоковых Конструкций, предназначенный для оценки ориентации с минимальными требованиями к продуктивной способности;

в) Тест Сортировки, состоящий из простых, четко определенных объектов, разработанный для

оценки гибкости в мыслительном поле как одного из видов деятельности, существенного для достижения успеха.

Работа Мэстрё (1957) иллюстрирует эффективное использование (а) и (б) в связи с ПМР, и в настоящее время возобновляется начатая Дж.К.Равеном работа с Тестом Сортировки.

Некоторые психологи интервьюировали своих испытуемых с целью выявить, как они воспринимают задания и используемые ими стратегии. Существует необходимость синтезировать работы такого рода, так что авторы были бы рады контактам с исследователями, заинтересованными в работе в этой области.

Для того, чтобы более систематически исследовать стратегии и стили решения задач, а также природу допускаемых ошибок, были предприняты усилия для разработки компьютерной версии Матриц, которая давала бы возможность модифицировать каждую конкретную матрицу для каждого респондента таким образом, чтобы определить, что именно делает ее более или менее трудной для решения. Ожидается, что это позволит достичь нового уровня понимания когнитивных процессов, стилей и природы ошибок, которое не может быть сформировано на основе вербальных опросов испытуемых, поскольку сам опрос обязательно интерферирует с преимущественно невербальным процессом решения задачи.

Что же касается СШМХ, то существует его "Краткая Форма", в которой респондентов просят как определить значение каждого слова, так и использовать его в предложении. Качественная классификация использования слов представлена в Разделе 5В настоящего Руководства.

ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ ПМР И СШМХ

Хотя Прогрессивные Матрицы Равена и Словарные Шкалы были разработаны в первую очередь как теоретически обоснованные исследовательские инструменты и использовались более чем в 2000 опубликованных работах, они находят также широкое применение в образовательной, клинической и трудовой деятельности. Ниже будут рассматриваться общие вопросы их валидности, а данные о валидности данных тестов в этих конкретных сферах будут представлены в дальнейших Разделах настоящего Руководства.

Индексы конвенциональной валидности сталкиваются с рядом трудностей. Представьте, к примеру, природу профессиональной компетентности. Конвенциональные "исследования валидности" коррелируют определенные показатели профессиональной квалификации с оценками теста способностей, например ПМР, и обычно выявляют положительную корреляцию. Впрочем, это больше относится к профессиональной квалификации, нежели к умственным способностям. Исследования, базирующиеся на методологии "критического случая" для идентификации поведенческих характеристик, отличающих более эффективных работников от менее эффективных (будь то строители, операторы машин, водители автобусов, врачи или служащие общественных учреждений), обычно приводят к заключению, что представители этих двух групп отличаются друг от друга многими другими качествами помимо уровня развития продуктивной способности. Они отличаются по способности брать на себя инициативу, общаться и работать в коллективе (обзор такого рода исследований смотри в работе [Raven, 1984]). Эти исследования также показывают, что ни один из членов группы высокоэффективных профессионалов не включен во все виды деятельности и не обладает всеми видами компетентности высокого уровня, которые различают две эти группы. Напротив, любая профессиональная группа включает в себя, и обязана включать, людей, которые обладают весьма различными структурами мотивации и компетентности. Любая группа выдающихся профессионалов будет включать в себя некое количество людей, сильная сторона которых заключается в понимании механизмов работы организации и того, что должно быть сделано, если дела идут не лучшим образом, определенное число тех, чей талант заключается в определении видов деятельности, которые должны быть выполнены, а также тех, кто способен принимать на себя ответственность за внедрение в практику новых идей.

Из вышесказанного следуют три вывода. Во-первых, похоже что успех в любой конкретной профессиональной группе больше зависит от мотивационных диспозиций, чем от самой по себе продуктивной способности. Во-вторых, продуктивная способность, хотя и в разных ее проявлениях, необходима человеку для эффективного выполнения любой профессиональной деятельности. И наконец, разные люди внутри одной и той же группы могут достигать успеха самыми разнообразными способами и, поэтому, они обладают весьма различными кластерами внутренне мотивированных компетентностей.

Реальные возможности любого человека и последствия его действий в значительной степени зависят от того, что делают другие. Гарднер (Gardner, 1987) также заметил, что интеллект и предприимчивость "распределяются" в большей степени под влиянием культуры, нежели как индивидуальные характеристики, а способность генерировать новое знание и открывать новые способы действия зависит от числа людей, вносящих свой очень разный вклад в напряженность групповой деятельности.

В свете этих наблюдений ставится ясно, что, во-первых, как подчеркивает и Мессик (Messick, 1989), задача определения валидности теста является куда более сложной, чем полагает большинство людей, и, во-вторых, что способы использования теста в процедурах отбора и расстановки людей должны быть более утончёнными, чем принято считать. Представляется также, что лучшее, что можно ожидать от традиционных групповых корреляционных исследований (в отличие от хорошо структурированных этнографических исследований) - это достаточно низкие корреляции между тестовыми оценками и теми

36 качествами людей, которые так или иначе требуются во многих реальных ситуациях. Не существует такой единой способности, которая была бы тесно связана с множеством различных типов высоко квалифицированных практических действий.

Те выводы, к которым мы пришли в результате обсуждения сферы профессиональной деятельности, в равной степени применимы также и в образовании, и в области клинической психологии.

Таким образом, хотя ПМР и СШМХ действительно выявляют два очень важных типа интересов и способностей, а их комбинированное использование позволяет получить значимый индекс фактора g, предоставляемая ими информация нуждается в дополнении. Поскольку установлено, что индивид может обладать различными альтернативными талантами, необходимыми в профессиональной или образовательной группе, то относительно низкие оценки по ПМР или СШМХ могут иметь для него незначительные последствия. Напротив, хотя многие роли могут выполняться только людьми с высоким уровнем продуктивной и/или репродуктивной способностей, исключительно высокие оценки этих способностей могут оказаться менее существенным фактом, чем такие свойства как готовность и способность мотивировать людей к определенной деятельности, отсеивать из поступающей информации интересные идеи и внедрять их в практику, работать скорее на благо организации, нежели ради личного продвижения, и прочие. Следовательно, важно провести различение между нижним порогом способностей и способностями, необходимыми для эффективного выполнения различных аспектов определенной работы.

Психологи мало продвинулись в разработке методов осмысления и оценки талантов, помимо тех, которые задействованы в ПМР и СШМХ. Мы рекомендуем применение этих тестов потому, что (а) их результаты имеют ясную и недвусмысленную интерпретацию; (б) их использование поможет внести вклад в общий банк данных и, таким образом достичь более глубокого понимания вопросов, обсуждаемых в настоящем разделе Руководства; и (с) использованные как индексы двух относительно независимых способностей в рамках того, что обычно рассматривалось как целостное когнитивное образование, они будут стимулировать разработку теоретических подходов к выявлению, развитию и оценки множественности талантов.

ПРИМЕНЕНИЕ ПМР И СШМХ В ОБРАЗОВАНИИ

Хотя главный выигрыш от применения ПМР и СШМХ в сфере образования лежит в контексте диагностики множественных талантов, мы сначала рассмотрим более традиционное использование данных тестов.

Сразу нужно отметить, что ПМР и СШМХ, использованные в сочетании, позволяют наиболее быстрым и "дешевым" способом получать самую значимую и полезную информацию из того, чего можно добиться при применении громоздких многофакторных тестов интеллекта . Поэтому многие учителя и другие специалисты используют эти тесты в своей повседневной деятельности. Они также широко используются психологами образования и диагностами после проведения многофакторных интеллектуальных тестов, с целью получения более точной информации, которая помогает в интерпретации противоречивых субшкальных оценок и в идентификации причин возникающих у ребенка проблем.

Более специфическое, исследовательское применение этих тестов в процедурах отбора состоит в быстрой предварительной селекции для уменьшения числа более детальных

6 Вполне убедительное доказательство этого утверждения было фактически представлено выше. Однако Матараццо (Matarazzo, 1990) сделал более полный обзор данной проблемы. Кратко говоря, большинство субтестов из громозд­ких многофакторных тестов "Интеллекта" либо настолько высоко коррелируют между собой, что подрывает доверие в их заявленной независимости, либо демонстрируют недостаточную надежность, валидность и различительную мощность, чтобы их можно было использовать для диагностической, консультационной или коррекционной работы.

37 диагностических процедур, необходимых для определения обоснованности направления ребенка на специальные, в том числе и углубленные, программы обучения. ПМР использовались также в качестве одного из альтернативных критериев для включения ребенка в образовательные программы для одаренных, наряду с такими критериями как академические достижения, исполнительское музыкальное мастерство, атлетическая подготовка, степень артистизма и лидерский потенциал. При таком использовании ПМР обеспечивают включение а программы для одаренных тех детей, которые обладают несомненными способностями, но, кроме того, отличаются от имеющих высокие школьном оценки большей склонностью задавать вопросы, наблюдать и делать собственные выводы и меньшим желанием выучивать материал, заданный преподавателями,. Такие программы имеют то преимущество, что они еще больше, чем "ускоренные академические" программы, стимулируют экспериментирование учителей с подходами, ориентированными на множественность талантов, и в этом русле способствуют разработке способов идентификации, поощрения и признания различных типов одаренности. Если как элемент батареи тестов в процедуре отбора используется также и СШМХ, то можно достичь более широкого признания факта, что люди, которые лучше других способны генерировать новые "озарения", не обязательно так же успешны в выражении своих идей в словах (и наоборот). В свою очередь, это может поощрить школьные учреждения меньше фиксироваться на формировании вербальных навыков и с больше способствовать развитию и признанию других способностей. Как показали в своих работах Хоуп (Норе, 1985), Натдженс {Nuttgens, 1988), Хомский (Chomsky, 1987), Шон (Schon, 1987), Хоган (Hogan, 1990) и Равен (Raven, 1984, 1993), использование показателей академической успешности в качестве основного критерия при отборе старшего административного персонала ведет к выдвижению на влиятельные посты непропорционально большого числа людей, чьи основные таланты состоят в способности оказать благоприятное впечатление на аудиторию своими речами.

ПМР нашли также применение в диагностике и лечении различных форм дизлексии. Некоторые из детей, испытывающих серьезные трудности при выполнении школьных заданий, получают высокие баллы либо по ПМР, либо по СШМХ, либо по обоим тестам. Реакции педагогов на таких детей весьма разнообразны: некоторые ищут возможности для решения их проблем в самой школьной работе, другие стараются найти способы помочь таким детям через развитие других талантов, демонстрируя им доверие и поддержку.

Более широкий вывод из этого последнего наблюдения состоит в том, что психологи должны сфокусировать свои усилия на противостоянии удушающей практике чисто академической оценкой талантов, которые могли бы быть реализованы и признаны в школах. Хотя точка зрения, что детей не следует наказывать за неспособность читать, писать или считать, находит все более широкое признание, в большинстве случаев остается непоколебимым мнение, что традиционные формы "учебной способности" имеют исключительную важность. Существует множество причин оспорить это мнение. То, что проходят в школах как "научное" знание, обычно устаревает к тому моменту, когда его начинают преподавать, бесполезно для решения насущных проблем и забывается к тому времени, когда в нем возникает необходимость (Goodlad, 1984; Raven, 1977). Кроме того, количество потраченных на "академическое" образование лет не позволяет сделать достоверного прогноза относительно будущей профессиональной деятельности (Hunter and Hunter, 1984; Taylor et al, 1963; Berg, 1973; Jepson, 1951; Hoyt, 1965). Похоже, что в поиске путей преодоления диэлексии проблема состоит не столько в том, чтобы разработать диагностические и коррекционные приемы, которые несомненно нужны учителям для обучения чтению, и даже не в том, чтобы отыскать способы, посредством которых наиболее "умные" дизлексики смогли бы продемонстрировать свои учебные достижения, а в разработке понятий, средств и социальных условий, необходимых для внедрения образовательных программ, ориентированных на множественность талантов.

КЛИНИЧЕСКОЕ ПРИМЕНЕНИЕ

Клинические расстройства обычно выявляются и диагностируются на основании внешних проявлений индивидуальных функций, либо снижения ранее зафиксированного уровня способностей. При том, что общепринятые психометрические показатели надежности и аалидности ПМР и СШМХ у здоровых людей весьма высоки, у больных следует ожидать значительную несогласованность результатов. В большинстве случаев не наблюдается устойчивого снижения продуктивной или репродуктивной способности, хотя обе они могут быть нарушены при некоторых заболеваний. Низкие и противоречивые результаты выполнения тестов могут быть обусловлены и другими факторами - низкой мотивацией и отсутствием интереса к предлагаемым заданиям.

Наиболее выраженные и устойчивые нарушения наблюдаются в случаях церебральной дисфункции. ЦПМ, в частности, широко используется для выявления врожденной или обусловленной травмой задержки психического развития, а также на популяции старшего возраста для выявления лиц, страдающих старческой деменцией. На взрослой популяции ПМР могут использоваться для контроля за степенью выраженности функциональных отклонений, а также за процессами их восстановления или ухудшения. СШМХ в форме "Шкалы Определений" является важным инструментом для выявления и анализа специфики вербальных дисфункций (например, при афазиях).

Нарушение нормального функционирования свойственно также тем, кто страдает от последствий алкогольной или лекарственной интоксикации. Улучшение индивидуального функционального состояния может быть оценено с помощью серийного тестирования, а некоторые исследователи используют анализ ошибок по отдельным заданиям с целью обнаружения структуры неправильных ответов.

Более детальный обзор по использованию ПМР и их модификаций в качестве нейропсихологической диагностической методики можно найти в Исследовательском Приложении №3 издания 1990 года.

Значительный объем работы был проделан в свое время при помощи СПМ и СШМХ для описания и исследования умственных отклонений у больных шизофренией. Поскольку у таких больных нарушения мышления являются клиническим симптомом, а вербальные абберации -очень частое явление, то комбинация данных тестов хорошо подходит для подобных исследований. Разрушение сложных мыслительных процессов и доминирование свободных ассоциаций - достаточная причина для ухудшения решения заданий СПМ. Похожее имеет место и для СШМХ: выбор неадекватных синонимов на основании сходства, рифмуемости или других иррелевантных признаков может указывать на трудности мышления или речевого выражения.

Менее очевидным и часто упускаемым из виду при серьезных отклонениях является нарушение функций, обусловленное эмоциональными и мотивационными факторами. Высокий уровень тревожности и/или депрессивное состояние могут оказывать негативный эффект на успешность выполнения теста; поэтому крайне важно распознать эти симптомы у лиц, перенесших травму головного мозга или находящихся в острой фазе шизофренического процесса. Проявления тревоги или депрессии могут различным образом напоминать симптомы функциональных и органических психозов. Высокая тревожность может выражаться в сомнениях, ограничивающих мыслительные процессы, в блокировании решения очевидно простых задач, а также в неспособности осуществлять мысленные вращения. Тревожный испытуемый часто торопиться и некритично выбирает первый попавшийся ответ вместо того, чтобы сначала изучить всю доступную информацию. Внимательный психолог должен учитывать влияние тревоги и депрессии на выполнение теста и остерегаться соблазна сходу заключить, что наблюдаемые нарушения деятельности обусловлены более серьезными причинами.

39 Больные, страдающие замедленными депрессивными реакциями, из-за замедленного темпа мышления обычно менее успешны при выполнении тестов с ограничением времени и настроены скорее на простые ответы, нежели на преодоление трудностей. Словесная беглость также часто снижается, что выражается в неравномерности ответов при выполнении СШМХ.

В дополнение к клиническим индикаторам, при интерпретации результатов теста (в частности, при обследовании правонарушителей) должны приниматься во внимание мотивационные факторы. Нельзя призывать к оценке способностей, если тесты выведены за рамки повседневной жизни. Для многих клинических больных психологическое тестирование представляется маловажным, неприятным и тревожащим мероприятием в их привычном расписании жизни. Когда боль, сомнения, депрессия, тревога или сама задача выживания занимают все мысли пациента, ему вряд ли удастся сосредоточить своё внимание на решении совершенно искусственных задач.

Из вышесказанного следует, что для проверки валидности результатов клиницисты должны не только проявлять осторожность при использовании полученных оценок и нормативных данных, но и учитывать таблицы ожидаемых распределений оценок по субшкалам.

ПРИМЕНЕНИЕ В ПРОФЕССИОНАЛЬНОЙ СФЕРЕ

Существует несколько основных проблем, связанных с определением тестовой валидности в профессиональной сфере:

(а) Проблемы, связанные с критерием успешности. Качества, необходимые для "хорошего" выполнения работы, зависят от критериев, принятых для оценки успешности ее выполнения. Различные качества требуются, например, для обеспечения быстрого служебного роста в организации, для обеспечения выживания этой организации при введении на рынок новых продуктов, для обеспечения ее роста посредством финансовых и/или политических манипуляций, или для обеспечения выживания общества в целом. Люди, способные обойти других в завоевании доверия со стороны начальства, совсем не обязательно будут столь же успешны в раскрытии энергетического потенциала и талантов своих подчиненных и, на самом деле, они сами часто выдвигаются за счет концентрации своих умственных способностей на создание видимости "высокоэффективной работы" их подразделения - за счет сокращения персонала, сокращения времени работ, разрушения сети контактов, необходимых для развития организации в целом, увольнения несогласных с их методами работы и тех, кто может оспорить их собственные взгляды или конкурировать с ними за их место. (Hogan, 1990; Hogan et al, 1990; Chomsky, 1987; Nuttgens, 1988; Raven, 1984; Raven and Dolphin, 1978)

(б) Проблемы, вытекающие из использования неадекватных описаний и средств анализа работ. Виды действий, необходимые для эффективного выполнения работы, могут отличаться от тех, которые обозначены в ее описании, и, поэтому, они могут быть упущены из виду в процессе оценки достоверности процедур отбора персонала. (Fivars and Gosner, 1966; McClelland and Dailey, 1973; Klemp, Munger and Spencer, 1977; Raven, 1984; Spencer and Spencer, 1993; Taylor and Barren, 1963).

(в) Проблемы, возникшие из-за использования в прошлом неадекватных процедур отбора. Люди, способные лучше других выполнять определенную работу, могут (вольно или невольно) оказаться исключенными из числа принятых на это рабочее место. Если такое происходит, то становится невозможным продемонстрировать важность необходимых для данной работы качеств {Berg, 1973; Holland and Richards, 1965; Hope, 1984; McClelland, 1961; Raven, 1984; Taylor, Smith and Ghiselin, 1963).

40 (г) Проблемы, порождаемые принципиальной невозможностью найти субъекта деятельности, приведшей к определенным результатам. В большинстве организаций крайне трудно приписать наблюдаемые результаты действий какому-либо конкретному человеку или группе лиц (смотри Day and Klein, 1987), особенно если условия постоянно меняются, а последствия тех или иных действий могут обнаруживаться годы спустя. Это создает большие трудности в получении точной информации о людях, чья работа безусловно идет на благо организации, а также в проведении различий между теми, кто способствует успеху организации, и теми, кто способен только производить хорошее впечатление, а затем ухитряется покинуть организацию до того, как его ошибки будут обнаружены.

(д) Внешние ограничения. Структура организации и определенные ожидания со стороны окружающих могут создавать людям препятствия для совершения ими действий, необходимых для эффективного выполнения работы.

(е) Изменения с течением времени. Люди по-разному выполняют одну и ту же работу в различное время суток или в разные периоды своей жизни. Они могут, к примеру, выполнять рутинные действия в одно время дня и творческие задачи - в другое. Они могут разрабатывать технологические новинки в начале своей карьеры и участвовать в политических процессах, контролирующих финансирование таких инноваций, в более поздние периоды своей жизни.

(ж) Эффективность как качество культуры. Эффективное выполнение любой профессиональной деятельности часто требует участия широкого круга людей с очень разными способностями, как непосредственно вовлеченных в выполнение этой работы, так и косвенно связанных сданной работой в рамках той же организации. Предприимчивость, в частности, есть скорее культурная, нежели личностная характеристика. (Gardner, 1987; McClelland, 1961; Raven, 1984; Roberts, 1968; Rogers, 1962/83; Taylor, Smith and Ghiselin, 1963).

Несмотря на указанные трудности, было установлено, что оценки по ПМР и СШМХ, в отличие от многих других тестов, действительно связаны с управленческой эффективностью, а именно: с текучестью кадров и финансовым оборотом, с прибыльностью фирмы и с её способностью выживать во время финансовых или иных кризисов. Оба теста предсказывают разные способы оказания влияния на эти процессы. Способность находить новые способы мышления и действия - то, что Кетон (Kirton, 1980) назвал "Инновацией" - лучше предсказывается с помощью ПМР, тогда как способность к адаптации лучше предсказывается СШМХ. Для одной группы менеджеров (например, социальных работников) важнее словесная беглость, но для многих других более значима способность находить выход в новых или затруднительных ситуациях. Качества, необходимые для решения каждой конкретной задачи, в значительной степени зависят от преобладающих обстоятельств. Репродуктивное поведение часто хорошо работает при неизменных условиях, но во время "больших перемен" (как например, в периоды войн или быстрых и глубоких экономических преобразований) воспроизведение традиционных способов действия может оказаться губительным. Вот почему для социальных служб так важно нанимать и выдвигать людей, обладающих различными способностями и мотивами. К сожалению, людям с определенным набором способностей и системой ценностей бывает обычно крайне трудно понять, не говоря уже о том, чтобы оценить, тех, кто имеет другие взгляды или способности.

Хотя мы посвятили большую часть времени обсуждению вопросов отбора менеджеров и трудностям такой работы, связанным с достоверностью тестовых показателей, это отнюдь не единственная область, в которой данные тесты показали свою полезность. Как будет видно из Раздела 7 и Исследовательского Приложения № 4, эти тесты были валидизированны в самых различных условиях и на многих профессиональных группах. Обобщая полученные данные методами мета-анализа и анализа генерализованной валидности, исследователи (Ghiselli, 1966;

41 Hunter and Hunter, 1984) пришли к выводу, что тесты интеллектуальных способностей предсказывают профессиональные достижения для восьми широких классов рабочих специальностей: управленцев, клерков, продавцов, водителей транспорта, работников сферы обслуживания, моряков, сотрудников служб охраны порядка и индустриальных рабочих.

Хотя, как мы видели, прогностическая валидность успеха в профессиональной сфере является сравнительно низкой для ПМР и СШМХ (в абсолютных величинах, но не в сравнении с другими тестами), Кендрик и Фандер (Kendrick and Funder, 1988) показали, что использование небольшого числа независимых тестов с такой прогностической валидностью, или похожих тестов в процедуре последовательного принятия решения, может иметь накопительный эффект, ведущий к огромной финансовой прибыли. Более того, использование таких тестов в сочетании с методами Диагностического Центра (Assessment Centre) или с Интервью Жизненных Событий {Behavioural Event Interviewing) позволяет специалистам, работающим с персоналом, сконцентрировать свое внимание на качествах, которые не могут быть напрямую оценены с помощью доступных на данный момент формальных инструментов.

Еще более оптимистичный вывод об использовании ПМР и СШМХ при отборе персонала можно сделать, если, отвлекаясь от задачи валидизации теста в рамках определенной профессиональной группы, включить эту проблему в более широкую перспективу.

Жаку (Jaques, 1976, 1989) утверждал, что многие виды компетентности, имеющие, как показывает анализ критических случаев (наподобие тех, которые приведены книге Равена "Компетентность в современном мире"), решающее значение для эффективного выполнения широкого круга профессиональных задач, сильно зависят от той разновидности "когнитивных способностей, которая измеряется Матрицами" (т.е. вкупе с эмоциональными и волевыми компонентами). Эти компетентности включают в себя способность сформировать собственное понимание механизмов работы своей организации и своей роли в ней, в том числе и способность взять на себя инициативу; способность понимать принципы работы экономических и политических систем и способность включаться в их работу на благо собственной организации; способность выявлять мотивы и таланты подчиненных, а также способы их наилучшего размещения с точки зрения развития тех талантов и усиления тех мотивов, которые полезны организации.

Жаку приходит к выводу, что высокий уровень когнитивных способностей является критическим условием эффективного выполнения тех видов деятельности, о которых шла речь выше. Если он прав, то ПМР должны лучше показывать себя при прогнозировании способности получить и сохранить работу, требующую высокого уровня профессионализма, нежели при прогнозировании достижений в рамках любой конкретной профессиональной группы. Данные в поддержку этого предположения можно найти в целом ряде работ, а наиболее яркие и убедительные из них приведены в работе Хоупа (Норе, 1985), который установил, что в США и Великобритании две трети социальной мобильности (перемещений вверх или вниз по социальной лестнице) могли быть предсказаны на основании тестовых показателей общего интеллекта 11-летних детей.

Если Жаку прав, утверждая, что когнитивные способности наиболее тесно связаны с уровнем получаемой и сохраняемой работы, то из это вовсе не следует, что люди, получившие самые высокие тестовые баллы, будут наилучшими исполнителями любой работы. Должен 4 существовать некий оптимальный для данной деятельности диапазон оценок. Исследование, выявляющее и описывающее подобный эффект, было проведено Дж.К.Равеном и его коллегами (Crichton Royal, 1957) на выборке радиоинженеров. Вывод, что взаимосвязь между способностью и успешностью является криволинейной, не противоречит утверждению Хантера о том, что во всех профессиональных группах эти связи являются линейными. Эти два утверждения могут быть согласованы, если вспомнить проблему критериев. В исследовании Равена результат состоял не в том, что служащие с высокими показателями выполняли работу хуже - на самом деле, эти люди часто сами оставляли службу.

42 Хорошей иллюстрацией взаимного перекрытия качеств, измеряемых тестами, и тех, которые в действительности требуются для эффективного выполнения определенных видов деятельности, является одно неопубликованное исследование, показавшее возможность прогноза успешности в компьютерном программировании на основе данных по ППМ, полученных по процедуре без ограничения времени. Обе задачи требуют высокой настойчивости, изобретения способов решения задач, внимания к деталям, а также желания и способности все тщательно проверить, прежде чем совершить очередное действие.

Из нашего обсуждения следует, что эффективное развитие и размещение человеческих ресурсов зависит от степени развития организационной психологии и оценочных систем. Необходимы новые способы мышления и новые языки описания взаимодействия этих двух сфер. Авторы будет рад контактам с любыми специалистами, работающими в этих областях.

ИСТОРИЯ СОЗДАНИЯ ПРОГРЕССИВНЫХ МАТРИЦ РАВЕНА

Прогрессивные Матрицы Раввна могут быть определены как "тесты наблюдательности и ясности мышления". Каждая задача на общей Шкале является "родительницей", или "источником" определенной системы мышления, а порядок, в котором эти задачи предъявляются, обеспечивает обучение данному методу работы.

ТРИ ФОРМЫ МАТРИЦ

Первой формой теста Прогрессивных Матриц были так называемые Стандартные серии. Они разрабатывались с целью охватить весь диапазон развития данной способности - от маленьких детей и испытуемых с интеллектуальной недостаточностью до самых успешных взрослых и престарелых. Эти серии впоследствии были расширены, чтобы обеспечить возможность более тщательного анализа способностей, относящихся к нижнему или верхнему концам диапазона. Для этой цели были созданы Цветные Прогрессивные Матрицы (ЦПМ) и Продвинутые Прогрессивные Матрицы (ППМ). Первые охватывают оценки нижнего квартиля полного диапазона способности, а вторые - верхнего. Все вместе эти тесты позволяют решить большую часть возникающих проблем.

Шкала Стандартных Прогрессивных Матриц разделена на пять серий по двенадцать задач в каждой. Каждая серия начинается с задачи, которая является более-менее самоочевидной, и строится так, что каждая последующая задача учитывает сделанное раньше, но с постоянно увеличивающейся сложностью.

Серия A: Использован принцип установления взаимосвязи в структуре матриц. Здесь задание заключается в дополнении недостающей части основного изображения одним из приведенных в каждой таблице фрагментов. Выполнение задания требует от обследуемого тщательного анализа структуры основного изображения и обнаружения этих же особенностей в одном из нескольких фрагментов. Затем происходит слияние фрагмента, его сравнение с окружением основной части таблицы. Серия А - диагностирует способность к дифференциации основных элементов структуры и раскрытию связей между ними, идентификации недостающих частей фигуры и сличению ее с представленными образцами.

Серия В: Построена по принципу аналогии между парами фигур. Обследуемый должен найти принцип, соответствен но которому построена в каждом отдельном случае фигура и, исходя из этого, подобрать недостающий фрагмент. При этом важно определить ось симметрии, соответственно которой расположены фигуры в основном образце. В серии В оценивается способность к аналогии.

Серия C: Содержит сложные изменения фигур в соответствии с принципом их непрерывного развития, обогащения по вертикали и горизонтали, построена по принципу прогрессивных изменений в фигурах матриц. Эти фигуры в пределах одной матрицы все больше усложняются, происходит как бы непрерывное их развитие. Обогащение фигур новыми элементами подчиняется четкому принципу, обнаружив который, можно подобрать недостающую фигуру. Серия С - диагностирует способность выявлять сложные изменения закономерностей непрерывного развития, обогащения по вертикали и горизонтали.

Серия D: Составлена по принципу перестановки фигур в матрице по горизонтальному и вертикальному направлениям. Обследуемый должен найти эту перегруппировку, происходящую в горизонтальном и вертикальном положениях.

Серия D - оценивает способность к пространственной перестановке фигур в матрице по горизонтальному и вертикальному направлениям.

Серия Е: Наиболее сложная, основана на принципе разложения фигур основного изображения на элементы. Недостающие фигуры можно найти, поняв принцип анализа и синтеза фигур. Процесс решения заданий заключается в анализе фигур основного изображения и последующей сборке недостающей фигуры по частям. Серия Е - выявляет способность к аналитико-синтетической мыслительной деятельности.

Эта процедура предоставляет испытуемому пять возможностей, чтобы познакомится с проблемным полем и методом мышления, необходимым для решения задач. Таким образом, стандартная процедура проведения теста включает встроенную тренинг-программу и позволяет оценить способность к научению через опыт, или "потенциал обучаемости". Циклическая структура также дает возможность оценить устойчивость интеллектуальной деятельности испытуемого в ходе реализации пяти последовательных мыслительных стратегий. Длительность теста также была тщательно подобрана, так чтобы она позволяла оценить максимальные способности испытуемого к когерентному восприятию и обоснованным суждениям, но не вызывала чрезмерного утомления и не делала процедуру излишне громоздкой.

Цветные Прогрессивные Матрицы (ЦПМ),

Серия А: Обследуемый должен дополнить недостающую часть изображения. Считается, что при работе с матрицами этой серии реализуются следующие основные мыслительные процессы:

дифференциация основных элементов структуры и раскрытие связей между ними.

идентификация недостающей части структуры и сличение ее с представленными образцами.

Серия АВ: Процесс решения заданий этой серии заключается в анализе фигур основного изображения и последующей сборки недостающей фигуры (аналитико-синтетическая мыслительная деятельность).

Серия В: При работе с матрицами этой серии испытуемый находит аналогии между двумя парами фигур. Он раскрывает этот принцип путем постепенной дифференциации элементов.где дополнительная

Серия АЬ помещена между Сериями А и В, разработана для более точной оценки интеллектуальных процессов у маленьких детей, умственно отсталых людей и лиц пожилого возраста. Цветной фон матриц

привлекает внимание, вызывает спонтанный интерес к тесту и устраняет необходимость давать слишком подробные вербальные инструкции.

Успешность решения Серии А зависит от способности испытуемого дополнять непрерывные структуры, которые по мере усложнения заданий в серии изменяются сначала в одном, а потом в двух направлениях одновременно. Успешность решения Серии АЬ зависит от способности испытуемого видеть дискретные фигуры как пространственно связанное целое и выбирать фигуры, которые дополняют пространственную схему. Серия В содержит достаточное количество заданий, использующие аналогии и определяющие, способен ли человек думать таким образом. Последние несколько заданий Серии В по трудности сопоставимы с первыми задачами Серий С, D, и Е Стандартных Прогрессивных Матриц. Чтобы облегчить испытуемому переход от Цветных к Стандартным Матрицам, последние несколько заданий Серии В напечатаны в Цветном варианте точно также как и в Стандартном, т.е. черно-белыми. Таким образом испытуемый, успешно решивший эти задания, может не прерываясь перейти к выполнению заданий Серий С, D, и Е Стандартных Прогрессивных Матриц, чтобы его интеллектуальные способности можно было оценить с большей точностью. Когда возможно, результаты Серии АЬ могут быть просто опущены, а итоговый результат считается по Стандартным пяти сериям для определения процентильного уровня в соответствии с нормами для Стандартных Матриц. Обычно он согласуется с процентильным уровнем по Сериям А, АЬ и В, но по мере созревания интеллектуальной способности формировать сравнения и рассуждать по аналогии оценки СПМ становятся более надежными и психологически валидными.

В период до окончательного созревания способности формировать сравнения и рассуждать по аналогии или в случаях её нарушения ЦПМ позволяют измерить степень развития или нарушения умения испытуемого наблюдать и ясно мыслить. После того, как эта способность созреет, СПМ измеряют интеллектуальные способности испытуемого относительно других людей того же возраста.

Иногда важно оценить скорость аккуратной интеллектуальной работы испытуемого, в отличие от уровня общей его способности к упорядоченному мышлению. Поскольку СПМ организованы в пять серий, в каждой из которых простые задания постепенно сменяются всё более трудными, то скорость интеллектуальной работы испытуемого не может быть измерена количеством заданий, решенных за фиксированный промежуток времени. Использование СПМ с ограничением общего времени решения ведет к получению нестабильных и невалидных распределений оценок, поскольку некоторые люди посвящают непропорционально большое время решению последних и наиболее трудных заданий, скажем, Серии D, тогда как другие просто пропускают их и значительно повышают свои оценки за счет быстрого и правильного решения наиболее легких задач Серии Е. Эта проблема может быть снята путем ограничения времени отдельно на каждую серию теста. До недавнего времени это была стандартная процедура проведения теста ПМР в Австралии. Но эта процедура весьма обременительна, а необходимая информация может быть получена проще с помощью Серии I Продвинутых Прогрессивных Матриц.

Продвинутые Прогрессивные Матрицы (ППМ) позволяют решить следующие задачи: (i) диагностика наиболее развитой формы продуктивной способности; (и) оценка распределения тестовых баллов для верхних 25% общей популяции; (ш) более точное измерение скорости интеллектуальной работы испытуемого. Серия I включает только 12 задач. Она используется главным образом для задания проблемного поля и обучения методу работы. Но ее можно использовать и для быстрого получения индекса продуктивной способности или эффективности, проводя тестирование в условиях ограниченного или не ограниченного времени. Обычно за Серией I сразу же следует Серия II, хотя иногда испытуемым позволяют взять первую серию домой для практики за несколько дней до тестирования. Серия II включает 36 заданий, расположенных в порядке возрастания трудности. Соответственно, испытуемому не нужно пробовать решить каждую задачу прежде, чем прекратить работу. При тестировании с ограничением времени Серия II может быть использована для оценки "интеллектуальной

эффективности". Хотя интеллектуальная эффективность, в общем, тесно связана со способностью к дисциплинированному мышлению, но бывают и исключения, так что эти две способности не следует смешивать.

Индекс интеллектуальной эффективности особенно полезен для оценки пригодности человека к работе, требующей быстрых и точных суждений, или, что часто требуется в клинической практике, для оценки заторможенности мышления больного.

Проведенная в 1992 году Стандартизация ППМ показала, что на сегодняшний день, вследствие обсуждавшегося ранее повышения норм при смене поколений, ППМ дают отличную дифференцировку по всей взрослой популяции (а не только по верхним 20%) и такое распределение показателей, которому многие могут только позавидовать. Тем не менее, его нельзя безоговорочно рекомендовать для широкого использования. Причина такой осторожной рекомендации отчасти в том, что циклический формат СПМ предоставляет испытуемому пять возможностей понять что от него требуется, и выработать подходящий метод работы. Таким образом, если предполагается, что отдельным испытуемым пойдет на пользу практика, то следует предпочесть СПМ. Другими достоинствами СПМ являются:

-испытуемые с низкими оценками сталкиваются с меньшим числом заданий недоступного для них уровня сложности и, как следствие, получают более позитивный опыт,

- для СПМ собрано больше исследовательских данных, включая отдельные нормы для разных суб-популяций,

-поскольку тестирование проводится без ограничения времени, то такая ситуация является менее стрессовой для испытуемых.

РАЗРАБОТКА И СТРУКТУРА ОТДЕЛЬНЫХ ЗАДАНИЙ

Первые серии экспериментально использовавшихся Матриц представляли собой девяти фигурные композиции, напоминавшие тестовый материал Спирмана, с той лишь разницей, что если Спирнан просил испытуемых идентифицировать правило, которое лежало в основе композиции, то в матрицах Равена задача состояла в нахождении пропущенной фигуры. Взрослые легко понимали такую задачу, даже если они не были способны ее решить. Маленькие же дети, напротив, часто не могли уяснить, что же от них требуется, даже если им объясняли суть проблемы. Когда похожие задачи были предъявлены им в виде сплошного структурированного рисунка с вырезанным фрагментом (как в Серии А), те же самые дети увидели, что же им нужно делать. Было показано, однако, что опыт работы с задачами такого типа не помогал им решать задачи, построенные на взаимосвязях между четырьмя фигурами. Хотя представлялось вполне возможным представить ход возрастного развития интеллектуальных способностей как относительно равномерный процесс, было обнаружено, что решение задач типа тех, которые включены в Серию В, нуждалось в увеличении зрелости интеллектуальной деятельности более чем на один "порядок". Также выяснилось, что опыт решения последовательности задач одного "порядка" совсем не обязательно обучает ребенка решению задач другого "порядка". Более новые и систематические исследования (Andrich, 1989; Guthke and Lehwald, 1984) подтверждают это наблюдение. Упражнение, опыт и обратная связь уменьшают обычно только те ошибки, которые сделаны до последнего правильно решенного задания.

На рисунке 07 изображена "конкретная" задача, которая встает перед каждым человеком, в буквальном или переносном смысле "пересекающим дорогу". Он может быть использован для иллюстрации решений разного "порядка", возможных на разных уровнях восприятия.

45 Сравнительное исследование детских ответов на задания такого типа показали, что выбираемое решение определяется контекстом того "проблемного поля", в котором ребенок постигает задачу (Miller and Raven, 1939).

Рисунки О8 и О9 изображают принципиально ту же самую задачу, что и рисунок О7. Разница только 8 форме представления. На рисунке О8 задача представлена в форме дискретных объектов, а на рисунке О9 - через абстрактные символы. Отличие последних от изображенного на рисунке О7 - в способах построения умозаключения, зависящих от концептуального поля, в контексте которого рассматривается проблема. Для рисунка О8 это поле задается непосредственным восприятием, а для рисунка О9 - ассоциативным воспроизведением. Чтобы как следует уразуметь задание на рисунках О8 или О9, необходимо спросить: Что представлено на рисунке? Что из этого может следовать? Какой из выводов будет правильным и почему?

Рис. О7. "Конкретная" задача, требующая завершения.

Мы можем следующим образом проиллюстрировать важность проблемного поля для выбора правильного решения:

Рис. О8. Дискретные фигуры.

Рис.О9. Абстрактные символы.

46

Наиболее редкий способ реагирования на задачи такого типа может быть обозначен как пассивное восприятие. Он встречается только у очень маленьких или очень глупых детей и у очень старых людей. Фигуры не воспринимаются ими как какая-то проблемная ситуация. Такие испытуемые просто смотрят на то, что им предъявляют, и не понимают, что отсюда следует.

Более частым способом ответа маленьких детей или "примитивных" людей является активное повторение или воспроизведение структуры. Иногда незавершенная матрица описывается даже как "рисунок на обоях". В редких случаях повторяющаяся структура такого типа может быть ориентирована диагонально по отношению к наблюдателю, как показано на рисунке О10. Чаще же структура ориентирована горизонтально или вертикально, как на рисунке 011.

Еще более часто встречаются ответы, обнаруживающие серийные изменения в проблемном поле. Это может быть одномерное изменение, как в случае арифметической прогрессии, изображенной на рисунке О12. Однако, более типичным способом ответа, особенно у взрослых испытуемых, является тот, который производит "продуктивные" изменения проблемного поля. Такие изменения проиллюстрированы численными значениями геометрической прогрессии на рисунке О13, хотя это отнюдь не единственный способ, посредством которого такие взаимосвязи могут быть выражены в матрице.

Люди склонны думать, что если они логически обосновали одну линию рассуждения, то все другие решения кроме их собственного должны быть ошибочными. Прежде чем принять такого рода вывод, мы должны выяснить не только содержание проблемы, но кое-что и о контексте, или "поле" выделенной проблемы. Если, например, мы представляем рисунок О7 как

схему реальных автодорог и опасных участков (кружки), то логика может подсказать идеальное решение в виде "развязки типа кленового листа". Если это не практично, то "круговая" развязка может быть наилучшим возможным решением.

В тесте Прогрессивных Матриц последовательность предъявления заданий развертывает соответствующее проблемное поле постепенно и, таким образом, обеспечивает обучение данному методу работы. И сама умственная деятельность, и та ступень интеллектуальной организации, на которой находится испытуемый, одновременно определяют структурный "порядок" возникающего проблемного поля. Выбираемое решение дает представление о качестве интеллектуальной организации и, следовательно, представляет значительный психологический интерес.

В этой связи важны пространственные взаимоотношения между незавершенной матрицей и альтернативными вариантами решения, так как местоположение последних влияет на выбор испытуемого. Пилотажные исследования показали, что более удовлетворительным расположением альтернативных решений является позиция под матрицей, а не сбоку. Кроме того, Миллер и Равен (1939) пришли к выводу, что:

"Частота выбора одной из альтернатив частично зависит от ее собственной позиции, и частично - от взаимного расположения других вариантов решения. Испытуемые часто воспринимают матрицу и набор вариантов решения как целое. Внимание сосредотачивается на разрыве в матрице, который должен быть заполнен, а частота, с которой выбирается определенная альтернатива, зависит от объема уделяемого ей внимания. Было обнаружено, что испытуемые имели склонность к более внимательному изучению всех возможных вариантов решения, если заведомо ошибочные фигуры располагались на наиболее удобных для рассматривания позициях. Если знакомая фигура, повторяющая, например, часть матрицы, расположена в центре внимания, то тогда потребуется меньше усилий, чтобы изучить все варианты решения в поисках правильного ответа. Когда испытуемый имеет дело с заданиями умеренной трудности, то расположение вариантов ответа оказывает незначительное (или вовсе никакого) влияние на процент правильных ответов, но когда задачи становятся слишком трудными для него, то правильные ответы угадываются чаще, когда они расположены в наиболее выгодной позиции."

Имея в виду что контекст, или проблемное поле оказывает влияние на порядок предпочтения альтернатив ответа, уверенное умозаключение по аналогии предполагает достижение определенной степени интеллектуальной сложности, которую редко можно встретить у маленьких детей. Однако, поскольку большинство взрослых полностью полагаются именно на этот способ рассуждения, им трудно представить себе, что дети могут думать совершенно иным образом.

Научение Методу Работы

Важно понять причины, побудившие авторов Прогрессивных Матриц придать тесту циклический формат.

Как указывает название теста, внешняя форма заданий побуждает испытуемых воспринимать каждое из них в рамках определенной мыслительной схемы, уделять внимание и рассматривать определенные детали изображения. Она также побуждает испытуемых к определенным способам размышления (смотри Jacobs and Vandeventer, 1972). Следовательно, последовательность заданий обеспечивает "научение методу мышления" и при выполнении Стандартной серии Матриц испытуемые получают пять возможностей для формирования смысла этого метода. Таким образом, тест позволяет диагносцировать тенденцию учиться через опыт, который является более логичным определением "потенциала обучаемости", нежели такое использование ПМР, где фактически оценивается тип научения посредством инструкции.

48 Именно по этой причине "натаскивание" на работу с ПМР дает меньший эффект, чем при работе со многими другими тестами, и это объясняет также эффект минимизации культурного неравенства. Тестирование с ограничением времени, а также использование сокращенных вариантов, ставят в невыгодное положение именно тех испытуемых, кто больше других выиграл бы от самообучения в процессе решения оригинальной последовательности заданий. Так Делено (de Lemos, 1989) установил, что (а) различия в средних оценках детей из англо­говорящей и неанглийской среды возрастали, если использовалась процедура тестирования с ограничением времени; (б) корреляции между тестовыми оценками, полученными с ограничением и без ограничения времени, ниже у детей из неанглийской среды.

Хотя способ конструирования теста и минимизирует эффект "натаскивания" и опыта прошлой работы с похожими тестами, тем не менее он не является абсолютной защитой от получения недостоверных результатов. Когда результаты теста могут оказать серьезное влияние на жизнь испытуемого, желательно проводить тест в индивидуальном порядке, и не в группе. В таких условиях проще выявить тех, кто просто заучил правильные ответы, тех, кого тестовые задачи приводят в замешательство, или тех, чье культурное происхождение снижает их заинтересованность в точности собственных ответов.

ФОРМАТ АНАЛИЗА ТЕСТОВЫХ ЗАДАНИЙ

Следуя современной терминологии, в ПМР изначально была заложена такая форма анализа тестовых пунктов (заданий), которая во всех отношениях отвечала требованиям трехпараметрической модели анализа тестовых данных Раша (Rasch) . Однако, вместо использования математических индексов применяли визуальный анализ характеристических кривых отдельных заданий. Такого рода исследования, проведенные с особой тщательностью, действительно позволяют больше узнать о природе измеряемой способности и о возможностях дальнейшего улучшения теста.

7 Читателям может быть будет интересно узнать, что Раш впервые тестировал свою модель именно на Матрицах (Rasch, 1947)

На психологическом уровне, анализ заданий должен продемонстрировать, что способности, необходимые для решения данного задания, надстраиваются над теми, которые требовались для решения предыдущих заданий. Однако, даже если и можно показать, что некоторые способности нужны для формирования остальных, тем не менее может случиться так, что для решения более простых и более сложных заданий потребуются разные психологические процессы.

Рисунок О14 показывает характеристические кривые (ХКЗ) для трех гипотетических заданий шкалы. Вертикальная ось показывает процент обследованных, правильно ответивших на данное задание, а горизонтальная показывает общую тестовую оценку. Отдельные кривые отражают процентную долю общей выборки, правильно решивших данное задание, как функцию итоговой результативности. В целом рисунок показывает, как будут вести себя удачно и неудачно подобранные задания, если каждый пункт теста оценивает одну и ту же, но последовательно прогрессирующую, интеллектуальную функцию.

Кривая А показывает идеальное поведение психологически эффективного тестового задания, имеющего уровень сложности ниже среднего. Кривая В показывает поведение столь же эффективного, но более сложного задания. Кривая С отражает поведение неэффективного задания такой же сложности, как и кривая В. Пунктирная линия на уровне 12.5% показывает частоту случайного выбора правильной фигура из восьми предъявленных вариантов фигур.

Рисунок О15 показывает, как должен вести себя идеальный набор заданий. Характеристические Кривые Заданий должны быть вертикальны и сдвинуты друг относительно друга на равное расстояние. В этом случае тестовые задания сформируют настоящую шкалу интервалов. Будет достигнуто абсолютно однозначное соответствие между полученным испытуемым общим баллом и последним правильно решенным им заданием.

ХКЗ для задания А на графике О14 показывает тенденцию, что испытуемые отвечают более-менее случайным образом до тех пор, пока их общая оценка не достигнет некоего определенного уровня. С момента, когда они начинают содержательно включаться в задачу, кривая монотонно и круто возрастает с увеличением суммарной шкальной оценки. В диапазоне 40-60% скорость изменения вероятности правильного решения с увеличением общего балла остается практически неизменной. На уровне выше 80-90% эта скорость изменяются также, как и на уровне 10-20%. Достижение уровня 100% означает отсутствие дальнейших ошибок, потому что испытуемые с более высокими тестовыми оценками уже не выбирают ложных альтернатив. Резкий подъем кривой в среднем диапазоне предполагает, что существует некая важная процессуальная • характеристика, необходимая для решения данного задания, которая подключается именно на этом, измеряемом общим тестовым баллом, уровне развития

продуктивной способности. До достижения этого уровня способности практически никто не выбирает правильную фигуру- После того как он достигнут, все меньше и меньше людей выбирают ошибочный вариант.

ХКЗ для задания В - столь же эффективного как А, но более сложного - показывает такую же крутую прогрессию от случайных угадываний до 100%-го успеха. Однако, для его решения требуется значительно более высокий уровень развития способности решать задачи.

ХКЗ для задания С иллюстрирует четыре причины, почему данное задание может быть неэффективным тестовым пунктом:

а. Некоторое количество испытуемых, чьи общие оценки не предполагают, что они способны решить данное задание, тем не менее выбирают правильный ответ. Наиболее вероятное объяснение этого заключается в том, что правильный ответ, в силу своего расположения или общей планировки, привлекает внимание испытуемого сильнее, чем альтернативные ответы.

б. Те испытуемые, чья общая тестовая оценка чуть ниже уровня, при котором они должны

быть способны правильно решать данную задачу, начинают выбирать другой ответ, так что процент правильных ответов опускается до полосы 12.5% - как при случайном угадывании. Это может быть потому, что одна из ошибочных фигур стала более привлекательной для испытуемых с этим уровнем способностей.

в. Среди тех, для кого данное задание становится психологически проблетичным, процент

правильного решивших растет только до 50%-го уровня. Для значительного диапазона способности кривая колеблется вокруг 50%-го уровня. Ошибочные выборы, совершаемые на этом уровне способности, могут указывать на то, что при решении данного задания испытуемые более или менее случайно выбирают между двумя очень похожими фигурами.

г. Выше 60%-го уровня успешности кривая растет медленно и никогда не достигает уровня

100%. Даже среди наиболее способных испытуемых есть такие, которые не могут решить задачу правильно.

Отметим, что область под кривой С приблизительно равна области под кривой В. Из этого следует, что нормативные индексы сложности этих двух заданий должны быть сходными, так что задания могут показаться одинаково трудными и одинаково удовлетворительными. Кроме того, нормативные индексы сложности не отразят того факта, что эти кривые пересекаются, то есть эти задания представляют различную сложность для людей с разными общими тестовыми оценками.

На рисунке О14 не показаны две разновидности откровенно неэффективных тестовых заданий - такие, которые решаются всеми испытуемыми, и те, которые не решаются никем.

Хотя данная измерительная модель предполагает, что создатель теста должен стараться подобрать задания с равноудаленными друг от друга ХКЗ одинаковой формы, сделать это практически невозможно. Некоторые ХКЗ продолжают пересекать другие. На одном уровне это значит, что необходимо применять трехпараметрическую модель Раша для аппроксимации данных. Однако на другом уровне это предполагает, что люди с высокими и низкими тестовыми оценками решают поставленные перед ними задачи качественно различными способами. Эта гипотеза подтверждается бимодальными распределениями, приведенными в Исследовательском Приложении №1. Однако, полученный набор ХКЗ показывает также, что начальные перцептивные задания формируют часть континуума когнитивных способностей, которые надстраиваются друг над другом.

В Исследовательском Приложении №4 приведено исследование Эндрич и Давс, в котором трехпараметрическая модель Раша успешно описывает тестовые данные. Фишер

(Fischer, 1988) и другие обсуждали это требование. Наш собственный вклад в эту дискуссию состоит в наблюдении, что ХКЗ позволяют обнаружить причины, почему тесты подтверждают или не подтверждают модель. Кроме того, Хэмблтон (Hambleton, 1988, 1989) продемонстрировал, что многие из используемых индексов не обладают стабильностью (завися от таких вещей как объем выборки и специфика тестируемой популяции) и что большая часть аргументов зависит от строгости критериев, устанавливающих "соответствие" или "несоответствие" модели Раша.

Применение факторного анализа к тестовым заданиям становится все более модным, и ввиду этого следует сказать несколько слов предостережения. Важно отметить, что и психологическая модель продуктивной способности, и техника шкалирования, использованная для создания ПМР и СШМХ, несовместимы со шкалами, конструируемыми при помощи факторного анализа для достижения внутренней согласованности. Если рассмотреть взаимные корреляции пунктов теста, построенного в соответствии с изображенной на рисунке О15 моделью, то будет обнаружена крайне высокая корреляция между соседними пунктами (поскольку на основании успеха или неуспеха при решении предыдущего задания можно предсказать правильность решения последующего) и крайне низкая корреляция между пунктами, расположенными на противоположных концах шкалы (поскольку успешное решение простейших заданий ничего не говорит о том, будет ли успешным решение сложных). Из этого следует, что поскольку пункты упорядочены по сложности, матрица корреляций будет такова, что высокие значения будут расположены вокруг диагонали, уменьшаясь практически до нуля по мере удаления к углам. Такая матрица не подлежит анализу с использованием модели "генеральных факторов с коррективами" или модели "независимых факторов" (Raven et al, 1971). Следовательно, такой анализ мало что скажет нам о природе способностей, измеряемых ПМР и СШМХ. (Этот комментарий не относится, конечно, к применению факторного анализа к батареям тестов, включающих в себя, в числе прочих, ПМР и СШМХ).

ИСТОРИЯ СОЗДАНИЯ И ТЕОРЕТИЧЕСКИЕ ОСНОВЫ

СЛОВАРНЫХ ШКАЛ

Невербальные тесты часто ошибочно считают тестами интеллекта, тогда как на самом деле они измеряют только некоторые аспекты интеллектуальной деятельности. Причина использования словарных шкал совместно с Прогрессивными Матрицами состоит в том, что они дополняют друг друга. Прогрессивные Матрицы направлены главным образом на оценку продуктивной способности, а вербальные тесты измеряют репродуктивные способности, или объем эрудиции. Равен и Уолшоу (Raven and Waishaw, 1944), обосновывая применение описанных ниже словарных тестов, пишут:

"Единственным оправданием для конструирования шкал, в которых словарные тесты очень тесно завязаны с другими тестами, является то, что теоретически невозможно создать чисто продуктивный или чисто репродуктивный по своей природе тест... Тем не менее... мы можем создавать такие тесты, что для соответствующей категории испытуемых диагносцируемый процесс будет единственным процессом, лежащим вблизи границы баланса возможного и невозможного события. Также как мы в состоянии создать тесты, преимущественно продуктивные по своей природе, мы можем сконструировать и такие тесты, в которых сам ход тестирования активизирует столь простые и генерализованные продуктивные процессы, что для их успешного выполнения оказывается необходимым лишь воспоминание информации, относящейся к прошлому опыту. Поэтому исключительно полезно оказывается рассматривать результаты этих тестов отдельно от результатов тестов, в процессе решения которых значимую роль играют продуктивные способности."

Многие исследования, где применяли Прогрессивные Матрицы, дополнялись также и словарными тестами. В некоторых случаях использовалась Словарная Шкала Векслера (например, Desai, 1955; Morresey, 1974). Во многих других пользовались Словарной Шкалой Милл Хилл, несмотря на неудачу ряда тестовых агентств с продвижением этого теста на рынок за пределы Великобритании. Примерами таких исследований являются работы Frost (1963), Payne (1962), Holmes (1980), Peterson (1971).

Словарные Шкалы Равена имеют преимущество перед субшкалами других тестов в том, что они позволяют оценить широкий диапазон способности, доступны для проведения в форме открытых (свободный ответ) или закрытых (выбор ответа среди нескольких альтернатив) вопросов, в устной или письменной форме. Кроме того, форма с закрытыми вопросами может обсчитываться автоматически.

ВАРИАНТЫ СЛОВАРНЫХ ШКАЛ

Как и в случае с Прогрессивными Матрицами, существует основная версия словарного теста, на базе которого созданы и несколько дополнительных. Основная форма представляет собой версию Словарной Шкалы Милл Хилл с открытыми вопросами, состоящую из 88 слов, разделенных на два параллельных набора, в каждом из которых 44 слова упорядочены по степени нарастания трудности.

На этой основе были созданы версии для Младшего и Старшего возраста. В первой были убраны 22 наиболее трудных слова с тем, чтобы избавить детей от столкновения со слишком большим числом незнакомых им слов. Из последней были удалены 20 самых простых слов. В обеих версиях половина слов предъявляется в форме открытых вопросов, а другая половина - в виде закрытых вопросов. Выбирая, какую из половин предъявлять в форме открытых или закрытых вопросов, можно создавать параллельные формы теста. Более детально они описаны ниже.

Как уже объяснялось ранее, Цветные Прогрессивные Матрицы были разработаны на основе Стандартных Прогрессивных Матриц путем включения дополнительных простых заданий и исключением более трудных. Подобным же образом создавалась и производная версия Словарной Шкалы Милл Хилл, ныне известная как Словарная Шкала Крайтон.

Сравнение Форм с Закрытыми и Открытыми Вопросами

Часть теста, состоящая из закрытых вопросов, предназначена для измерения репродуктивной способности с минимальным вовлечением продуктивных процессов. Хотя такой подход имеет много преимуществ и неоднократно использовался другими авторами (смотри, например, Shipley, 1940), он имеет также и несколько внутренне присущих ему недостатков. В частности подход, основанный на множественном выборе, не позволяет проводить качественное различение, так что тестовые баллы становятся менее информативными по мере приближения к верхнему концу шкалы способностей.

Открытые Вопросы, или Определения позволяют осуществлять более детальную качественную оценку знания и использования слов.

Разновидности Словарной Шкалы Милл Хилл

На данный момент существуют девять версий Словарной Шкалы Милл Хилл. Форма СШМХ Открытые Вопросы, или Определения.

Эта форма состоит из 88 слов-заданий в форме открытых вопросов. Не существует форм для младшего или старшего возраста, а также параллельных форм. СШМХ, Формы 1 и 2 для Младшего возраста,

В версии для Младшего возраста, опущены 22 наиболее трудных слова. Половина слов представлена в виде открытых вопросов, другая половина имеет формат закрытых вопросов. В Форме 1 первая половина заданий (Серия А) содержит открытые вопросы, а вторая половина (Серия В) - закрытые вопросы. В Форме 2 наоборот - Серия А предъявляется в формате закрытых вопросов, а Секция В - в формате отрытых вопросов,

Версии для Младшего возраста рассчитаны на детей от 11 до 14 лет и могут использоваться как для индивидуального, так и для группового тестирования. В среднем, следует ожидать повышение успешности выполнения примерно на 3 слова за каждый год взросления.

СШМХ, Формы 1 и 2 для Старшего возраста.

В версии для Старшего возраста опущены 20 самых простых слов. Также, в Форме 1 первая половина заданий (Серия А) содержит открытые вопросы, а вторая половина (Секция В) - закрытые вопросы. В Форме 2 задания предъявляются в обратном формате.

Формы 1 и 2 для Младшего и Старшего возрастов являются наиболее распространенными версиями данного теста.

Иногда возникает необходимость использовать части тестов, содержащие только открытые вопросы, либо только закрытые вопросы из версий для Младшего или Старшего возраста. В таких ситуациях допустимо оценивать суммарный тестовый балл, который получил бы ребенок в случае использования комбинации обеих этих частей, по имеющимся нормативным таблицам.

СШМХ, Форма со Всеми Закрытыми Вопросами для Старшего Возраста, с быстрым подсчетом тестовых баллов (самокопирующиеся бланки).

Была создана для использования совместно с Профессиональной версией Продвинутых Прогрессивных Матриц.

СШМХ, Формы со Всеми Закрытыми Вопросами для Младшего и Старшего Возраста. Применимы только на территории США.

Этот тест позволяет исследователю получать быструю оценку коммуникативных способностей испытуемого, а также, что весьма полезно для качественного анализа ответов, более детальную информацию об употреблении слов, нарушениях мыслительных процессов и использовании языка для организации прошлого опыта, планов на будущее и текущей деятельности. Он включает в себя каждое пятое слово оригинальной СШМХ и проводится в устной форме с возможностью получения дополнительных разъяснений. Кроме определения каждого слова испытуемых просят привести и пример его использования в предложении. Такая качественная информация может быть особенно полезна в клинических исследования.

Словарная Шкала Крайтон

В этой версии используются 40 новых слов, подобранных в дополнение к 40 простейшим словам Словарной Шкалы Милл Хилл, а наиболее трудные слова опущены. Ее предлагается использовать для тестирования детей до 11 лет, а также лиц более старшего возраста, получающих низкие оценки. Тест следует проводить в устной форме. Если испытуемый успешно справляется с подавляющим большинством из предложенных ему заданий, то вслед за выполнением первой половины СШК он может переходить непосредственно к работе со Словарной Шкалой Милл Хилл.

54 Более детальная информация относительно данных версий словарных шкал, а также их отношения к Прогрессивным Матрицам, содержится в Части II настоящего Руководства. При оформлении заказа на данные тесты пользователей просят четко указывать, какая именно форма им необходима, а при представлении полученных результатов - сообщать, какую форму они использовали.

О СОЗДАНИИ СЛОВАРНЫХ ШКАЛ

Чтобы иметь в процессе отработки методики достаточную свободу выбора и избежать субъективности, из Краткого Оксфордского Словаря Английского Языка были отобраны 500 слов, расположенных через равные интервалы друг от друга. Детям от 5 до 14 лет предъявляли по 50 случайных слов из этого набора, в результате чего определили приблизительный порядок трудности отобранных слов и выяснили, что исходный набор содержал слишком много простых слов. Еще один список из 150 слов был отобран из Тезауруса Роже (Roget's Thesaurus). С этой целью по оглавлению тезауруса были определены номера страниц с фиксированным межстраничным интервалом, а затем два эксперта независимо друг от друга прочитывали каждую отобранную страницу до тех пор, пока не встречали слово, которое, по их мнению, должен знать любой интеллигентный взрослый человек независимо от его профессии, но которое может вызвать его затруднения при определении.

Из общего списка в 650 слов для экспериментальной шкалы были отобраны 112, каждое из которых имело синонимы того же порядка сложности. Слова, не прошедшие этот отбор, были упорядочены по возрастающей сложности и организованы в группы по четыре. Они использовались в качестве ложных вариантов ответов (дистракторов), дополняясь синонимами слов соответствующей сложности. Экспериментальные серии предъявлялись в формате открытых вопросов и закрытых вопросов выбора группам взрослых и детей с самым широким диапазоном вербальных способностей. Выяснилось, что форма с открытыми вопросами доступна для всех испытуемых, а форма с закрытыми вопросами доступна только тем людям старше 10 лет, которые не испытывают затруднений при чтении и письме.

Для каждого слова из экспериментальной шкалы сохраняли каждый вариант ответа. Все ответы были организованы в порядке убывания степени сходства с определением, приведенным в Оксфордском Словаре, вплоть до таких, которые показывали полное отсутствие понимания значения слова. Отмечались и на качественном уровне анализировались индивидуальные различия в определении и использовании слов. С целью количественного сравнения ответы испытуемых оценивались как "правильные" или "неправильные". Была признана неудовлетворительной идея использования удвоенных баллов для хороших определений или половинных баллов для сомнительных объяснений.

Такие слова как "колоссальный" или "вонючий", которые характерны для разговорной речи, или "рок" и "категория" - слова широко распространенные, но плохо понимаемые, были исключены из Шкалы. Остальные были организованы таким образом, чтобы обеспечивать приблизительно равное увеличение полученных баллов с возрастом. Частоту, с которой выбирались синонимы, сравнивали с частотой правильного определения слова. На основании распределения ошибочных ответов в версии теста с закрытыми вопросами можно было исключить любое слово, которое выбирали так редко, что его использование теряло смысл, или так часто, что оно "затмевало" синоним. В каждой группе из четырех возможных дистракторов эквивалентной трудности отбрасывалось наименее подходящее слово, а три оставшихся сохранялись. Затем добавлялись два новых слова. Они были выбраны с учетом ошибочных определений слова-стимула (а) в результате смешения его со сходно звучащим словом, или (б) как отражение наиболее типичного определения, которое дают люди, не имеющие ясного представления о значении слова. Таким образом группа, из которой нужно было сделать выбор, состояла из шести слов примерно равной длины и одинаковой степени сложности - синонима, трех случайных слов равной сложности и двух слов, имевших высокую вероятность выбора при использовании стратегии случайного угадывания. Было установлено, что пространственное расположение этих шести слов в виде двух колонок по три слова в каждой, расположенных ниже стимульного слова, обеспечивает наиболее равномерное распределение выборов.

В итоге, после дальнейших испытаний были оставлены 88 слов, расположенные в порядке возрастания сложности. Они были разделены на два уравненных по сложности параллельных набора по 44 слова.

Порядок предъявления слов пересматривался в 1976 и 1980 годах. В процессе стандартизации этого теста в Америке, проведенной в 1984 и 1988 годах, два слова из Словарной Шкале Милл Хилл и одно из Словарной Шкале Крайтон были изменены в соответствии с американским словоупотребелением. Более подробное описание этих изменений можно найти в разделе настоящего Руководства, специально посвященного СШМХ.

ПРИЛОЖЕНИЕ

Воспроизводимость психометрических свойств ПМР на разных социо-экономических и этнических группах, постоянная динамика в увеличении оценок со временем и сходство нормативных данных, полученных в разных культурных популяциях в один и тот же момент времени — все это позволяет предположить, что ПМР измеряют что-то такое, что имеет фундаментальное психологическое значение.

В Приложении будут суммированы самые последние данные, убедительно свидетельствующие о научном статусе и практической важности "продуктивной способности".

Способность ПМР измерять и выявлять фундаментальные свойства когнитивных процессов заложена в самой их конструкции, использующей Теорию Выбора Ответов (Item Re­sponse Theory).

В той степени, в какой Характеристические Кривые шкальных Заданий (ХКЗ) действительно демонстрируют ступенчатый рост вероятности решения какого-то одного задания с увеличением вероятности решения более легких и более трудных заданий, с такой же достоверностью можно утверждать, что, независимо от содержания заданий, все они составляют единый континуум.

Имея в виду, что содержание заданий изменяется от простых перцептивных ("гештальт") заданий, через простые аналогии к заданиям, требующим привлечения сложных взаимодействующих стратегий для спецификации проблемной ситуации, выделения "релевантных" элементов и способа их взаимосвязи, следует признать, что "восприятие" и "мышление" составляют часть единого психологического континуума. Говоря другими словами, восприятие не является непосредственным зрительным процессом, а включает и понятийные операции. Оно нуждается в выделении фигуры из фона и в различении важных элементов от несущественных. Именно по этой причине будет ошибкой считать, что ПМР измеряют "способность к решению задач", поскольку, как не уставал подчеркивать в своем принципе ноэгенеза Спирман, способность к выделению и разрешению проблем зависит от одновременного осмысления целого, чтобы знать, что искать в составляющих его частях (т.е. чтобы "анализировать"), и понимания, какие части нужно выделить из фонового "шума", чтобы иметь возможность "увидеть" целое.

Следовательно, набор ХКЗ для ПМР демонстрирует, (а) что "существует" нечто, что условно может быть названо "общей концептуальной способностью", (б) что ПРМ проникает в эту способность, и (в) качественно различные типы заданий, из которых состоит тест, формируют часть общего континуума. Эти качественно различные типы заданий не измеряют "разные вещи". Также как и понятие "твердость" нельзя опровергнуть тем фактом, что существуют разные вещества, обладающие разной степенью выраженности этой

56 характеристики, так и тот факт, что задания в ПМР различаются по своему содержанию, не дает основания усомниться, что их решение обеспечивается разными уровнями "когнитивной способности". Способность решать задания одного типа увеличивается постепенно и в параллель со способностью решать задания других типов, В мышлении не происходит каких-то метаморфоз при переходе способности решать один тип заданий к последующим по сложности заданиям.

Здесь необходимо учитывать такое возражение, что приверженцы факторного анализа выделяют в отдельные факторы задания, решаемые посредством "восприятия", "рассуждения" и "анализа". В другой работе (Raven, Ritchie and Baxter, 1971) нами было показано, что корреляционная матрица, полученная путем взаимной корреляции пунктов усовершенствованной шкалы Гутмана (Guttman) или шкалы Раша, не может быть подвергнута анализу ни методом главных компонентов, ни методом ортогонально или наклонного вращения. Природа корреляционной матрицы определяется свойствами шкал, построенных с помощью Теории Выбора Ответов. Знание того, что кто-либо правильно решает очень легкое задание, не позволяет правильно предсказать, будут ли решены очень трудные тестовые задания. Таким образом, корреляция между очень легким и очень трудным пунктами шкалы будет стремиться к нулю. С другой стороны, близкие по сложности задания имеют высокий коэффициент корреляции: успешность или неуспешность решения одного задания позволяет с высокой вероятностью предсказать результат решения наиболее сложного задания. Поэтому корреляционная матрица, полученная в результате взаимной корреляции упорядоченных по сложности заданий шкалы, будет состоять из значений, стремящихся к единице вокруг диагонали матрицы и приближающихся к нулю по мере приближения к её дальним углам. Корреляционную матрицу нельзя переделать путем умножения и добавления весовых коэффициентов к любому набору факторов, число которых меньше чем количества исходных заданий шкалы. Если всё-таки обработать такого рода данные посредством факторного анализа, то в результате получится серия факторов "мощности". Они будут охватывать задания "сходной" сложности, поскольку именно соседние задания имеют высокую корреляцию. (Средняя внутри факторная корреляция зависит от числа выделенных факторов). Но здесь и подкрадывается возможность неверного истолкования этих результатов. Сходные по сложности задания преимущественно, хотя и не повсеместно, обладают и сходством по содержанию. На самом деле, эти факторы включают некоторое количество более легких заданий качественно другого типа, осваиваемого в более раннем возрасте, и ряд более трудных заданий, освоение которых обычно происходит позднее, чем основная масса попавших в кластер заданий. Но эти "неподходящие" задания можно легко не заметить, когда дается наименование фактора. В результате, исследователи называют эти факторы по доминирующему признаку входящих туда заданий, хотя на самом деле они являются факторами мощности.

После этого отступления мы можем вернуться в сформулированному нами выводу, что основанный на Теории Выбора Ответов анализ заданий ПМР действительно показывает существование континуума в "когнитивной (истинно 'концептуальной') способности" и что этот континуум может быть оценен набором заданий, охватывающих диапазон с легких "перцептивных" и до сложных "аналитических" заданий.

Этот вывод недавно получил дополнительное подтверждение и обобщение в исследовании Стайлза и Эндрича (Styles and Andrich, 1994).

Используя рашевский вариант Теории Выбора Ответов, Стайлз и Эндрич отобразили результаты решения трех заданий Пиаже - заданий на равновесие, на химические комбинации и корреляции - на едином графике с набором ХКЗ для ПМР.

Выяснилось, что способность решать эти задания Пиаже возрастает постепенно и идет в ногу со способностью решать задания ПМР сходной сложности. И опять мы приходим к заключению, что способность решать качественно разные типы задач развивается поступательно и не претерпевает каких-то качественных метаморфоз при переходе от решения

задач одного типа к задачам другого типа, гипотезы о которых продолжают высказываться время от времени. Это, конечно, не исключает возможности резких скачков в индивидуальном развитии и деятельности, когда ребенок внезапно "схватывает идею".

Наряду с исследованием Эндрича и Стайлза имеются и другие, которые также подтверждают, что ПМР оценивают континуум фундаментальной психологической значимости. Они также указывают, что измеряемую способность, как бы её ни называть, нельзя просто отнести к предмету, имеющему чисто научный интерес. Из работы Эндрича и Стайлза следует, что оценки по ПМР отражают способность решать сложные реалистические, практические проблемы самого разного типа. Можно, наверно, предположить, что рост тестовых оценок на протяжении прошлого века непременно должен оказать реальное влияние на способность общества справляться с ситуациями, где нужно идентифицировать и решить сложные проблемы.

Совсем другое направление работ, которое также приходит к выводу, что тест ПМР диагносцирует базовые психологические способностей, включает исследования с измерением времени реакции и времени наблюдения (Jensen et al., 1988; Veraon, 1989, 1991, 1993; Deary, 1993, 1995).

Верной и Дири в своих обзорах независимо пришли к выводу, что ПМР имеет значимые, но не очень высокие корреляции с:

•Низкой скоростью коркового метаболизма глюкозы. Поэтому те, кто имеет высокие оценки по ПМР, должен работать более эффективно.

•Скоростью нереной проводимости.

•Некоторыми - но далеко не всеми - измерениями скорости реакции. (Многие измерения времени реакции не коррелируют с ПМР, а в исследованиях, где сообщалось о самых высоких корреляциях, использовали самые трудные и интеллектуально нагруженные вопросы. Следовательно, нельзя сделать общий вывод, что ПМР и скорость реакции измеряют одно и то же.)

•Сильной корковой (ЭЭГ) реактивностью (усредненные вызванные потенциалы) на неожиданные зрительные стимулы и слабой корковой реактивностью - на запускаемую наблюдателем стимуляцию.

•Уровнем кальция в крови, который сам связан с нервной проводимостью.

Наибольшее впечатление производят, однако, данные Дири, который показал, что ПМР -и продуктивная способность в целом - имеют более высокую (порядка 0.6) корреляцию с количеством времени, которое нужно для определения с 85% точностью более длинной из 2 сильно различающихся по длине линий, т.е. с "временем наблюдения". (Дири специально подчеркивает тот момент, что измерение времени наблюдения НЕ включает требования, чтобы испытуемый работал как можно быстрее. Процедура измерения состоит в варьировании времени экспозиции линий и нахождении такой величины, при которой испытуемые неспособны к точному различению.)

Как и продуктивная способность и в отличии от репродуктивной способности, время наблюдения имеет тенденцию к "уменьшению" с возрастом...т.е. возрастает в зависимости от даты рождения.

Как предостережение против неправильной интерпретации этих результатов, нужно подчеркнуть, что, согласно данным Фодегель-Матцен (Vodegei-Matzen, 1994), испытуемые, получившие высокие оценки по ПМР, тратят на решение больше времени, чем те, кто получил

58 низкие оценки. Это особенно относится к решению более сложных заданий. Как и Стернберг (Sternberg, 1977), она показала, что это дополнительное время тратится на кодирование элементов матрицы; не было различий между испытуемыми по времени, которое они тратили на оценку возможных альтернатив ответа. Те, кто тратил мало времени на изучение задания, демонстрировали тенденцию к выбору такого варианта ответа, который недостаточно учитывал весь набор возможных правил решения (смотри ниже).

Третье направление работ, значительно продвигающих понимание содержательной направленности теста ПМР, связано с именами Карпентер и Джаст, и Фодегель-Матцен.

В исследовании {Carpenter, Just and Shell, 1990) было показано, что 95% из подгруппы переведенных в словесную форму заданий Продвинутых Прогрессивных Матриц могут быть решены компьютерной программой, которой требовалось проверить на наличие или отсутствие только пять правил, определяющих закономерности конструирования матриц и, в случае их наличия, совместно указывающих на элемент, необходимый для дополнения матрицы.

ПМР не создавались в прицелом на анализ применяемых испытуемыми стратегий решения задач. Как следствие, задания классических серий часто имеют такие особенности, которые затрудняют выделение операциональных правил, изучаемых в работе Джаст и Карпентер. Аналогичным образом и варианты ответов, из которых нужно выбрать правильный ответ, не были сконструированы таким образом, чтобы можно было проверить вытекающие из теории Карпентера и Джаста гипотезы о связи типологии ошибочных выборов с общей оценкой по тесту (хотя Равен на самом деле показал, что тип ошибки прямо связан с общей оценкой).

Фодегель-Матцен (1994а&Ь) сконструировала набор заданий, который (а) не содержал инородных по отношению к теории Карпентер и Джаста признаков, которые могли повлиять на их сложность, (б) обладал рассчитанными на основе теории Карпентер и Джаста несколькими уровнями сложности и (в) включал ошибочные варианты ответов (дистракторы), которые систематически отличались от правильного ответа только по количеству и типу неучтенных правил, благодаря чему теоретически можно было ожидать, что вероятность выбора каждого из них закономерно связана с суммарной оценкой.

Этот новый тест имел превосходные внутренние психометрические свойства и очень высокую корреляцию с классическим тестом ПМР.

Результаты анализа ошибок находились в полном соответствии с предсказаниями теории Карпентер и Джаст. Наиболее способные из тех, кто не смог решить данное задание, выбирали ответ, который не учитывал только одно, самое трудное правило организации матричной структуры. Менее способные игнорировали большее число правил. Таким образом, тип совершенной ошибки менялся вместе с общей оценкой именно так, как предсказывала теория. Этот факт проливает яркий свет на механизмы нарушения когнитивной деятельности.

Другим фактором, определяющим сложность задания, является легкость идентификации тех критических элементов, на которые должно быть сфокусировано внимание.

В своем исследовании Фодегель-Матцен продемонстрировала действительную значимость этого фактора путем замены составляющих Матрицы геометрических элементов -квадратов и треугольников - на более знакомые обыденные предметы, такие как шляпы, бананы или лица, хотя для правильного решения от испытуемых в обоих случаях требовалось применить одно и то же правило.

Но что самое интересное, изменение элементов на более знакомые привело к снижению трудности задания для всех, а не только для испытуемых с низкими суммарными оценками по тесту. Ранговый порядок заданий и испытуемых сохранился без видимых изменений, Таким

образом, конструирование заданий с изображениями предметов уменьшает их кажущуюся сложность для всей популяции испытуемых.

Иначе говоря, уменьшая заметность важных признаков мы, тем самым, затрудняем процесс нахождения соответствия, что, в свою очередь, делает задания более сложными для любого испытуемого. Но это приводит лишь к небольшим изменениям в порядке сложности заданий или в ранговом порядке тестируемых.

Литература к Приложению, не вошедшая в основной список

Carpenter, PA, Just, M.A. and Shell, P. (1990). What one intelligence test measures: A theoretical account of the processing in

the Raven Progressive Matrices Test. Psychological Review, 97(3), 404-431.

Deary, IJ. (1993). Inspection lime and WAIS-R IQ subtypes: A confirmatory factor analysis study. Intelligence, 17, 223-236. Deary, I.J. (1995) Auditory inspection time and intelligence: What is the direction of Causation? Development Psychology, 31,

in press.

Jensen, A.R., Larson, G.E. and Paul, S.M. (1988). Psychometric g and mental processing speed on a semantic verification test-Personality and Individual Differences, 9(2), 243 255. Raven, J., Ritchie, J. and Baxter, D. (1971). Factor analysis and cluster analysis: Their value and stability in social survey research.

Economic and Social Review, 367 — 391. Styles, I. and Andrich, D. (1994). Linking Psychometrics and Cognitive-Developmental Variables. Paper presented at the 21st

International Congress of Psychology, Madrid, Spain. Not to be quoted without permission. Vernon, PA. (1989). Speed of Information-Processing and Intelligence. Norwood, NJ: Ablex. Vemori, P.A. (1991). Studying intelligence the hard way. Intelligence, IS, 389-395. Vernon, P.A- (1993). Intelligence and neural efficiency. Chapter 7 in O.K.. Detterman (Ed.), Current Topics in Human

Intelligence, Volume 3. Norwood, NJ: Ablex.

Vernon, P-A. (1994). Reaction time. In R.J. Sternberg (Ed.), Encyclopaedia of Human Intelligence. New York: Macmillan. Vodegel-Matzen, L.B.L, (1994). Performance on Raven's Progressive Matrices. Ph.D. Thesis, University of Amsterdam. Vodegel-Marzen, L.B.L., van der Molen, M.W. and Dudink, A.C.M. (1994). Error analysis of Raven test performance. Personality

and Individual Differences, 16(3), 433-445.

Литература

Alderton, D,L and Larson, G. (1990). Dimensionality of Raven's Advanced Progressive Matrices Items. Educational and

Psychological Measurement, 50, 887-900. Andrich D. (1989). Distinctions between assumptions and requirements in measurement in the social sciences. Bulletin of

the International Test Commission, No.28/29,46-66. Strasbourg: ITC. Andrich, D. and Styles, 1. (1993). Psychometric evidence of intellectual growth spurts in early adolescence. In Press. Preliminary

paper presented to the 1991 meeting of the American Educational Research Association.

AngorT, W,H. (1988). The nature-nurture debate, aptitudes, and group differences. American Psychologist, 43, 713 -720. Baird, D. and Scott, E.M. (1953). Intelligence and childbearing. Eugenics Review, 45, No,3t 139-154. Baltes, P.B. and Lindenberger, U. (1988). On the range of cognitive plasticity in old age as a function of experience: 15

years of intervention research. Behavior Therapy, 19, 283 - 300. Benton, 0 and Roberts, G. (1988). Effect of vitamin and mineral supplementation on intelligence of a sample of schoolchildren.

The Lancet, 23, January, 140 - 143.

Berg, 1. (1973). Education and Jobs: The Great Training Robbery. London: Penguin Books. Bock, G., Stebbins, L.B. and Proper, E.G. (1977). Education as Experimentation: A Planned Variation Model, (Vol.lV-B).

Effects of Follow Through Models. Cambridge MA: Abt Associates. Bouchard, T.J., Lykken, D.T., McGue, M., Segal, N.L. and Tellegen, A. (1990). Sources of human psychological differences:

The Minnesota Study. Science, 250, 223-228.

Bouvier, U (1969) Evolution des Cotes a Quelques Test Belgium: Centre de Recherches, Forces Armees Beiges Brandis, W and Bernstein, B. (1974). Selection and Control. London: Routledge and Kegan Paul. Broadbent, D,B. and Aston, В (1978). Human control of a simulated economic system. Ergonomics, 21,12, 1035 -1043. Brown, J.S., Collins, A. and Duguid, P. (1989). Situated cognition and the culture of learning. Educational Researcher,

Jan-Feb, 32-42. Budoff, M. and Gorman, L. (1976). Effectiveness of a learning potential procedure in improving problem-solving skills of

retarded and non-retarded children. Amer. J. Mental Deficiency, 81,260-264. Budoff, M. and Friedman, M. (1964). 'Learning Potential' as an assessment approach to the adolescent mentally retarded.

J. Consult. Psychology, 28, 434-439.

Burt, C. (1957). The distribution of intelligence. British J. Psychology, 48,161-175. Chan,J. (1981). Correlates of parent-child interaction and certain psychological variables among adolescents in Hong Kong.

in J.L M Binnie-Dawson (Ed.), Perspectives in Asian Cross-Cultural Psychology. Lisle, Netherlands: Zwets and Zeitlinger. Chomsky, N. (1987) The Chomsky Reader. London: Serpent's Tail. Coles, R. (1986). The Moral Life of Children. New York: Atlantic Monthly Press Cook, M (1988). Personnel Selection and Productivity. Chichester; John Wiley. Crichton Royal, Dumfries. (1957). A comparative study of two psychological tests, (unpublished). Department of Psychological

Research.

Day, P. and Klein, R. (1987). Accountabilities: Five Public Services. London: Tavistock Publications, dc Lcmos, M.M. (1989). The Australian re-standardisation of the Standard Progressive Matrices. Psychological Test Bulletin,

Vol.2, No.2, Nov., 17-24. Hawthorn, Victoria: ACER. Deltour, J.J, (1984, Unpublished), line Nouvelle Methode devaluation Kapidc de la Deterioration Mentale, University of

biege: Laboratoir de Psychologic Appliquee. Desai, M. (1955) The relationship of the Wechsler-Bellvue Verbal Scale and the Progressive Matrices.! Consulting Psychology,

19, 60. Dickstein, LS. and Ayers.J. (1973). Effect of an incentive upon intelligence test performance. Psychological Reports, 33,

127-130. Dillon, R.F, (1980). Matching students to their preferred testing conditions: Improving the validity of cognitive assessment.

Educational and Psychological Measurement, 40, 999 - 1004. Dockrell, W.B. (1989). Extreme scores on the WISC-R. Bulletin of the International Test Commission, No 28/29,1 - 7.

Strasbourg: ITC Fysenck, H.J, and Eysenck, S.B.G., (Eds,) (1991). Improvement of IQ and behaviour a5 a function of dietary supplementation.

/I Symposium. Personality and Individual Differences, Vol.12, No.4, Whole Issue. Feuerstein, R. (1979). The Dynamic Assessment of Retarded Performers Baltimore: University Park Press. Feuerstein, R. (1980). Instrumental Enrichment. Baltimore: University Park Press. Feuerstein, R.( Klein, P. and Tannenbaum, A. (Eds.). (1990). Mediated learning experience: Theoretical, psychosociat, and

educational implications. Proc. First International Conference on Mediated Learning Experience. Tel Aviv: Freund. Feuerstein, R., Rand, Y. and Rynders.J.K. (1988). Don't Accept Me As I Am: Helping'Retarded' People to Excel. New

York: Plenum. Firkowska-Mankiewicz, A. and Czarkowski, M. (1982). Social status and mental test performance in Warsaw children. Personality

and Individual Differences, 3, 237-247. Fischer, G.H (1988). Comments made in a symposium on Questionable Assumptions in Test Construction, held at the

61 Sydney meeting of the International Association for Applied Psychology.

Fivars, G. and Gosnell, D (1966). Nursing Evaluation: The Problem and the Process. Pittsburg PA: Westinghouse Learning Corp. Flynn.J.R. (1984). The mean IQ of Americans: Massive gains 1932 to 1978. Psychological Bulletin, 95, 29-л1, Flynn J.R. (1987). Massive IQ gains in 14 nations: What IQ tests really measure. Psychological Bulletin, 101, 171 - 191. Flynn.J.R. (1989). Chinese Americans: Evidence that IQ tests cannot compare ethnic groups. Bulletin of (he International

Test Commission, No.28/29, 8-20 Strasbourg: ГГС.

Flynn.J.R. (1991). Asian Americans: Achievement Beyond IQ. Hillside, NJ: Lawrence Erlbaum Associates, Inc. Foulds.G.A. and Raven, J.C. (1948). Normal changes in the mental abilities of adults as age advances. Journal of Mental

Science, Vol.XClV, No.394, January, 133- 142.

Fraley, A. (1981). Schooling and Innovation: The Rhetoric and the Reality. New York: Tyler Gibson. Francis, H. (1982). Language teaching research and its effect on teachers in early education, in A. Davies (Ed.), Language

and Learning in Home and School. London: SCRC/Hcinemann.

Frederiksen, N. (1984) Implications of cognitive theory for instruction in problem solving. Rev. Ed. Research, 54, 363 - 407. Frost, B.P, (1963). The role of intelligence in the selection of children for remedial teaching of reading. Alberta J. Educational

Research, 9,2, 73-78. Gallimore, R, (1985). The Accommodation of Instruction to Cultural Differences, 1л& Angeles: Univ. California, Dept

Psychiatry.

Gardner, H. (1983). Frames of Mind. New York: Basic Books. Gardner, H. (1985). The Mind's New Science. New York: Basic Books.

Gardner, H. (1987). Developing the spectrum of human intelligence. Harvard Education Review, 57,187 -193. Gardner, H. (1991). Assessment in context: The alternative to standardised testing, in B.R. Gifford and M.C. O'Connor

(Eds.), Changing Assessments: Alternative Views of Aptitude, Achievement and Instruction. New York: Kluwer Publishers. Goodlad, J (1983) A Place Called School. New York: McGraw Hill. Greeno.J.G. (1989) A Perspective on Thinking. Amer. Psychologist, 44, 134- 141.

Guilford.J.P. (1977). Way Beyond the IQ. New York: Creative Education Foundation and Creative Synergetic Associates. Guthke.J. (1982). The learning test concept - An alternative to the traditional, static intelligence test. German J. of Psychology,

6, 306-324. Guihke.J , Bauer, H., Burkert, D., Gittct, K. and Donsszik.J. (1986). VorlaufigeDDR-NormenfurdenFarbigenProgressiven

Matrizentest (CPM) nach Raven. Psychologie fur der Praxis, 350- 357. Guthke J and Lehwald, G. (1984). On component analysis of the intellectual learning ability in learning tests, /.eilsclmtt

fur Psychologie Bd , 192, 3-17. liambleton, R.K... (1988). Comments made in a symposium on Questionable Assumptions in Test Construction, held at

the Sydney meeting of the International Association for Applied Psychology. Hambleton, R.K. (1989). Constructing tests with item response models: A discussion of methods and two problems. Bulletin

of the International Test Commission, No.28/29, 96-106. Strasbourg: ITC. Hatch, T.C. and Gardner, H. (1990). If Binet had looked beyond the classroom: The assessment of multiple intelligences.

International Journal of Educational Research, 415-429. Haywood, H.C.,Arbitrnan-Smith, R., Bransford.J.D., Towery, V.R., Hannel, l.L. and Hannel, M.V. (1982). Cognitive

Education with Adolescents: Evaluation of Instrumental Enrichment. Paper presented at the International Association

for the Study of Mental Deficiency. Hess, R.D. and Shipnian, V.C.(1965). Early experience and the socialisation of cognitive modes in children. Child Development,

36, 869 - 886.

HMI (Scotland) (1980). Learning and Teaching in Primary 4 and Primary 7. Edinburgh: HMSO. Hogan, R (1990). Unmasking incompetent managers. Insight, May 21, 42-44. Hogan, R., Raskin, R. and Fazzini, D, (1990). The dark side of charisma, in K.E. dark and M.B. dark (Eds.), Measures

of Leadership. West Orange, NJ: Leadership Library of America.

Holland,.!.L. and Richards,!M. (1965). Academic and non-academic accomplishments. J, Ed, Psychology, 56, 165 - 175. Holmes, B.J. (1980). British Columbia Norms for Wcchsler Intelligence Scale for Children - Revised; Peabody Picture

Vocabulary Test; Slosson Intelligence Test; Standard Progressive Matrices; and Mill Hill Vocabulary Scale. University

of British Columbia: Faculty of Education. Hope, K. (1985). As Others See Us: Schooling and Social Mobility in Scotland and the United States New York: Cambridge

University Press, Hornke, L.F. and Habon, M.W. (1984). Regelgeleitcte Konstruktion und Evaluation von nicht-verbalen Denkaufgaben. (Rule

governed construction and evaluation of non-verbal test items). Wehrpsychologische Untersuchungen 4/84.

Erziehungswissenschaftliches Institut der Univ. Dusseldorf. Hoyt, D.P. (1965). The Relationship Between College Grades and Adult Achievement. Iowa: American College Testing

Program, Res. Report No. 7.

HunterJ.E. and R.F. (1984) Validity and utility ofalternarive predictors of job performance. Psychol. Bull., 96, 72 -98. Jackson, P.W (1986). The Practice of Teaching. New York: Teachers College Press. Jacobs, P.I. (1977). Up the IQ! New York: Wyden Books. Jacobs, P.I. and Vandeventcr, M. (1968). Progressive Matrices: an experimental, developmental, nonfactorial analysis. Perceptual

and Motor Skills, 27, 759- 766. Jacobs, P.I and Vandeventer, M. (1971). The learning and transfer of double-classification skills by first graders. Child

 
« Пред.   След. »
© 2018 10й КАБИНЕТ
Website Security Test