Тестирование в психологии: история вопроса.

Термин «тест», получивший в последнее время широкое распространение в различных областях в смысле проверки или испытания, имеет давнюю историю. По некоторым источникам, слово «тест» происходит из старофранцузского языка и является синонимом слова «чашка» (лат. testa – ваза из глины). Этим словом обозначали небольшие глиняные сосуды, использовавшиеся алхимиками для проведения опытов. В русском языке слово «тест» долгое время имело два значения: 1) испытательная присяга, английская религиозная клятва, которую каждый вступающий в общественную должность должен давать, чтобы доказать, что он не тайный католик; 2) плоский плавильный сосуд для выделения олова из золота или серебра. Современное значение термин «тест» получает только в конце XIX – начале XX в.

Предыстория тестов связана с испытаниями различных способностей, знаний, умений и навыков. Есть свидетельства, что уже в середине III тысячелетия до н. э. в Древнем Вавилоне проводились испытания выпускников школ писцов. На Древнем Востоке чань-буддисты учителя использовали загадки и вопросы-парадоксы с одновременным созданием ситуации психологического стресса (при постановке вопроса вопрошающий хватал оппонента и кричал: «Говори! Отвечай немедленно!»). Испытания индивидуальных возможностей были важной частью социальной жизни многих народов мира, начиная с древности.

Первые попытки тестирования в психологии.

Настоящая история тестов началась в конце XIX – начале ХХ века. К этому моменту изучение способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Первым ученым, применившим тесты для измерения интеллекта человека, был Френсис Гальтон. Правда, его тесты были не теми тестами интеллекта, которые используются в наши дни и к каким мы привыкли. Гальтон полагал, что тесты сенсорного различения, определение порогов чувствительности и антропометрические измерения могут служить средствами измерения интеллекта человека. Свои рассуждения он основывал на том факте, например, что при крайней степени слабоумия у человека нарушается способность различать тепло, холод и боль.

Термин «умственный тест» впервые появился в психологической литературе в статье Джеймса Кэттелла в 1890 году. В этой статье была описана серия тестов, проведенных для определения интеллектуального уровня и успеваемости студентов. Правда, и тесты Кэттелла были не совсем психологическими, в сегодняшнем понимании. Он измерял, подобно Гальтону, скорость движения конечностей, пороги чувствительности кожи, время реакции на звук, время, необходимое для определения цвета и даже величину давления на лобную часть головы до момента появления болезненных ощущений.

Но к 1901 году Кэттелл набрал достаточно данных, чтобы определить, что подобные тесты не могут служить показателями успеваемости, а, значит, и умственных способностей студентов.

IQ и умственный возраст.

Хотя понятие «тест умственных способностей» ввел Кэттелл, метод тестирования получил распространение благодаря работам Альфреда Бине. Он использовал более сложные критерии оценки умственного развития, чем те, что разработал Кэттелл. Его метод обеспечил возможность эффективно измерять умственные способности человека; он знаменовал собой начало современной тестологии.

Бине полагал, что наилучшим критерием умственного развития может служить оценка таких познавательных функций, как память, внимание, мышление, воображение, сообразительность. В 1904 году по заказу Министерства образования Франции, Бине и психиатр Теодор Симон разработали ряд интеллектуальных задач для детей различных возрастных групп.

На основе этих задач и был составлен первый тест на интеллект. Первоначально в него входило 30 задач, вербальных, направленных на восприятие (перцептивных) и манипулятивных, которые располагались по возрастанию трудности. Уровень трудности определялся эмпирически, путем проведения этих тестов на нормальных детях в возрасте от 3 до 13 лет, на нескольких умственно отсталых детях и взрослых. Особый упор делался на способности к пониманию и рассуждению, которые Бине считал основными составляющими интеллекта.

И все же этот тест еще не был тестом в привычном для нас виде. В ходе проведения этой методики психолог задавал вопросы испытуемому и записывал его ответы, замерял время и пр. Не было привычного для нас выбора правильного ответа из нескольких вариантов.

В последующие годы этот тест дважды модифицировался самими авторами. Общее число тестов было увеличено, и все они были сгруппированы по возрастным уровням на основе их выполнения большим количеством нормальных детей. Бине и Симон предложили понятие умственного возраста, который определялся по уровню тех интеллектуальных задач, которые способен решить ребенок. К примеру, если ребенок, чей хронологический возраст равен четырем годам, решает все задачи для пятилетнего, то умственный возраст этого четырехлетнего ребенка приравнивался к пяти годам.

После смерти Бине в 1911 году его тесты были переведены на английский язык и представлены в США. В 1916 году Льюис Терман модифицировал тест Бине-Симона, и этот вариант, названный шкалой Стэнфорд-Бине по названию университета, стал стандартным. А немецкий психолог В. Штерн ввел понятие коэффициента умственного развития IQ, определяемый как процентное отношение умственного возраста к хронологическому. Шкала Стэнфорд – Бине широко используется и по сей день.

Психологическое тестирование в практике.

Тесты Бине являлись индивидуальными шкалами в том смысле, что они могут проводиться только с одним человеком за раз, они требуют фиксации устных ответов испытуемого и манипулирование материалом теста, в некоторых заданиях необходимо учитывать время его выполнения. Проводить их может только квалифицированный специалист. По этим причинам такие тесты не были приспособлены для массового использования.

Однако результаты, которые давали эти тесты, могли быть использованы в различных областях практики, при условии, что они будут модифицированы таким образом, что позволят быстро и легко тестировать людей. Первый запрос на такой метод подала американская армия, где в Первую Мировую войну появилась необходимость отбирать новобранцев в различные армейские структуры. Для решения задачи массового тестирования было привлечено множество методов, в частности тест интеллекта, подготовленный Артуром Отисом. Основным его достоинством было введение задач с множественным выбором ответа и других «объективных» заданий. Таким образом, тесты интеллекта приобретают привычный для нас вид.

Вскоре после окончания войны тесты стали использовать и в гражданских целях. Были разработаны групповые тесты интеллекта для лиц все возрастов и категорий. Они стали использоваться в школах для оценки знаний, в вузах для отбора студентов, при приеме на работу в различные организации. Поскольку групповые тесты создавались как средства массового тестирования, их инструкции и процедура проведения были достаточно просты и не требовали особой подготовки лиц, работающих с ними. В 1920х годах в США ежегодно продавалось около 4 миллионов тестов только для образовательных учреждений. С появлением тестов была реформирована система образования в США, в основе этих преобразований лежал коэффициент IQ.

В годы Первой мировой войны под руководством психологов Йеркса, Доджа, и Термена была создана и успешно реализована программа набора новобранцев в армию, которая оценивала уровень образования каждого новобранца, оценить их специальные способности и создать и применить методы для отбора и обучения военных специалистов.

Оценка умственных способностей должна была помочь офицерскому составу в формировании военных организаций, состоящих из людей сходного уровня умственного развития. Кроме того, психологическое обследование новобранцев помогало выявить людей с высоким уровнем интеллекта для направления их в офицерские школы.

Психологические испытания представляли собой простые пробы на интеллект, причем в двух вариантах: серия альфа – для лиц, в достаточной мере владеющих английским языком, и серия бетта – для людей, плохо знающих язык. Тесты проводились групповым методом сразу для 200 испытуемых. Опыт длился около 40 – 50 минут, за два с половиной месяца ему подверглись 1,75 млн. человек.

Оценка новобранцев, произведенная психологами, была впоследствии подтверждена полученными от полковых командиров отзывами о сравнительной ценности в военном деле тех, кто прошел психологические испытания.

Такие успехи психологов в армии вдохновили дальнейшее применение тестов на интеллект для отбора в гражданские профессии. Однако в этой области все проходило не так гладко, как хотелось бы. М. Вителес приводит результаты обследования по армейским тестам на интеллект 18000 работников различных видов труда. Оказалось, что «среднего» и «незаурядного» уровня достигают 90% капелланов, 95.9% инженеров, 77.5% медиков, 9.5% плотников и 9.2% художников. Вителес сделал предположение, что люди с низким интеллектом не попадают в некоторые профессии в результате стихийного отбора. В дальнейших исследованиях он установил, что есть профессии, успех в которых зависит совсем не от уровня интеллекта, но от наличия и развития определенных способностей, и, напротив, есть профессии, эффективность в которых напрямую зависит от интеллекта работника. Таким образом, была поставлена проблема специальных способностей и их оценки.

Однако отказываться от тестирования интеллекта при приеме на работу психологи не спешили. Широкую популярность получила концепция Ч. Спирмена, который считал, что общий интеллект есть основная умственная функция, и он проявляется во многих умственных процессах.

К концу 20х годов в зарубежной индустриальной психологии помимо изучения и диагностики формально-психологических функций (интеллекта, памяти, психомоторики и др.) в центе внимания оказываются личность, характер, побуждения к деятельности. Многие психотехники считали, что оценка черт характера в ряде случаев важнее оценки отдельных функций, так как способности развиваются при наличии особого интереса к работе и это развитие может перекрыть первоначальные дефекты.

Предполагалось, что характер нельзя установить экспериментально, можно судить о нем лишь в естественных, спонтанных формах поведения личности. Поэтому поиск экспериментальных способов оценки черт характера оказался в центре внимания психологов США и Германии. Так были разработаны «проба воли» Дауни (США), «тест мужества» Шульте (по заказу полиции). Профессор психологии из города Данцига Г. Геннинг сконструировал тесты для оценки эгоизма, злобности, мнительности, лживости, хитрости, терпеливости, альтруизма. Геннинг считал, что характер проявляется только в ситуации социального взаимодействия, поэтому обязательные принцип испытаний – участие сразу двух испытуемых. Один из испытуемых – заведомо нечестен, выполняет заданную инструкцией роль, а другой об этом не знает, и по их поведению судят о характере непосвященного испытуемого.

Как зарубежные, так и отечественные психотехники, решая задачи прогнозирования, опирались на предварительный психологический анализ профессиональной деятельности. Цель такого анализа состояла в том, чтобы убедиться в существовании закономерной связи между наличием устойчивых трудно развиваемых свойств работника и степенью успешности его труда. Продуктом психологического анализа были гипотезы о существовании таких устойчивых свойств и о признаках поведения, в которых эти свойства могли бы проявляться. Индивидуальные свойства, признаки которых психолог мог установить по выполнению поведенческих актов, были выражением способностей, тенденций и задатков и, одновременно, с другой стороны, отражали освоенные умения и знания. Искусство психолога, разрабатывавшего систему прогнозирования профпригодности до начала профессионального обучения, состояло в том, чтобы по возможности вычленить формально-психофизиологические функции (трудно поддающиеся упражнению), составляющие основу умений и облегчающие их освоение, а не сами умения.

Были, конечно, и варианты тестов, проверявшие в большей мере умения, чем обучаемость действиям. Так в американских работах разделения на способности и умения в связи с профпригодностью не признавалось актуальным. Главное – экономия на затратах при профессиональном обучении и адаптации новичка к работе.

Критика тестирования - издежки производства.

В ответ на огромные запросы со стороны образовательных и коммерческих учреждений неизбежно появлялись наспех разработанные тесты, что часто приводило к плачевным результатам. Наиболее показателен случай с тестом Эдисона, знаменитого изобретателя. Это был практически случайный набор вопросов, который Эдисон считал простыми, например: «Какой телескоп является самым большим в мире?», «каков вес воздуха в комнате объемом 20х30х10 футов?». Возможно, для самого Эдисона эти вопросы казались элементарными, чего не скажешь о выпускниках колледжа, которым предстояло его пройти. После того, как они смогли дать лишь несколько верных ответов, Эдисон сделал вывод, «что для выпускников они удивительно невежественны», хотя дело было не в студентах, а в чрезмерной сложности вопросов.

Тесты интеллекта использовались в США также для определения умственного развития эмигрантов, въезжающих в страну. Проблемы адаптации тестов к различным культурам еще не стояло, поэтому вопросы просто переводились с английского на родной язык эмигранта с помощью переводчика. В результате получилось, что 87% русских, 85% евреев, 79% итальянцев слабоумны, их умственный возраст ниже 12 лет. На этой же почве были протестированы негры, живущие в США, и было получено «подтверждение» умственной неполноценности негроидной расы.

Трудности диагностики характера

При конструировании тестов, направленных на диагностику черт характера, которые были связанные со следующими аспектами.

Во-первых, в отличие от простых психических функций и их проявлениями в действиях, нет прямой связи поступка и определенных черт характера. Могут быть разнообразные мотивы одного и того же поступка. Психотехника должна научиться видеть за действиями и поступками работника возможные разные мотивы. Черты характера рассматриваются как устойчивые мотивы человека, поэтому проблема сводится к выявлению мотивов труда и их устойчивой составляющей.

Другая трудность – хаос с научными терминами, обозначающими черты характера, и их житейскими аналогами; она свидетельствует о теоретической неразработанности данного вопроса в психологии. Баумгартен отмечала также трудность изучения отрицательных черт характера, которые часто профессионально важны, но сознательно маскируются испытуемыми, знающими об их социальной оценке (например, лживость в работе страхового агента или продавца).

Характер одного и того же человека может по-разному проявляться в разных ситуациях или в отношении разных людей. Так, В. Штерн предполагал, что психика человека состоит из нескольких слоев, К. Левин говорил о существовании в одном человеке разных систем относительно большой устойчивости и завершенности. Каждая жизненная ситуация может затрагивать разные слои, системы личности, поэтому по возможности надо учитывать взаимоотношения испытуемого с разными людьми. Таким образом, без исследования интерперсональных отношений ничего нельзя сказать о характере личности.

Наконец, самая большая трудность в исследовании характера – несовершенство теоретических моделей личности, ее структуры. Психотехника могла только вслед за В. Штерном толковать, а не причинно отмечать человеческие поступки, проявления характера, но близкое к реальности толкование требует владения очень многими сведениями (обозначенной Штерном как общая психографической схеме, слабо применимой в практике индустриальной психологии, так как не было создано оперативных способов ее применения).

Современный взгляд на психологическое тестирование.

В настоящее время тесты способностей совершенствуются, становятся все более тонким инструментом для оценки интеллектуальных качеств человека. Появилось понимание того, что способность человека можно адекватно оценить на разных уровнях широты: от узко определяемых специальными тестами до комплексной оценки, такой как IQ. Для этого разрабатывается гибкая система подсчета показателей соответственно конкретным целям тестирования. Важно отметить, что теперь тестирование не рассматривается как универсальный инструмент оценки, на результаты которого можно -всецело положиться. Тесты теперь используются как один из этапов комплексной оценки, которая содержит также и интервью, и наблюдение, и экспертную оценку человека.

Современная психология пришла к пониманию того, что иноязычный тест нужно не только перевести, но и адаптировать к культурным реалиям той социальной группы, в которой его планируется использовать.

Массовый бум тестирования интеллекта прошел, как в России (он закончился в 30е годы постановлением об их запрете), так и во всем мире. Изменилось отношение к тестам интеллекта как к универсальному инструменту отбора, теперь они используются лишь как одно из средств.

В области тестирования личности появляется все больше новых практических разработок, направленных на диагностику различных черт личности (мотивации, ценностных ориентаций, самоотношения и пр.). Появляются методики, которые сочетают в себе методы стандартизированного опроса и проективных техник (например, техники семантического шкалирования). Однако для практической психодиагностики стал характерен определенный консерватизм, выражающийся в том, что исследователи и практики предпочитают работать со старыми проверенными тестами, прошедшими многолетнюю психометрическую адаптацию.