Тесты школьной успеваемости. Анкетирование "Что влияет на успеваемость учащихся" тест (8 класс) на тему Тест на выявление успеваемости учащихся
Тесты школьной успеваемости являются методами педагогической диагностики, с помощью которого результаты планируемого учебного процесса могут быть максимально объективно, надежно и валидно измерены, обработаны, интерпретированы и подготовлены к использованию в педагогической практике учителями.
Выделяют следующие виды тестов школьной успеваемости: а) ориентированные на соотносительную группу; б) ориентированные на критерии. Также они могут быть формализованными и неформализованными (неформальными).
Тесты школьной успеваемости, ориентированные на соотносительную группу, предполагают сопоставление индивидуального результата тестирования каждого ученика с результатами, полученными с помощью релевантной выборки (чаще всего это все классы школьного выпуска). Составление тестов данного типа включает следующие этапы: а) подготовительное планирование, б) анализ учебных программ и учебников, в) конструирование заданий, г) анализ заданий, д) выверка.
Этап подготовительного планирования предполагает обдумывание следующих вопросов: кто, что и почему подлежит исследованию? Например, если необходимо определить учащихся для дополнительных занятий, то нет необходимости тестировать весь класс, можно взять лишь более слабую его половину. Необходимо продумать, какие формы успеваемости будут исследоваться – устные, письменные или моторные, что будет выноситься на первый план – умение мыслить или запоминать и т.д.
После определения цели и функции тестирования необходимо провести анализ учебных планов, программ и учебников. Здесь обращается внимание на то, каков уровень требуемых знаний, умений и навыков. Уровень узнавания изученного материала, репродуктивного воспроизведения усвоенного или творческого использования в новой ситуации.
Тесты школьной успеваемости, ориентированные на критерии,– это тесты, сообщающие индивидуальный результат учащегося по отношению к критериям, заранее установленным исследователем (педагогом) или учебной программой. В этом случае учащиеся заранее предупреждаются, что результаты предстоящего тестирования на владение грамотной письменной речью успешно пройдут лишь те, кто наберет такую-то сумму баллов. То или иное количество тестовых баллов может быть определено для получения той или иной отметки успеваемости.
Неформальные тесты школьной успеваемости являются методом педагогической диагностики, конструируемыми школьными педагогами с целью объективной фиксации результатов процесса обучения в своем классе. Неформальные тесты характеризуются отсутствием строго научного подхода на всех этапах создания. Если даже формализованные тесты никогда не дают уверенности в абсолютной надежности, то несовершенным тестам, создаваемым учителями для собственного пользования, это присуще еще в большей степени. Несовершенство измерений с точки зрения их надежности находит свое практическое выражение в вычислении стандартной измерительной ошибки, то есть величины стандартного отклонения теста, которая объясняется его надежностью.
Стандартная измерительная ошибка учитывается создателями теста в процессе его подготовки. Пользователь теста в специальном приложении к тесту предупреждается, что стандартная ошибка в измерении, допустим, составляет ±4 балла. В этом случае он знает, что «истинное» значение успеваемости для ученика, набравшего 24 балла, располагается между 20 и 28 баллами. Если знать измерительные ошибки инструментария, то можно избежать переоценки его надежности и не принимать случайные расхождения результатов при их интерпретации за подлинные различия в успеваемости.
Надежность инструментария зависит – при прочих равных условиях – от количества заданий. Для неформальных тестов ошибка в измерении может быть вычислена с помощью следующего основного правила: при количестве заданий менее 24 ошибка составляет 2 балла; при количестве заданий между 24 и 47 ошибка составляет 3 балла; при количестве заданий между 48 и 89 ошибка составляет 4 балла.
Существуют три основных сферы тестирования: 1) тестирование в образовании; 2) профессиональное тестирование; 3) психологическое тестирование. Во всех трех сферах применяют следующие виды тестов: личностные, проективные, тесты интеллекта, тесты достижений, тесты креативности, тесты критериально-ориентированные.
Личностные тесты – методы психодиагностики, с помощью которых измеряют различные стороны личности индивида: установки, ценности, отношения, эмоциональные, мотивационные и межличностные свойства, типичные формы поведения. Обычно личностные тесты применяются в одной из форм: 1) шкалы и опросники; 2) ситуационные тесты или тесты действия, использующие перцептивные, когнитивные или оценочные задачи (определяется усвоение знаний), оценку себя, своих личностных конструктов и пр.
Проективные тесты – [< лат. projectio – выбрасывание вперед] – совокупность методик целостного изучения личности, основанного на психологической интерпретации результатов проекции. Составители проективных тестов исходят из предположения о том, что человек всегда преобразует (хотя бы в восприятии и представлении) ситуацию, в которой он оказался, «насыщает» ее собственными проблемами, «проецирует» на нее содержание своей личности, так как процесс восприятия всегда обусловлен следами прошлых впечатлений. Сюда относятся, например, тест чернильных пятен Роршаха, тест по объяснению сюжета на картинках и др. Проективные тесты конструируются в двух видах. В ассоциативном проективном тесте предлагаются незаконченные предложения, рассказы, рисунки и др. В экспрессивном тесте предлагается принять участие в психодраме, игре, рисовании на свободную тему и др. Достоинством методики проективных тестов является то, что они облегчают демонстрацию скрытого содержания внутреннего мира субъекта, которые он не может выразить открыто. Это позволяет сориентироваться в сложных свойствах личности, не поддающихся точной оценке.
Тесты интеллекта – методики психодиагностики, ориентированные на выявление умственного потенциала индивида. Обычно в интеллектуальных тестах испытуемому предлагается установить логические отношения классификации, аналогии, обобщения и др. между терминами и понятиями, из которых составлены задачи теста. Иногда в задачах теста необходимо правильно составить рисунок, собрать геометрическую фигуру, сложить из представленных деталей изображение предмета и др.
Тесты достижений – одна из методик психодиагностики, выявляющая степень владения испытуемым конкретными знаниями, умениями, навыками. Направлены на выявление уровня усвоенности конкретных навыков, а не обобщенных умений, которые человек приобретает в итоге разнообразного жизненного опыта. Тесты достижений проводятся в трех формах: 1) тесты действия; 2) тесты письменные и 3) тесты устные. Тесты действия выявляют умения оперировать инструментами, механизмами, материалами. В письменных тестах необходимо выбрать верный ответ среди нескольких предложенных либо отметить что-то на графике, либо указать что-то в предложенном рисунке. Устные тесты достижений – заранее подготовленная система вопросов, на который испытуемый должен дать правильные ответы.
Тесты креативности [< лат. creatio – сотворение, создание] – методики для изучения и оценки творческих способностей личности. Диагностика творческих способностей ведется в двух направлениях: анализ жизненного опыта и индивидуальных особенностей творческой личности; анализ творческого мышления и его продуктов. Вопрос о креативности как о самостоятельном, независимом от интеллекта свойстве, пока остается нерешенным. Тесты креативности до сих пор остаются не надежными. При их помощи можно измерить такие качества, как беглость, гибкость мышления, оригинальность, чувствительность к проблемам и некоторые другие, но творческие достижения требуют более сложного сочетания способностей и свойств личности.
Более-менее корректному измерению доступны далеко не все творческие достижения, а только конвергентные. Конвергентными [<лат. convergere – приближаться, сходиться] называются такие достижения, которые могут быть выражены в правильном или однозначно лучшем результате. Это громадная сфера в самых различных специальных областях и на различных уровнях, которая простирается от знания фактов до аргументированной оценки. Конвергентные успехи в учебе вполне доступны измерению. Иначе обстоит дело с дивергентными творческими достижениями.
Дивергентные [< лат. divergere – отклоняться, расходиться] достижения те, которые могут привести ко многим в принципе равноправным результатам. Типичным примером является сфера креативного, художественного творчества. Одна и та же тема может быть разработана с помощью музыкальных, поэтических, изобразительных средств в различных вариациях, которые не могут быть классифицированы по принципу «правильно-неправильно» или «лучше-хуже», если абстрагироваться от более «ремесленного» аспекта, имеющего лишь второстепенное значение. Очень редко удается измерить дивергентные креативные способности, иногда с помощью вспомогательных проблемных конструкций.
Тесты критериально-ориентированные – методики психодиагностики, направленные на выявление уровня владения знаниями и навыками умственных действий, которые необходимы и достаточны для выполнения определенных классов учебных или профессиональных заданий. Критерием служит наличие или отсутствие этих знаний. Это инструмент обратной связи в организации процессов обучения. Результаты тестирования, проведенного с помощью этих методик, оцениваются не по порядковому месту испытуемого в выборке и не по отношению этих результатов к статистической норме, а по отношению ко всей сумме тестовых задач. Критериально-ориентированное тестирование позволяет обнаружить при анализе результатов недочеты умственного развития как отдельных индивидов, так и целых групп, и наметить меры для их ликвидации.
Тесты могут быть вербальные (словесные, смысловые) и невербальные (фигурные, рисуночные), то есть без слов.
По методике выполнения теста выделяют рефлективный и верификационный методы. Рефлективные тестовые задания подразделяются на два вида: 1) элективные [< лат. electus – избранный] задания на распознавание с выбором верного ответа из нескольких данных альтернатив, установление логической или иной связи; 2) инвентивные [< лат. inventiv – выдумка, изобретение] задания на дополнение, преобразование и на свободную форму ответа. Сущность верификационного метода выполнения тестовых заданий заключается в том, что ученик должен дать ответ типа «верно-неверно», «да-нет».
Тесты школьной успеваемости
Тесты школьной успеваемости являются методами педагогической диагностики, с помощью которого результаты планируемого учебного процесса могут быть максимально объективно, надежно и валидно измерены, обработаны, интерпретированы и подготовлены к использованию в педагогической практике учителями.
Выделяют следующие виды тестов школьной успеваемости: а) ориентированные на соотносительную группу; б) ориентированные на критерии. Также они могут быть формализованными и неформализованными (неформальными).
Тесты школьной успеваемости, ориентированные на соотносительную группу, предполагают сопоставление индивидуального результата тестирования каждого ученика с результатами, полученными с помощью релевантной выборки (чаще всего это все классы школьного выпуска). Составление тестов данного типа включает следующие этапы: а) подготовительное планирование, б) анализ учебных программ и учебников, в) конструирование заданий, г) анализ заданий, д) выверка.
Этап подготовительного планирования предполагает обдумывание следующих вопросов: кто, что и почему подлежит исследованию? Например, если необходимо определить учащихся для дополнительных занятий, то нет необходимости тестировать весь класс, можно взять лишь более слабую его половину. Необходимо продумать, какие формы успеваемости будут исследоваться – устные, письменные или моторные, что будет выноситься на первый план – умение мыслить или запоминать и т.д.
После определения цели и функции тестирования необходимо провести анализ учебных планов, программ и учебников. Здесь обращается внимание на то, каков уровень требуемых знаний, умений и навыков. Уровень узнавания изученного материала, репродуктивного воспроизведения усвоенного или творческого использования в новой ситуации.
Тесты школьной успеваемости, ориентированные на критерии,– это тесты, сообщающие индивидуальный результат учащегося по отношению к критериям, заранее установленным исследователем (педагогом) или учебной программой. В этом случае учащиеся заранее предупреждаются, что результаты предстоящего тестирования на владение грамотной письменной речью успешно пройдут лишь те, кто наберет такую-то сумму баллов. То или иное количество тестовых баллов может быть определено для получения той или иной отметки успеваемости.
Неформальные тесты школьной успеваемости являются методом педагогической диагностики, конструируемыми школьными педагогами с целью объективной фиксации результатов процесса обучения в своем классе. Неформальные тесты характеризуются отсутствием строго научного подхода на всех этапах создания. Если даже формализованные тесты никогда не дают уверенности в абсолютной надежности, то несовершенным тестам, создаваемым учителями для собственного пользования, это присуще еще в большей степени. Несовершенство измерений с точки зрения их надежности находит свое практическое выражение в вычислении стандартной измерительной ошибки, то есть величины стандартного отклонения теста, которая объясняется его надежностью.
Стандартная измерительная ошибка учитывается создателями теста в процессе его подготовки. Пользователь теста в специальном приложении к тесту предупреждается, что стандартная ошибка в измерении, допустим, составляет ±4 балла. В этом случае он знает, что «истинное» значение успеваемости для ученика, набравшего 24 балла, располагается между 20 и 28 баллами. Если знать измерительные ошибки инструментария, то можно избежать переоценки его надежности и не принимать случайные расхождения результатов при их интерпретации за подлинные различия в успеваемости.
Надежность инструментария зависит – при прочих равных условиях – от количества заданий. Для неформальных тестов ошибка в измерении может быть вычислена с помощью следующего основного правила: при количестве заданий менее 24 ошибка составляет ±2 балла; при количестве заданий между 24 и 47 ошибка составляет ±3 балла; при количестве заданий между 48 и 89 ошибка составляет ±4 балла.
В мире проведено не менее нескольких десятков тысяч исследований, посвященных установлению отношений между психометрическим интеллектом и школьной успеваемостью, и с каждым годом их число возрастает. Вопрос о возможности прогнозирования успеваемости, поставленный Бине, до сих пор не утратил своей актуальности.
Пока еще никому не удалось выделить обучаемость как специфическую общую способность, отличную от общего интеллекта. Поэтому интеллект рассматривается как способность, лежащая в основе обучаемости, но не являющаяся существенным фактором, обусловливающим успешность обучения. Корреляция тестов общего интеллекта с критериями обучаемости колеблется от -0,03 до 0,61.
Для теста «Прогрессивные матрицы» Равена корреляция общего интеллекта с уровнем школьной успеваемости равна 0,70 (английские школьники). Данные, полученные в других странах по тесту Равена, менее значимы: корреляции колеблются от 0,33 до 0,61 (успеваемость по математике; немецкие школьники) и 0,72 (общая успеваемость; советские школьники).
Тест Векслера дает менее высокие корреляции с успеваемостью: вербальная шкала - до 0,65, невербальная - от 0,35 до 0,45, общий интеллект - 0,50.
Чаще всего для прогноза школьной успеваемости используют тесты структуры интеллекта или их отдельные субтесты. Например, корреляция суммарных показателей субтестов «Вербальное мышление» и «Числовые способности» теста ДАТ с успеваемостью по отдельным предметам изменяется в пределах 0,70 - 0,80.
Российские психологи не остались в стороне от общего движения и провели массу аналогичных исследований. Например, в работе Э. А. Голубевой, С. А. Изю-мовой и М. К. Кабардова выявлялись корреляции между успеваемостью по различным учебным предметам и результатами тестирования интеллекта батареей Векслера. Исследовались ученики 7-го класса. Полученные коэффициенты корреляции изменялись в диапазоне от 0,15 до 0,65 (успеваемость по черчению и невербальный интеллект). Корреляция общего интеллекта и суммарных оценок успеваемости равнялась 0,49 (для вербального интеллекта г = 0,50, для невербального интеллекта г = 0,40).
Положительные, но умеренные по величине корреляции между учебными оценками и результатами тестирования не позволяли исследователям однозначно утверждать, что интеллект детерминирует успешность обучения. Недостаточно высокие корреляции объяснялись нерелевантностью оценок в качестве критериев успешности обучения, несоответствием материала тестов содержанию учебных программ и т. д.
Анализ распределения индивидов в пространстве координат «школьные оценки» - «величина IQ» свидетельствует о наличии более сложной зависимости между интеллектом и успеваемостью, чем линейная связь.
Нетрудно заметить, что существует положительная корреляция IQ и школьной успеваемости, но для школьников с высоким уровнем интеллекта она минимальна.
Л. Ф. Бурлачук и В. М. Блейхер исследовали зависимость школьной успеваемости от уровня интеллекта (тест Векслера). В ряды слабоуспевающих школьников попали ученики и с высоким, и с низким уровнем интеллекта. Однако лица с интеллектом ниже среднего никогда не входили в число хорошо или отлично успевающих . Главной причиной низкой успеваемости детей с высоким IQ было отсутствие учебной мотивации.
средний величина IQ
Рис. 54. Соотношение между IQ и школьными оценками
Таким образом, существует нижний «порог» IQ для учебной деятельности: успешно учиться может только школьник, чей интеллект выше некоторого уровня, определяемого внешними требованиями деятельности. И вместе с тем успеваемость не растет бесконечно: ее уровень ограничивают системы оценок и требования педагогов к учащимся (см. рис. 54).
В качестве примера рассмотрим результаты исследования, в ходе которого проверялось влияние структуры групповых факторов интеллекта на успеваемость. В работе принимали участие С. Д. Бирюков и А. Н. Воронин - старшие научные сотрудники ИП РАН.
С помощью упрощенного и валидизированного нами варианта теста структуры интеллекта Амтхауэра тестировались уровни развития пространственного, вербального и числового интеллектов у школьников 5-11-х классов. Результаты тестирования сопоставлялись с учебными оценками с помощью корреляционного и регрессионного анализов.
Было обследовано свыше 2000 школьников. Анализировались данные по классам, а также отдельно по группам школьников с оценками выше и ниже средней по выборке.
Зависимости между успеваемостью по учебным предметам и уровнем развития отдельных интеллектуальных способностей удалось выявить только в группах учащихся, успеваемость которых была выше среднегрупповой. Более того, в группах учащихся 5-7-х и 8-9-х классов с успеваемостью ниже средней встречались случаи отрицательной корреляционной зависимости между уровнем интеллекта (в первую очередь - пространственного) и успеваемостью по отдельным учебным предметам. Можно сказать, что в группах неуспевающих школьников встречаются индивиды как с высоким, так и с низким уровнем интеллекта, что полностью соответствует приведенному выше графику (рис. 54).
Если учащихся разделить на группы по уровню развития интеллекта, а не по успеваемости, картина получится более сложная. Результаты конфирматорного факторного анализа свидетельствуют, что выделенные латентные факторы интеллекта и успеваемости в группах школьников с IQ ниже среднего по выборке могут быть связаны положительно, не связаны или связаны отрицательно (5 класс). У детей с интеллектом выше среднего отмечалась положительная связь двух факторов (интеллекта и общей успеваемости). Но она не велика - меньше, чем на смешанной выборке. Исключение из этого правила составляют результаты, полученные на выборках учащихся 10-11-х классов: они прошли отбор, а их менее интеллектуальные сверстники отсеялись.
Можно постулировать наличие нижнего «интеллектуального порога» учебной деятельности: ученик, который обладает IQ ниже этого порога, никогда не будет учиться успешно. С другой стороны, существует и предел успешности обучения для индивида с данным уровнем IQ.
Следовательно, учебная успеваемость (Ni) подчиняется следующему неравенству:
N(IQJ Поэтому весьма надуманными и непродуктивными представляются рассуждения о малой информативности тестов интеллекта для прогноза школьной успеваемости. Интеллект определяет лишь верхний, а деятельность - нижний предел успешности обучения, а место ученика в этом диапазоне определяется не когнитивными факторами, а личностными особенностями, в первую очередь учебной мотивацией и такими чертами «идеального ученика», как исполнительность, дисциплинированность, самоконтроль, отсутствие критичности, доверие к авторитетам . ОБЩИЙ ИНТЕЛЛЕКТ И ПРОФЕССИОНАЛЬНАЯ ДЕЯТЕЛЬНОСТЬ Тесты интеллекта, особенно так называемые тесты структуры интеллекта (тест Амтхауэра, GATB, ДАТ и т. д.), широко используют в целях профессионального отбора и распределения кадров. Данные тестирования общего интеллекта коррелируют с успешностью деятельности: для разных профессий -0,10<
г<,
0,85. Для большинства профессий корреляция равна 0,60 (тест GATB). Накопленные к 60-м годам результаты, характеризующие связь показателей тестирования интеллекта при профессиональном отборе с характеристиками успешности профессионального обучения и профессиональной деятельности, позволили сделать весьма нетривиальный вывод. Одним из первых теорию «порога интеллекта» для профессиональной деятельности предложил Д. Н. Перкинс. Согласно его концепции, для каждой профессии существует нижний пороговый уровень развития интеллекта. Люди с IQ ниже определенного уровня не способны овладеть данной профессией. Если же IQ превышает этот уровень, то между уровнем достижений в профессиональной деятельности и уровнем интеллекта нельзя проследить никакой существенной корреляционной связи. Успешность профессиональной деятельности начинает определять мотивация, личностные черты индивида, система ценностей и т. д. [б]. Таким образом, успешность деятельности как бы «ограничена снизу» - индивид не способен трудиться, если его IQ меньше некоторого «интеллектуального порога», специфичного для данной профессии. Одно из последних исследований связи интеллекта и профессиональных достижений опубликовано в 1993 году У. Шнейдером . Оно касается изучения особенностей интеллекта «экспертов» - лиц, компетентных в какой-то определенной сфере деятельности. Как правило, «эксперты» обладают интеллектом средним или не ниже среднего. Шнейдер также считает, что для каждой деятельности есть свой интеллектуальный «порог». Индивид не в силах овладеть деятельностью, если его интеллект ниже этого порога. Если же его интеллект превышает пороговое значение, то реальные достижения индивида определяют не когнитивные способности, а его настойчивость, увлеченность, темпераментальные особенности, поддержка семьи и т. д. Если интеллектуальный порог деятельности невысок, индивид может иметь и сверхвысокие, и средние значения интеллекта, но в любом случае это не отразится на его профессиональных достижениях. Можно привести еще ряд концепций, которые обобщают накопленный на сегодняшний день эмпирический материал и являются модификациями модели «нижнего интеллектуального порога», в соответствии с которой каждая деятельность характеризуется определенным уровнем требований, предъявляемых к интеллекту индивида. Существует ли «верхний» интеллектуальный порог? Иными словами: ограничены ли возможности индивида в определенной профессиональной деятельности уровнем его интеллекта? Если делать вывод по аналогии с результатами, показывающими связь интеллекта и обучаемости, то предел продуктивности профессиональной деятельности может быть выражен неравенством: Pi < Р (IQi) С другой стороны, нижний уровень достижений, порог вхождения в деятельность, задается уровнем интеллекта, минимально необходимым для овладения профессией. Следует отметить, что прогностичность тестов интеллекта выше для успешности профессионального обучения, нежели для продуктивности профессиональной деятельности. Очевидно, практическая деятельность менее контролируема, чем учебная, а ее результат зачастую менее жестко оценивается, не определен или очень отдален во времени. ОБЩИЙ ИНТЕЛЛЕКТ И КРЕАТИВНОСТЬ Проблема отношения креативности и интеллекта поставлена в тот момент, когда креативность была выделена в качестве самостоятельного фактора. Гилфорд полагал, что творческая одаренность включает в себя, по крайней мере, способности к дивергентному мышлению и к преобразованиям (IQ). Напомню, что, по Гилфорду, дивергентное мышление есть мышление, направленное на поиск разнообразных логических возможностей, способность к которому тестируется с помощью особых тестов («Необычное использование предметов», «Дополнение рисунка», «Нахождение синонимов» и т. д.). В ряде статей Гилфорд рассматривает отношение интеллекта и креативности. Он полагал, что интеллект определяет успешность понимания и усвоения нового материала, а дивергентное мышление детерминирует творческие достижения. Кроме того, успешность творческой активности предопределена объемом знаний (зависящим, в свою очередь, от интеллекта). Гилфорд высказывает предположение, что IQ будет предопределять «верхний предел» успешности решения задач на дивергентное мышление. Причем тесты креативности Гилфорда были связаны с оперированием семантическим кодом (словесной информацией), и он считал, что ограничивающая роль интеллекта для них будет выше, чем для невербальных тестов. Исследования показали, что корреляции между тестами интеллекта и дивергентного мышления выше для семантических тестов, чем для пространственных и символических. Однако результаты исследований К. Ямамото, а также Д. Хардгривса и И. Бол-тона позволяют ввести гипотезу «нижнего порога»: конвергентный интеллект (IQ) ограничивает проявления креативности при низких значениях IQ, при IQ выше некоторого «порога» творческие достижения от интеллекта не зависят. В исследованиях Гилфорда и Кристиансена также было выявлено, что при низком IQ практически не бывает проявлений творческой одаренности, в то время как среди людей с высоким IQ встречаются лица и с высоким, и с низким уровнем развития дивергентного мышления. Торренс , обобщив собственные исследования, пришел к выводу, что"связь между уровнем интеллекта и креативностью односторонняя. Он предложил модель интеллектуального порога: до уровня IQ < 120 креативность и интеллект образуют единый фактор, выше этого порога факторы креативности и интеллекта проявляются как независимые. Иначе говоря, до какого-то уровня IQ ограничивает проявление креативности, выше «порога» креативность «вырывается на свободу». Казалось бы, модель «интеллектуального порога» получила явное подтверждение. Но результаты исследований Когана и Воллаха опровергли теорию «нижнего» порога. Коган и Воллах модифицировали процедуру тестирования: сняли временной лимит, отказались от показателя «правильности» (по Гилфорду), устранили момент соревновательности. В итоге факторы креативности и интеллекта оказались независимыми . Была выявлена и описана особая группа детей с высоким уровнем креативности, но с интеллектом ниже среднего. структура орщих способностей 251 В 1980 году вышла работа Д. X. Додда и Р. М. Уайта , в которой проанализированы результаты исследования связей между IQ и оценками дивергентной продуктивности (рис. 55). 60 120 140 IQ
Рис.
55. Соотношение между дивергентной продуктивностью и интеллектом Распределение индивидов в пространстве двух координат (IQ и дивергентная продуктивность) удивительно напоминает распределения, полученные при исследовании связей интеллекта и обучаемости, а также интеллекта и успешности профессиональной деятельности. Интеллект ограничивает «сверху» уровень творческой продуктивности. Наивысшие показатели по тестам дивергентного мышления показывают индивиды с максимальными значениями IQ. Обратное не верно. Каким же образом совместить результаты Когана и Воллаха, а также результаты, полученные в нашей лаборатории, с теорией «высокого» интеллектуального порога? Неужели все дело в различии процедур получения данных или же степень регламентированности условий деятельности определяет «нижний» порог IQ для проявления креативности? Проверялась гипотеза о возможности формирования креативности как общей личностной диспозиции (включающей мотивационную, когнитивную и поведенческую составляющие) у детей 3-5 лет . В ходе исследования выявлены две важные закономерности: 1) нелинейный характер изменения креативности в ходе исследования и 2) последовательность формирования компонентов креативности - от мотивационных - к когнитивным и поведенческим. Если креативная продуктивность испытуемых детей в ходе формирующего эксперимента превышала некоторый (всегда индивидуально определенный) уровень, то у них начинали проявляться признаки дезадаптивного, неврозоподобного поведения (росла тревожность, капризность, агрессивность, эмоциональная сензи-тивность и т.д.). Эти признаки напоминают особенности поведения детей с низким уровнем интеллекта и высокой креативностью, как их описывают Воллах и Коган. Следовательно, можно объяснить этот эффект превышением уровня креативности индивидуального уровня «интеллектуального порога», который определяет успешность адаптации. К концу формирующего эксперимента у большинства детей уровень креативности был выше, чем в начале, но меньше, чем в середине исследования, то есть достиг некоторого индивидуального оптимума. Хотя методика диагностики креативности в нашей работе отличалась от тестов креативности Торранса и Гилфорда и состояла в фиксации проявлений творческого поведения детей при спонтанной ситуативной игре, результаты ее можно объяснить с помощью той же модели «интеллектуального порога». Базовым условием формирования креативности и ее проявления в повседневной жизни является формирование у индивида творческой мотивации. По нашим данным, оптимальным периодом ее формирования является возраст от 3,5 до 4 лет. Итак, можно заключить, что творческая активность детерминируется творческой (внутренней) мотивацией, проявляется в особых (нерегламентированных) условиях жизнедеятельности, но «верхним» ограничителем уровня ее проявления служит уровень общего («флюидного», по Кэттелу) интеллекта. Аналогично существует и «нижний» ограничитель: минимальный уровень интеллекта, до достижения которого креативность не проявляется. Условно отношение между творческой продуктивностью и интеллектом можно свести к неравенству вида: IQ «деятельности» < Сг < IQ «индивида» Если исходить из этого отношения, то речь не может идти об «интеллектуальном пороге». Интеллект индивида выступает в качестве «верхнего ограничителя», потолка потенциальных творческих достижений. Использует или нет индивид отведенные ему природой возможности, зависит от его мотивации, компетентности в той сфере творчества, которую он для себя избрал, и, разумеется, от тех внешних условий, которые предоставляет ему общество. Нижний «интеллектуальный порог» определяется «регламентированностью» сферы, в которой индивид проявляет свою творческую активность. «ОДНОМЕРНАЯ МОДЕЛЬ» Попытаемся обобщить приведенные выше результаты. Уточним еще раз основные понятия: 1. Индивидуальная продуктивность является мерой пригодности индивида к той или иной сфере жизнедеятельности (творческой, учебной, профессиональной). Индивидуальная продуктивность может оцениваться актуальной успеваемостью, уровнем профессиональных достижений, успешностью решения тестов на креативность (гибкость, уникальность, оригинальность и пр.). 2. Уровень интеллекта определяется успешностью выполнения тестов интеллекта (типа «Прогрессивных матриц» Равена), тождествен флюидному интеллекту (Gf), по Кэттеллу, или общему интеллекту, по Спирмену. Между этими переменными существует определенная зависимость, отображенная на графике (рис. 56). ^~" п ^ \
01 Рис. 56.
Модель интеллектуального диапазона Здесь: Y - продуктивность; Х - интеллект; Xi - индивидуальный интеллект; Xj - «интеллектуальный порог» деятельности; Yi - предельная индивидуальная продуктивность; Yj - требуемая минимальная продуктивность в деятельности; AYi Xj - диапазон продуктивности, а - определяется строгостью критерия оценки продуктивности (чем строже критерий, тем меньше успех а). Дадим более подробное описание модели. 1. «Верхний порог»
Верхняя граница продуктивности (предельный уровень индивидуальных достижений) задается индивидуальным уровнем интеллекта. Предельный уровень достижений является линейной функцией от интеллекта: P^,=k(Gf)+CHPi
где О < k <.
1 определяется спецификой внешних условий; Gf - уровень IQ i-ro индивида; С - начальный уровень компетентности, необходимый для «вхождения» в деятельность; Pi - индивидуальная продуктивность. 2. «Нижний порог»
Нижнюю границу индивидуальных достижений в деятельности определяют требования деятельности, которые проявляются в феномене «интеллектуального порога». Если IQ индивида ниже определенного значения, то индивид не может проявить минимально необходимую продуктивность и «не проходит по конкурсу». Следовательно, продуктивность индивида не может быть ниже определенного минимального значения, соответствующего уровню нижнего интеллектуального порога деятельности Gf. Р. < Р, где Gf. - уровень интеллектуального порога j-й деятельности. 3. Диапазон достижений
Индивидуальная продуктивность определяется, помимо IQ, уровнем мотивации и «приобщенностью к задаче» (иначе, уровнем специальных навыков и знаний, аналог - «кристаллизованный» интеллект). Следовательно, можно предположить, что недостаток мотивации и компетентности препятствует индивиду достичь верхнего порога индивидуальных достижений. Возможно: R = k (Gf, -mx Gi),
где М - величина, обратная уровню мотивации («недомотивированность»); Gf - недостаток компетентности. Модель имеет три любопытных следствия: 1. Успех вхождения индивида в деятельность определяется лишь уровнем индивидуального интеллекта и сложностью деятельности. 2. Уровень конкретных индивидуальных достижений зависит от мотивации и компетентности личности и связан с содержанием деятельности. 3. Предельно высокий уровень индивидуальных достижений зависит только от индивидуального IQ, но не зависит от трудности деятельности и ее содержания. Модель (назовем ее «моделью интеллектуального диапазона») имеет еще два интересных следствия. Во-первых, согласно приведенным выше теоретическим соображениям, у интеллектуально одаренных индивидов корреляции между успешностью деятельности и уровнем интеллекта должны быть ниже, чем по всей выборке. Причина этого - в расширении диапазона продуктивности: дисперсия продуктивности у одаренных людей больше, чем по выборке в целом. Корреляции между успешностью выполнения отдельных тестов (или продуктивностью выполнения деятельностей у одаренных личностей) должны быть ниже, чем у «обычных» людей. Причины этого эффекта: независимость успешности решения тестов друг от друга (они связаны только через G-фактор); большой разброс показателей продуктивности у одаренных; обусловленность положения индивида в плоскости координат «тесты - интеллект» мотивацией и компетентностью. Этот феномен обнаружен в многочисленных корреляционных исследова ниях: действительно, у интеллектуально одаренных испытуемых корреляции успешности тестов ниже, чем для генеральной совокупности. Во-вторых, для высокоодаренных испытуемых характерна «пила» достижений в разных сферах деятельности, успешности по разным учебным дисциплинам и при выполнении тестовых заданий. Действительно, индивидуальный интеллект определяет лишь верхний порог достижений. У одаренных индивидов диапазон возможных достижений шире, чем у всех прочих. Поэтому, при независимости достижений в разных областях, в среднем для группы одаренных разница показателей по отдельным тестам, задачам и т. д. будет больше, чем по генеральной совокупности. И неслучайно множество корреляционных исследований показывает, что интеллектуальная одаренность сопровождается большим разбросом индивидуальных достижений в различных сферах деятельности, по предметам обучения и т. д. Модель может быть расширена для описания структуры интеллекта с учетом его основных групповых факторов. СТРУКТУРА ОБЩЕГО ИНТЕЛЛЕКТА. ИМПЛИКАТИВНАЯ МОДЕЛЬ Как уже упоминалось, Ч. Спирмен выявил в структуре общего интеллекта лингвистический (вербальный), механический (пространственно-динамический) и математический факторы. Критики концепции Спирмена (в частности, Торндайк) отрицали существование общей умственной способности и считали, что следует говорить о множестве независимых способностей (от 3 до 120 «факторов»). Однако, когда Айзенк и Спирмен подвергли статистической обработке данные Торндайка, они обнаружили ошибочность его расчетов и выявили в данных оппонента общий фактор интеллекта. Практически все исследователи выявляли три основных подфактора общего интеллекта, которые были первоначально выявлены Ч. Спирменом: числовой, пространственный, вербальный. Например, в исследованиях Р. Е. Сноу и его коллег выделены следующие структуры: 1) общий фактор, который тестируется такими тестами, как «Прогрессивные матрицы» Равена, тестом, свободным от культуры, Кэттелла и пр., занимает вершину иерархии; 2) на втором уровне обобщенности выделяются три (как и у Спирмена) основных фактора, причем один из них более тесно связан с генеральным фактором; 3) низший уровень иерархии занимает десять подфакторов. Н. Хомский в 60-е годы выдвинул гипотезу о том, что ребенок рождается с механизмом овладения языком и изначально обладает восприимчивостью к универсальным свойствам грамматики языка. Позже ряд исследователей (Дж. Макнамара, М. Дональдсон и др.) показали, что дети усваивают язык только после того, как у них проявляется способность понимать смысл ситуаций, связанных с социальным поведением людей. Ряд изящных экспериментов продемонстрировали справедливость этого вывода. Отсюда можно сделать вывод о первичности «эмоционально-поведенческого кода» и операций, связанных с ним, по отношению к естественной речи и способности оперировать «натуральным» языком. Дональдсон пишет по этому поводу: «На ранних стадиях развития, до того как у ребенка сформируется полное осознание языка, язык включен в поток событий, в связи с которыми он используется. До тех пор пока это происходит, ребенок понимает не отдельные слова, он интерпретирует ситуацию в целом, Его больше заботит смысл того, что делают люди, когда они говорят и действуют, чем значение слов... В то же время ребенок занят структурированием, извлечением смысла ситуаций, даже когда никаких слов не произносится; порой кажется, что, когда они все-таки звучат, на понимание ребенком прозвучавшего высказывания сильно влияет, как он сам структурирует контекст» . Таким образом, «первичным» является поведенческий интеллект (он же - смысловой). Основные предположения таковы: 1) между групповыми факторами интеллекта (по Спирмену-Гилфорду) существует иерархическая импликативная зависимость, факторы неортогональны; 2) для развития фактора следующего уровня необходим минимальный уровень развития предыдущего фактора; 3) генетическая очередность формирования факторов интеллекта: поведенческий, вербальный, пространственный, формальный. Итак, «поведенческое мышление» первично, следовательно, прав Гилфорд, выделявший поведенческий («социальный») интеллект в качестве самостоятельного фактора наряду с вербальным (смысловым), пространственным и арифметическим. Операции поведенческого интеллекта, с моей точки зрения, обладают следующими признаками: 1)
контекстуальностью - смысл операции зависит от ситуации; 2)
непрерывностью - хотя действие конечно (определяется достижением цели), но движение - непрерывно; 3) нет необратимости операций во времени (в прошлое не вернешься, «чашка разбита»); 4) эмоциональной насыщенностью; 5) неоднозначностью смысла операций - следствие ситуационной зависимости. Язык позволяет выйти за пределы наличной ситуации: он как бы выносит вовне точку отсчета и позволяет субъекту «децентрироваться» - выйти за пределы ситуации (взаимодействия «Я» и другого), «встать над ситуацией». Первый шаг на пути усвоения языка и формирования речевого мышления - освобождение последнего от связи с конкретными событиями и овладение им как самостоятельной структурой. Наибольшая трудность возникает при освобождении высказывания от ситуационного контекста. Звучащая речь и речевое мышление, строящееся на этой основе, также обладают рядом признаков: 2) мышление (содержание и операции) является непрерывным (главная трудность возникает у ребенка при обучении чтению - необходимость выделения в речевом потоке отдельных слов и фонем); 3) речевые операции необратимы («слово не воробей...»); 4) существует эмоциональная насыщенность (конативная составляющая); 5) смысловая неоднозначность (феномены омонимии и синонимии); Переход к письменной речи требует развития пространственно-динамического мышления. Мышление «изображениями» - пространственно-временными схемами - строится на взаимодействии зрительного и тактильного анализаторов с предметами окружающего мира, причем зрение само по себе не дает представления о «физике» окружающего мира: силах, плотности и массе предметов, их «податливости» воздействию и др. Условно из целостного «механического» интеллекта можно выделить пространственный интеллект (S-фактор, по Терстоуну). Он измеряется тестами на мысленное вращение предметов и на быстрое восприятие и идентификацию изображений. Пространственный интеллект является следующей ступенью в генетической иерархии. Он характеризуется следующими особенностями: 1) независимостью содержания и операций от ситуационного контекста; 2) инвариантностью операции относительно пространства; 3) обратимостью операций во времени; 4) независимостью от ситуации; 5) однозначностью отношения изображения к содержанию; 6) почти полным отсутствием эмоциональной составляющей. Письменная речь - это перевод устной речи в пространственный изобразительный код. И она не может развиваться до определенного уровня сформированное™ пространственного мышления. Устное слово существует во времени, написанное - в пространстве, и его содержание существует вне времени. Письменная речь инвариантна по отношению к ситуации и ко времени, а чтение (активное) есть шаг к осознанию языка. Пассивное чтение (слушание) - совсем другое явление. В частности, выявлено, что, читая самостоятельно, дети задают вопросы о языке, а слушая - только о поведении героев и о сюжете. В 4 года ребенок начинает разбивать слышимый им речевой поток на «кусочки». До этого дети не осознают, что речевой поток не непрерывен, а состоит из слов. Первый шаг, который они делают на пути к к расчленению процесса мышления на элементы, связан с оперированием пространственным изобразительным кодом: буква - это первая пространственная схема. При этом замечено, что ребенок рисует (и мыслит пространственно) тем лучше, чем лучше проговаривает свои действия при рисовании. Многие педагоги отмечают феномен спонтанного проговаривания ребенком своих действий при рисовании. Наконец, последним по времени формирования является формальный (или знаково-символический) интеллект. Он базируется на «искусственных» языках, которыми ребенок овладевает позже, чем остальными. Первый искусственный язык, которым овладевает ребенок, - натуральный ряд чисел. Он также базируется на «пространственном коде»: первично порядковое число, и лишь позже ребенок овладевает отвлеченным понятием числа. «Первый» и «второй» предшествуют «одному» и «двум». Приведем основные свойства формально-знакового интеллекта: 1) независимость содержания и операций от контекста; 2) дискретность знаков и операций; 3) обратимость операций во времени; 4) надситуативность операций; 5) однозначность смысла: нет перекрытия смыслов; 6) нет эмоциональной составляющей значения (эмоциональной семантики); и - новый признак: 7) произвольность знака по отношению к содержанию, которое определяется системой отношений между знаками (структурой искусственного языка в целом). Только на уровне операций с числом и другими искусственными знаками возможно полностью надситуативное мышление, когда операции полностью независимы от предметного содержания задачи. При формально-символическом мышлении возможен переход от одной содержательной задачи к другой через отождествление их структур с некоторой формальной структурой. На уровне «пространственно-механического» интеллекта возможен лишь «трансфер» - «горизонтальный перенос» операций с одной задачи на другую по методу аналогий: Нетрудно заметить, что при последовательном переходе от «поведенческого» интеллекта к формальному убывает эмоциональная составляющая «кода» (материала, отношений и операций), возрастает однозначность и произвольность обозначения (выражения) по отношению к содержанию, растет независимость операций от ситуации, контекста, пространства и времени: проявляются инвариантность и обратимость операций. В зависимости от индивидуальной комбинации влияний генетических и сре-довых факторов дети по-разному овладевают перечисленными «универсальными кодами» интеллекта, и эти различия проявляются с момента овладения кодом. Например: при факторизации батареи тестов Векслера, проведенной на детях 6 лет, выявляются три фактора: общий интеллект, вербальный и невербальный (механический и пространственный) интеллекты, между тем как у подростков и взрослых дополнительно выделяется 4-й фактор, включающий субтесты на числовом материале. «Поведенческий» интеллект является как бы базой для развития всех прочих форм интеллекта. ЧЕТЫРЕХМЕРНАЯ МОДЕЛЬ Рассмотрим формальные отношения групповых факторов интеллекта. Предположим, что общий интеллект определяет успешность выполнения любого теста (вербального, пространственного, числового). Зависимость успешности выполнения любого теста от уровня общего интеллекта описывается ранее рассмотренной моделью: 1) необходим минимальный уровень интеллекта («порог»), чтобы овладеть инструкцией и операциями, требуемыми для выполнения теста, 2) чем выше уровень общего интеллекта, тем выше предельная продуктивность, 3) реальная продуктивность индивида может располагаться в диапазоне продуктивности, определяемой интеллектуальным «порогом» теста и индивидуальным общим интеллектом. Продуктивность детерминируется мотивацией и развитием специальной компетентности (специальный фактор). Общий интеллект задает верхнюю границу для его проявления. Предположим также, что для овладения каждым видом «кода»: речевым, пространственным, формально-знаковым, требуется некоторый начальный минимальный уровень интеллекта («порог»). Этот «порог» определяется эмпирически. Овладение каждым видом «кода» приводит к возникновению нового интеллектуального фактора - интеллектуальной способности: вербальной, пространственной, формально-логической. Причем каждый новый «код» базируется на предыдущих: вербальный - на поведенческом, пространственный - на поведенческом и вербальном и т. д. Для того чтобы новая способность возникла, необходим минимальный уровень развития предыдущей, которая задает пределы для развития и проявления новой способности. Итак, уровень развития базового интеллектуального фактора только ограничивает возможность развития других. Причем диапазон возможностей будет колебаться в диапазоне, определяемом уровнем развития предшествующего фактора и «порогом», необходимым для развития последующего фактора. Рис. 57.
Гипотетические отношения между вербальным (V) и пространственным (S) факторами интеллекта (ср. с рис. 56) На рис. 57 представлены гипотетические отношения между вербальным (V) и пространственным (S) факторами интеллекта. Аналогичные отношения должны существовать между пространственным и числовым факторами. Таким образом, уровень индивидуального общего интеллекта неоднозначно определяет его структуру: овладение каждым следующим кодом предполагает повышение «интеллектуального порога» - уровня развития предшествующего фактора, минимально необходимого для развития последующего, но индивидуальный уровень развития фактора лишь указывает на верхний предел развития факторов более высокого уровня (более поздних по происхождению).
Качество обучения напрямую зависит от количества, глубины, своевременности и объективности оценки получаемых знаний. Грамотно составленные тесты позволяют определять уровень усвоения знаний и степень формирования навыков в процессе обучения.
Применение диагностических тестов в зарубежных школах имеет давнюю историю. Признанный авторитет в области педагогического тестирования Э. Торндайк (1874-1949) выделяет три этапа внедрения тестирования в практику американской школы:
1. Период поисков (1900-1915). На этом этапе происходило осознание и первоначальное внедрение тестов памяти, внимания, восприятия и других, предложенных французским психологом А. Бинэ. Разрабатываются и проверяются тесты интеллекта, позволяющие определять коэффициент умственного развития.
2. Последующие 15 лет - годы «шума» в развитии школьного тестирования, приведшие к окончательному осмыслению его роли и места, возможностей и ограничений. Были разработаны и внедрены тесты О. Стоуна по арифметике, Б. Зекингема для проверки правописания, Э. Торндайка по диагностике большинства школьных предметов. Т. Келли разработал способ измерения интересов и наклонностей обучаемых (при изучении алгебры), а Ч. Спирмен предложил общие основы использования корреляционного анализа для стандартизации тестов.
3. С 1931 г. начинается современный этап развития школьного тестирования. Поиски специалистов направляются на повышение объективности тестов, создание непрерывной (сквозной) системы школьной тестовой диагностики, подчиненной единой идее и общим принципах, созданию новых, более совершенных средств предъявления и обработки тестов, накопления и использования диагностической информации.
Напомним в связи с этим, что педагогика, развившаяся в России в начале века, безоговорочно приняла тестовую основу объективного школьного контроля.
После известного постановления ЦК ВКП(б) «О педологических извращениях в системе Наркомпроса» (1936) были ликвидированы не только интеллектуальные, но и безобидные тесты успеваемости. Попытки возродить их в 70-х годах ни к чему не привели. В этой области наша наука и практика значительно отстали от зарубежной.
В школах развитых стран внедрение и совершенствование тестов шло быстрыми темпами. Широкое распространение получили диагностические тесты успеваемости, использующие форму альтернативного выбора правильного ответа из нескольких правдоподобных, написания очень краткого ответа (заполнения пропусков), дописывания букв, цифр, слов, частей формул и т. п. С помощью этих несложных заданий удается накапливать значительный статистический материал, подвергать его математической обработке, получать объективные выводы в пределах тех задач, которые предъявляются к тестовой проверке. Тесты печатаются в виде сборников, прилагаются к учебникам, распространяются на цифровых носителях.
Проблема соотношения устных и письменных форм контроля разрешается в большинстве случаев в пользу последних. Считается, что хотя устный контроль больше способствует выработке быстрой реакции на вопросы, развивает связную речь, он не обеспечивает надлежащей объективности. Письменная проверка, обеспечивая более высокую объективность, кроме того, способствует развитию логического мышления, целенаправленности: обучаемый при письменном контроле более сосредоточен, он глубже вникает в сущность вопроса, обдумывает варианты решения и построения ответа. Письменный контроль приучает к точности, лаконичности, связности изложения мыслей.
В области определения системы оценок (отметок) наблюдается большое разнообразие как в принципах, так и в конкретных подходах, выборе способов оценивания и выставлений оценок. В зарубежных образовательных заведениях практикуются различные системы оценивания знаний, умений, навыков, приняты различные шкалы оценок, включая сто-, двенадцати-, десяти-, двухбалльную и др. Во французском лицее, например, при сдаче выпускных экзаменов результаты определяются по 20-балльной шкале. При этом для каждого предмета устанавливается определенный весовой коэффициент, определяющий значимость данного предмета для избранной обучаемым специальности, профиля или отделения лицея. Благодаря этому оценки по профилирующим предметам приобретают большую весомость.
При значительной децентрализации большинства зарубежных образовательных систем, при условии свободного выбора школой учебных планов и программ, а обучаемыми - учебных предметов редко проводятся централизованные проверки и оценивание знаний, умений. В Великобритании, например, функцию практического контроля за качеством академической подготовки берут на себя университетские комиссии, к которым на период сдачи выпускных экзаменов прикрепляются все грамматические и привилегированные школы, ориентирующиеся в подготовке своих выпускников на дальнейшее университетское образование.
В целом же нужно признать, контроль и учет успеваемости, диагностирование обученности в зарубежных школах носят характер объективной констатации результатов. Он не предполагает заботу о всеобуче. Общепринятый принцип индивидуализации обучения диктует один подход - каждый идет своим путем и темпом, обучается в меру своих возможностей, потребностей, реальных оценок будущего.
До революции в России существовала шестибалльная система оценки знаний с баллами от нуля до пяти. В 1918 г. оценка «0» была упразднена. Но постепенно и оценка «1» стала использоваться все реже, а начиная с 50-х годов все меньше стала использоваться и оценка «2». Пятибалльная система оценок фактически превратилась в трехбалльную, а для большинства обучаемых, которые не могут учиться на «4» и «5», эта шкала стала двухбалльной. Такая оценочная система очень слабо стимулирует учебный труд, «ступенька» между тройкой и четверкой непреодолима для большинства обучаемых.
Однако многие педагоги используют «дополнения» к обычной пятибалльной шкале в виде знаков «плюс», «минус». Реально получается три градации пятерки («пять с плюсом», «пять», «пять с минусом»), три градации четверки (аналогично), три градации тройки и двойки. Получается типичная десятибалльная шкала оценок.
Научно-исследовательские учреждения РАО предложили новые оценочные шкалы, которые проходят экспериментальную проверку в различных регионах страны. Некоторые регионы склонны принять двенадцатибалльную систему оценок, в которой кроме названных десяти баллов существует два экстремальных: балл «1» - «спасайте» - свидетельствует о том, что учащийся требует немедленной индивидуальной помощи или особенного внимания, вплоть до помещения в специальное учебное учреждение; высший балл «12» - экстремальный максимум («ура»), свидетельствующий о появлении способного и чрезвычайно одаренного учащегося, которого следует обучать индивидуально по специальной программе или же в учебном заведении с углубленным изучением предметов.
Слово «тест» английского происхождения и на языке оригинала означает «испытание», «проверка». Тест обученности - это совокупность заданий, сориентированных на определение (измерение) уровня (степени) усвоения определенных аспектов (частей) содержания обучения.
Правильно составленные тесты обученности должны удовлетворять ряду требований. Они должны быть:
Если в основу классификации тестов положить различные аспекты (компоненты) развития и формирования человеческих качеств, то она будет выглядеть следующим образом:
1. Тесты общих умственных способностей, умственного развития. Применение тех или иных тестов будет наиболее успешным и обеспечит надежные выводы лишь при условии правильного их сочетания со всеми другими группами тестов. Поэтому тестовые испытания всегда имеют комплексный характер. Делать общие выводы, например, об уровне развития обучаемых на основе применения лишь тестов обученности было бы непростительной ошибкой. Когда ставится задача диагностирования обученности в связи с достижениями и развитием личности, нужно применять соответствующие виды тестовых заданий и предписанные им методики измерения, не забывая о локальном характере диагностирования.
При разработке тестов важно, насколько они соответствуют запроектированным целям обучения, образования, развития обучаемых. Важнейшими критериями диагностических тестов обученности являются действенность (валидность, показательность), надежность (вероятность, правильность), дифференцированность (различимость).
Действенность
теста по своему содержанию близка к требованию полноты, всесторонности проверки, пропорционального представления всех элементов изучаемых знаний, умений. Термин «действенность» имеет, как минимум, два синонима - валидность (от англ.
valid
- имеющий значение, ценный) и показательность, представительность, трактуемые так же, как репрезентативность. Всегда имеется в виду, что составитель теста обязан тщательно изучить все разделы учебной программы, учебные книги, хорошо знать цель и конкретные задачи обучения. Лишь тогда он сможет составить тесты, которые будут действенными для определенной категории обучаемых.
Четкая и ясная постановка вопроса в пределах освоенных знаний - неотъемлемое условие действенности теста. Если тест выходит за пределы освоенного содержания или же не достигает этих пределов, превышает запроектированный уровень обучения, то он не будет действенным для тех обучаемых, которым он адресован. Действенность теста определяется статистическими методами. Величина 0,7-0,9 свидетельствует о высокой действенности тестов обученности. Если же коэффициент корреляции достигает 0,45-0,55, то действенность теста считается удовлетворительной, при более низких значениях она считается неудовлетворительной.
Степень
надежности
характеризуется стабильностью, устойчивостью показателей при повторных измерениях с помощью того же теста или его равноценного заменителя. Количественно этот показатель характеризуется вероятностью достижения запроектированных результатов (правильностью значений). Грамотно составленные и апробированные тесты обученности позволяют достичь коэффициента надежности 0,9. Установлено, что надежность теста повышается при увеличении количества тестовых заданий.
Установлено также, что чем выше тематическое, содержательное разнообразие тестовых заданий, тем ниже надежность теста. Это следует понимать так: тест, нацеленный на проверку усвоения конкретной темы, всегда будет более надежным, чем тест, направленный на проверку всего раздела (курса), охватывающий значительное количество материала - закономерностей, концепций, фактов. Происходит это именно потому, что содержательное разнообразие последнего выше.
Надежность тестов обученности значительно зависит от трудности их выполнения. Трудность определяется по соотношению правильных и неправильных ответов на тестовые вопросы. Включение в состав тестов таких заданий, на которые все обучаемые отвечают правильно или же, наоборот, неправильно, резко снижает надежность теста в целом. Наибольшую практическую ценность имеют задания, на которые правильно отвечают 45-80% обучаемых.
Характеристика
дифференцированности
(различимости) связана с использованием таких тестов, где нужно выбирать правильный ответ из нескольких возможных альтернатив. Если, скажем, все учащиеся безошибочно находят правильный ответ на один вопрос и также дружно не могут ответить на другой, то это сигнал для совершенствования теста в целом. Его необходимо дифференцировать, сделать различимым. Иначе подобные задания не помогут отделить тех, кто усвоил материал на необходимом уровне, от тех, кто заданного уровня не достиг. Практически дифференцируют тесты по результатам статистического анализа, сравнивая результаты выполнения теста в целом с результатами выполнения отдельных заданий. Если коэффициент корреляции между ответами на конкретные задания и на тест в целом больше 0,5, то это свидетельствует о достаточной дифференцированности теста.
При подготовке материалов для тестового контроля необходимо придерживаться таких основных правил:
1. Нельзя включать ответы, неправильность которых на момент тестирования не может быть обоснована учащимися. Тесты обученности применяются на всех этапах дидактического процесса. С их помощью обеспечивается предварительный, текущий, тематический и итоговый контроль знаний, умений, учет успеваемости, академических достижений.
Предварительный контроль.
Успех изучения любой темы (раздела или курса) зависит от степени усвоения тех понятий, терминов, положений и т.д., которые изучались на предшествующих этапах обучения. Если информации об этом у преподавателя нет, то он лишен возможности проектирования и управления в учебном процессе, выбора оптимального его варианта. Необходимую информацию преподаватель получает, применяя предварительный контроль (учет) знаний. Последний необходим еще и для того, чтобы зафиксировать (сделать срез) исходный уровень обученности. Сравнение исходного начального уровня обученности с конечным (достигнутым) позволяет измерять «прирост» знаний, степень сформированности умений и навыков. Если известны входные и выходные характеристики системы, проблемы ее оптимизации считаются во многом решенными.
Собрать максимальный объем информации о входных характеристиках обученности и оценить их в количественных показателях удается с помощью тестирования, которое осуществляется с помощью специально разработанных для этой цели заданий.
Текущий контроль.
Он необходим для диагностирования хода дидактического процесса, выявления динамики последнего, сопоставления реально достигнутых на отдельных этапах результатов с запроектированными. Кроме собственно прогностической функции текущий контроль и учет знаний, умений стимулирует учебный труд учащихся, способствует своевременному определению пробелов в усвоении материала, повышению общей продуктивности учебного труда.
Тематический контроль.
Составление тематического тестового задания требует кропотливого и тщательного труда. Ведь речь идет не просто о проверке усвоения отдельных элементов, а о понимании системы, объединяющей эти элементы. Значительную роль при этом играют синтетические, комплексные задания, объединяющие вопросы об отдельных понятиях темы, направленные на выявление информационных связей между ними.
Итоговый контроль.
Осуществляется во время заключительного повторения, а также в процессе экзаменов (зачетов). Именно на этом этапе дидактического процесса систематизируется и обобщается учебный материал. С высокой успешностью могут быть применены соответствующим образом составленные тесты обученности.
Естественно, не все необходимые характеристики усвоения можно получить средствами тестирования. Такие, например, показатели, как умение конкретизировать свой ответ примерами, знание фактов, умение связно, логически и доказательно выражать свои мысли, некоторые другие характеристики знаний, умений, навыков диагностировать тестированием невозможно. Это значит, что тестирование должно обязательно сочетаться с другими традиционными формами и методами проверки.
И. П. Подласый
Тестирование достижений и развития
2. Тесты специальных способностей в различных областях деятельности.
3. Тесты обученности, успеваемости, академических достижений.
4. Тесты для определения отдельных качеств (черт) личности (памяти, мышления, характера и др.).
5. Тесты для определения уровня воспитанности (сформированности общечеловеческих, нравственных, социальных и других качеств).
2. Неправильные ответы должны конструироваться на основе типичных ошибок и должны быть правдоподобными.
3. Правильные ответы среди всех предлагаемых ответов должны размещаться в случайном порядке.
4. Вопросы не должны повторять формулировок учебника.
5. Ответы на одни вопросы не должны быть подсказками для ответов на другие.
6. Вопросы не должны содержать «ловушек».
Тесты школьной успеваемости являются методами педагогической диагностики, с помощью которого результаты планируемого учебного процесса могут быть максимально объективно, надежно и валидно измерены, обработаны, интерпретированы и подготовлены к использованию в педагогической практике учителями.
Выделяют следующие виды тестов школьной успеваемости: а) ориентированные на соотносительную группу; б) ориентированные на критерии. Также они могут быть формализованными и неформализованными (неформальными).
Тесты школьной успеваемости, ориентированные на соотносительную группу, предполагают сопоставление индивидуального результата тестирования каждого ученика с результатами, полученными с помощью релевантной выборки (чаще всего это все классы школьного выпуска). Составление тестов данного типа включает следующие этапы: а) подготовительное планирование, б) анализ учебных программ и учебников, в) конструирование заданий, г) анализ заданий, д) выверка.
Этап подготовительного планирования предполагает обдумывание следующих вопросов: кто, что и почему подлежит исследованию? Например, если необходимо определить учащихся для дополнительных занятий, то нет необходимости тестировать весь класс, можно взять лишь более слабую его половину. Необходимо продумать, какие формы успеваемости будут исследоваться – устные, письменные или моторные, что будет выноситься на первый план – умение мыслить или запоминать и т.д.
После определения цели и функции тестирования необходимо провести анализ учебных планов, программ и учебников. Здесь обращается внимание на то, каков уровень требуемых знаний, умений и навыков. Уровень узнавания изученного материала, репродуктивного воспроизведения усвоенного или творческого использования в новой ситуации.