Нет хороших и плохих методов,
есть хорошее и плохое их применение.
Б.М. Теплов
Наблюдая и измеряя характеристики объекта, экспериментатор собирает первичный статистический материал. Дальнейшая задача состоит в такой обработке и представлении первичных данных, которые позволили бы оценить и сопоставить результаты для проверки гипотез, для выявления существенных свойств и закономерностей педагогического процесса. В основе методов обработки лежит предварительное упорядочение, cиcтeмaтиaция первичных данных и вычисление их статистических характеристик.
Обобщенный алгоритм подготовки
данных может быть представлен следующим
операциями:
а) все данные формулируются и
записываются в необходимой краткой форме;
б) проводится группировка данных, то есть распределение их на однородные группы в
соответствии с интересующими экспериментатора признаками. Данные в каждой группе упорядочиваются - классифицируются,
сортируются, структурируются
в соответствии с той моделью, которая разрабатывалась при
составлении плана-программы
(линейный, параллельный или перекрестный
эксперимент);
в) устанавливаются характеристики (признаки, параметры каждой группы
данных и производится подсчет
абсолютного числа факторов,
характеризующих группу
(число учащихся, уроков, отметок, ответов и т.д.);
г) данные внутри каждой сформированной группы располагаются в ряд (вариационный ряд) по убыванию
или возрастанию признака.
Определяется наибольшее и наименьшее
значения признака;
д) вариационные ряды данных, полученных в номинальной или порядковой
шкале, ранжируются. Интервалы
группировки по рангам
выбираются оптимальными (слишком крупные интервалы скрывают
нюансы явлений, слишком
дробные -
затрудняют o6pаботку). В
результате этой операции
появляются новые количественные
данные;
е) проводится
статистическая обработка полученных количественных данных, заключающаяся в вычислении
некоторых статистических характероистик и оценок,
позволяющих глубже понять
особенности экспериментальных явлений;
ж) составляются наглядные материалы,
отображающие полученную информацию:
таблицы, графики, диаграммы, схемы и др., по которым в дальнейшем устанавливаются и
анализируются связи между
параметрами экспериментальных объектов.
Педагогические
явления относятся к числу массовых: они
охватывают большие совокупности людей,
повторяются из года в год, совершаются
непрерывно. Показатели (параметры, результаты)
педагогического процесса имеют вероятностный
характер: одно и то же
педагогическое воздействие может приводить к
различным следствиям (случайные события). Тем не менее, при многократном
воспроизведении условий
определенные следствия
появляются чаще других, - это и есть проявление
так называемых статистических закономерностей
(изучением которых занимаются теория
вероятностей и математическая статистика).
Методы математической статистики в
последние десятилетия стали применяться и в
педагогике. Поэтому экспериментатору необходимо
знание ряда простейших понятий математической
статистики и умение с ними работать.
Все множество интересующих
исследователя однородных явлений, событий или их
показателей называется генеральной
совокупностью данных объектов. Та часть
последней, которая подвергается
экспериментальному изучению, называется
выборочными совокупностью или выборкой.
Величина (объем) выборки
представляет собой абсолютное (счетное)
количество однородных объектов исследования
(явлений, событий или их характеристик).
Выборка характеризуется рядом
статистических характеристик, наиболее
употребительными из которых являются:
относительное (процентное) значение, удельное
значение, среднее арифметическое значение,
дисперсия, среднее квадратичное отклонение
среднего арифметического.
Относительное значение
данного показателя - это отношение числа
объектов, имеющих этот показатель, к величине
выборки. Выражается относительным числом или в
процентах (процентное значение).
Пример: Успеваемость в классе =
числу положительных итоговых отметок, деленному
на число всех учащихся класса. Умножение этого
значения на 100 дает успеваемость
в процентах.
Удельное значение данного
признака - это расчетная величина, показывающая
количество объектов с данным показателем,
которое содержалось бы в условной выборке, состоящей из 10, или
100, 1000 и т. д. объектов.
Пример: Для сравнения уровня
правонарушений в разных регионах берется
удельная величина - количество правонарушений на
1000 человек (N)
N = (число
правонарушений в регионе)*1000
(население региона)
Среднее значение данного показателя выборочной совокупности (арифметическое среднее, выборочное среднее) - это отношение суммы всех измеренных значений показателя к величине выборки.
(1)
Среднее
значение недостаточно полно характеризует выборку; за ним скрывается
“поведение” самого показателя явления—“разброс”, различное
распределение его значений около среднего
(так называемая “функция
распределения”).
Пример: Наблюдение посещаемости
четырех внеклассных мероприятий в
экспериментальном (20 учащихся) и контрольном (30)
классах дали значения (соответственно): 18, 20, 20, 18 и
15, 23, 10, 28. Среднее значение посещаемости в обоих
классах получается одинаковое - 19. Однако видно,
что в контрольном классе этот показатель
подчинен воздействию каких-то специфических
факторов.
Для оценки степени разброса
(отклонения) какого-то показателя от его среднего
значения, наряду с максимальным и минимальным
значениями, используются понятия дисперсии и
среднего квадратичного отклонения.
Дисперсией (d 2) статистического показателя
называется среднее значение
квадратов отклонений отдельных его значений от
среднего выборочного; дисперсия определяется по
формуле:
(2)
Средним квадратическим отклонением (экспериментальным) называется корень квадратный из дисперсии.
(3)
Пример: Для предыдущего случая имеем
классы | |||
Экспериментальный контрольный |
19 19 |
1 48,5 |
1 7 |
Это означает, что в
одном классе посещаемость
высокая, стабильная, а 1 другом -
отличается непостоянством.
Дисперсия и среднее квадратичное
отклонение играют большую роль при определении
степени достоверности результатов.
Генеральная совокупность также
обладает всеми вышеперечисленными
статистическими характеристиками, которые в
общем случае не совпадают с характеристиками
выборки. Для эксперимента особое значение, имеет
оценка той ошибки, которая допускается, если по
выборочным характеристикам судить о генеральной
совокупности.
В практике вычислений величина
расхождения средних значений генеральной и
выборочной совокупностей определяется средней
квадратической ошибкой выборочного
среднего, которая вычисляется по формуле
Общий алгоритм
содержательного анализа данных эксперимента был
приведен в гл. VI. Основными задачами анализа
являются сравнение полученных данных по тем схемам, которые были заложены в
логику исследования, установление справедливости гипотез, определение
степени достижения целей и задач
эксперимента.
Как уже отмечалось, основным свойством
педагогических процессов,
явлений является их вероятностный характер (при данных условиях они могут произойти,
реализоваться, но могут и не произойти). Для таких
явлений существенную
роль играет понятие вероятности.
Вероятность (Р) означает
степень возможности осуществления данного
события, явления, результата. Вероятность
невозможного события равна нулю, достоверного —
единице (100%). Вероятность любого события лежит в
пределах
ХДОВ), то
можно говорить об определенной вероятности того,
что результат повторного эксперимента будет
находиться в пределах этой области.
Достоверностью (надежностью,
значимостью) Р среднего результата серии
педагогических измерений будем называть
вероятность того, что среднее значение
измеряемого параметра при повторном
эксперименте попадает в данный доверительный
интервал.
Итак, результат серии педагогических
измерений должен быть выражен средним
арифметическим с указанием доверительного
интервала и достоверности.ДОВ (с
достоверностью=Р) (5)
В этой формуле
заключается статистический смысл принципа воспроизводимости
педагогического эксперимента: если повторить
(или дублировать) эксперимент, то его результат
будет с определенной вероятностью находиться в
пределах доверительного интервала .
В строгом научном эксперименте
принято добиваться не менее, чем 95%-ной
достоверности, хотя в ряде случаев (например, в
разведывательном эксперименте) оправдан и 50%-ный
уровень.
Определение доверительного
интервала. Между числом измерений,
величиной доверительного интервала и
достоверностью существует определенная
зависимость. Для малых по объему выборок (что
чаще всего и имеет место в педагогическом
эксперименте) эта зависимость исследована
английским математиком Стьюдентом (Госсетом) и
отображена в таблице 1.
Таблица 1. Коэффициент Стьюдента
n/p | 0,8 | 0,9 | 0,95 | 0,98 | 0,99 |
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ? |
3,08 1,89 1,64 1,53 1,48 1,44 1,42 1,40 1,38 1,37 l,363 1,36 1,35 1,35 1,34 1,34 1.33 1,33 1,33 1,38 1,32 1,32 1,32 1,32 1,32 1,32 1,31 1,31 1,31 1,30 1,30 1,29 1,28 |
6,31 2,92 2,35 2,13 2,02 1,94 1,90 1.86 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,73 1,72 1,72 1,71 1,71 1,71 1,71 1,70 1,70 1,69 1,68 1,67 1.66 1,65 |
12,71 4,30 3.18 2,77 2,57 2,45 2,36 2,31 2,26 2.23 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09 2,08 2,07 2,07 2.06 2,06 2,06 2,05 2,05 2,05 2,02 2,00 1,98 1,96 |
31,8 6,96 4,54 3,75 3,36 3.14 3,00 2,90 2,82 2,76 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 2,53 2,52 2,51 2,50 2,49 2,49 2,48 2,47 2,47 2,46 2,42 2,39 2,36 2,33 |
63,7 9,92 5,84 4,60 4,03 4,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95, 2,92 2,90 2,88 2,86 2,85 2,83 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 2,70 2,66 2,62 2,58 |
Для определения
доверительного интервала по методу
Стьюдента-Госсета:
а) по формуле [1] рассчитывают среднее арифметическое
значение параметра —
;
б) по формуле [4] рассчитывают среднюю
квадратичную ошибку среднего —
в) задаются необходимой величиной
достоверности Р;
г) по известному числу расчетных
данных (количеству объектов) и требуемой
достоверности входят в таблицу 1 и определяют коэффициент
Стьюдента — ;
д) доверительный интервал определится
так
(с достоверностью=Р)
Результат экспериментальной серии n изменений в методике Стьюдента выражается так
Пример.
Рассчитать результат (средней балл и
доверительный интервал) срезовой контрольной
работы в экспериментальном классе. Всего
учащихся — 30 человек, из них получили оценки: “5”
— 6 человек; “4” — 10; “3” — 12; “2” — 2 человека.
Расчет
а) Средний балл Х =
б) Средняя квадратичная ошибка
среднегов—г) Задаемся 95%. достоверностью и по таблице 1 находим
д) Вычисляем доверительный интервал;
Результат контрольной работы
Значит, результат аналогичной повторной контрольной работы в этом классе будет с 95% вероятностью лежать в этой области (от 3,5 балла до 3,9 балла).
Достоверность
сравнения. Средние значения параметров педагогического процесса,
полученные в результате срезовых
измерений в различных группах (экспериментальной и контрольной) могут быть близкими, но никогда не бывают одинаковыми ( и ). Вывод же о справедливости гипотезы
может быть сделан на основании заключения либо о различии, либо о
сходстве результатов.
Для того, чтобы определить, является ли
разность между и
существенной (статистически достоверной)
выполняются следующие операции:
а) для обеих групп объектов задается
одинаковый уровень достоверности (к примеру Р=0,9);
б) вычисляются средние
арифметические значения для групп и
;
в) вычисляются средние
квадратичные ошибки средних значений ;
г) по таблице для каждой группы
определяется коэффициент Стьюдента ;
д) определяются доверительные
интервалы;
е) вычисляется
разность -;
Если окажется, что
то разница между
показателями должна считаться
существенной с достоверностью Р ==
0,9.
Если окажется, что
то должно считаться существенным сходство между
результатами обеих групп.
Если окажется, что
то следует
При этом
экспериментатор должен помнить, что cущecтвoвание
значимой разницы или сходства количественных
показателей без поддержки другими аргументами
нельзя брать в основу выводов (особенно в
сомнительных случаях).
Правомерность применения
статистик. Статистические показатели,
получаемые на основе номинальных и порядковых
измерений, предоставляют экспериментатору
богатый аналитический материал, однако их
следует использовать весьма осторожно и
обязательно вместе с материалом, полученным из
других источников. Статистические
характеристики предназначены прежде всего для
обработки измерений, выраженных в интервальной
шкале. Операции же с номинальными и порядковыми
показателями осуществляются условно (с
определенной степенью огрубления) и допустимы
лишь в рамках межгруппового сравнения.
В частности, в педагогической
литературе существует различное мнение о
возможности применения методов математической
статистики к данным школьной пятибалльной
системы оценок. То обстоятельство, что эти
отметки - всего лишь ранговые величины, которые
следует считать субъективной порядков оценкой, а
не точным интервальным измерением, делает
несостоятельными в применении к ним методы
параметрического статистического анализа.
Примечание. Если
говорить о субъективизме, то в других,
считающихся гораздо более объективными, методах
измерения психолого-педагогических
характеристик (к примеру, подсчет количества
ошибок, действий, реакций, времен, сил и т. п.)
субъективный фактор присутствует не в меньшей
степени, чем в балльной оценке.
Рекомендация. В практике
нестрогого экспериментирования целесообразно
данные статистического анализа использовать для
выработки решений и выводов наряду с
разнообразными качественными характеристиками
педагогического процесса и другими материалами.
Аванесов В. С. Применение
статистических методов и ЭВМ в
педагогических исследованиях.
// Введение в
научное исследование по педагогике. /
Под. ред. В. И. Журавылева.
М., 1988*.
Грабарь М. Н. и др. Применение
математической статистики в педагогических
исследованиях. М., 1977.
Журавлев В. И. Обработка и
интерпретация научных данных в педагогическом
исследовании. // Введение в
научное исследование по педагогике. /
Под ред. В. И. Журавлева. М., 1988*.
Занков Л. В. О предмете и методах
дидактических исследований, М., 1962.
Кабанова-Меллер Е. Н. Проблема
эмпирического и теоретического обобщения в
советской педагогической психологии. // Сов. педагогика.—1973
— № 11*.
Как провести социологическое
исследование. //
Под ред. М. К. Горшкова и др.—М.:—
1985. С. 143—164.
Кыверляг А. А. Условия
эффективности и достоверности научного
исследования. // Сов. педагогика.
— 1988. — № 5*.
О моделировании педагогических
явлений. // Новикова Л. И. и др. Путь
к творчеству. М., 1966, с.110-120.
Павлов Ю. В. Статистическая
обработка дидактического эксперимента. М., Знание, 1977.
Полонский В. М. Критерии
теоретической и практической значимости
исследований. // Сов. педагогика.
— 1988. — № 11*.
Полонский В. М. Оценка качества
научно-педагогических исследований. М., 1987*.
Штульман Э. А. Специфика
методического эксперимента, //
Сов. педагогика. — 1988. — № 3*.
Архангельский С. И. Лекции по научной
организации учебного процесса в высшей школе. М., 1976, с. 148-168.
Битинас Б. П. Многомерный анализ в
педагогике. М., 1971,.
Гласс Д. и др. Статистические
методы в педагогике и психологии. М., 1976.
Колкот Э. Проверка значимости. М.,
1978.
Паповян С. С. Математические
методы в социальной психологии. М., 1983.
Рабочая книга социолога. М.,
1983.
Селевко Г. К. Обработка
результатов измерений. //
Лабораторный практикум по курсу общей физики.
Ярославль, 1976*.
Сокольников Ю. П. Системный
анализ. М., 1986*.
Социальная психология. //
Под ред. А. В. Петровского. М., 1987*.
Фридман Л. М. О корректном
применении статистических методов в
психолого-педагогических исследованиях. // Сов. педагогика. — 1970.—№ 2*.
Черепанов В. С. Экспертные оценки.
М., 1989*.