Различные модели подсчета тестовых баллов

Владимир Николаевич Дружинин «Психология и психодиагностика общих способностей.»

На примере теста Равена мой аспирант Ф.М.Юсупов проверил, в какой мере валидны различные модели подсчета тестовых баллов:

1) традиционный, применявшийся в тесте балльный показатель,

2) сумма рангов сложности решенных заданий,

3) количество правильно выполненных заданий (оценка трудности заданий не учитывалась),

4) сумма показателей сложности решенных задач (сложность определялась отношением числа решивших задачу к общему числу испытуемых).

Время работы испытуемых с тестом не ограничи­валось. Результаты исследования показали, что наихудшей дифференцирующей способностью обладает показатель, не учитывающий трудности задания, что естественно, поскольку мы имеем дело с тестом уровня. Наилучшая дифференцирующая способность у модифицированного показателя [5]. Показатель, учитывающий сложность в рангах, и традиционный заняли второе и третье место.

Таблица 4. Коэффициенты вариации и их ошибки для четырех видов показателей тестовой шкалы.

Системы оценки

Коэффициенты вариации

Ошибка коэф­фи­ци­ен­та вариации

Без учета сложности

19,49%

1,4%

Модиф. показатель слож­нос­ти

38,34%

2,76%

Сложность в баллах

24,43%

1,76%

Сложность в рангах

30,53%

2,19%

Рис.7. График зависимости диапазона изменения показателя сложности от числа вариантов ответов в тестовом задании.

Таблица 5. Коэффициенты интеркорреляций для пяти различных показателей шкалы.

Показатели шкалы

1. Используемый в тесте Равена

2. Учитывающий сложность в ранговой форме

0,988

3. Не учитывающий сложности тестовых заданий

0,961

0,94

4. Учитывающий сложность в форме весов

0,909

0,981

0,885

5. Используемый в тесте “уровни”

0,715

0,754

0,678

0,79

Таблица 6. Результаты факторного анализа для пяти показателей шкалы.

Показатели шкалы

I

II

h2

1. Используемый в тесте Равена

0,911

0,385

0,978

2. Учитывающий сложность в ранговой форме

0,889

0,454

0,995

3. Не учитывающий сложности тестовых заданий

0,915

0,336

0,95

4. Учитывающий сложность в форме весов

0,805

0,54

0,94

5. Используемый в тесте “уровни”

0,388

0,918

0,993

Процент общей дисперсии

64,9%

32%

96,9%

Для удобства факторизации показателей был введен пятый ранг наиболее сложного выполненного задания.