О надежности и валидности стандартных тестовых методик

Стандартизация методики состоит в проверке на валидность, надежность и выработку нормативов. Аналогично стандартизации проходит и адаптация иностранных тестов — только перед стандартизацией тесты переводят, переформулируют и проверяют с помощью экспертной оценки лингвистов. Стандартизированный и адаптированный тест — это тест, прошедший проверку на надежность и валидность на крупных выборках и проанализированный несколькими группами экспертов на каждом этапе стандартизации, имеющий паспорт методики, с подробнейшим описанием общих характеристик, особенностей теста, его структуры и областей применения и т.д.

Надежность

Надежность — это характеристика методики, отражающая точность психодиагностических измерений и устойчивость результатов тестирования к действию иррелевантных и случайных факторов. К иррелевантным факторам относятся — эмоциональные состояния, мотивация тестируемых и средовые факторы.

Выделяют три вида надежности — ретестовую, параллельных форм, частей теста.

Ретестовая надежность — устойчивость результатов во времени при повторном проведении теста, измеряется с помощью корреляционного анализа, практически универсальна (не подходит только для диагностики эмоциональных состояний).

Параллельных форм или частей теста — согласованность результатов частей теста. Измеряется с помощью расщепления теста на части и корреляционного анализа суммарных результирующих баллов каждой части. Либо проведение той же процедуры для различных вариантов теста.

Валидность

Валидность — общая характеристика теста, показывающая, что измеряет тест и насколько хорошо он это делает.

Выделяют очевидную валидность, по содержанию, критериальную и конструктную.

Очевидная валидность — это валидность с т.з. испытуемого.

Валидность по содержанию — это соответствие содержания заданий теста измеряемым областям.

Критериальная в свою очередь делится на диагностическую, прогностическую и ретроспективную валидность.

Диагностическая валидность характеризуется способностью теста по определенному кругу критериев выявлять наличие определенного измеряемого признака у тестируемых на момент проведения теста, прогностическая — прогнозировать соответствие результатов теста диагностическому качеству спустя время, ретроспективная — дифференцировать возможность наличия этого же признака в прошлом.

Конструктная валидность отражает степень представленности исследуемого конструкта в результатах теста. Выделяют факторную, конвергентную, дискриминативную, инкрементную валидность.

Факторная или дифференциальная валидность отвечает за внутреннюю взаимосвязь между психологическими факторами в тесте.

Дискриминативная описывает сбалансированность пунктов или шкал теста относительно иррелевантных факторов.

Конвергентная состоит в проверке степени близости прямой и обратной связи, соответствие пунктов измеряемому фактору.

Инкрементная — оценка практической ценности методики

Заключение

В завершение хочется отметить, что стандартизация — очень сложный и долгий процесс, занимающий 5-15 лет, поэтому, большинство актуальных всемирно признанных стандартизированных методик повседневного арсенала психолога, создано в середине прошлого века. Отсюда же следует, что «новейшие методики» и «инновационные тесты» — маркетинговый ход, которым приманивают тестовые компании — в большинстве своем либо модификации существующих методик, либо тесты сомнительной надежности, не прошедшие стандартизацию и не имеющие паспортов.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>