Перевод сырых баллов в стены формула
ПОРЯДОК ПЕРЕВОДА «СЫРЫХ» ПОКАЗАТЕЛЕЙ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК В СТАНДАРТНЫЕ ЕДИНИЦЫ ИЗМЕРЕНИЯ (СТЕНЫ)
Исследование психических явлений требует многоаспектного анализа и применения разнообразного набора его конкретных методов в соответствии с поставленными задачами и общей стратегией проведения комплексной психодиагностики. При проведении мероприятий по профессиональному психологическому отбору и профессионально-психологическому сопровождению обучающийся обследуется с помощью целого комплекса методик, которые могут иметь совершенно различный интервал тестовых показателей. Полученные при сборе данных «сырые» (первичные) оценки далеко не всегда удобно использовать в дальнейшей работе. Особенно, когда возникает необходимость сравнить показатели испытуемого по разным методикам, получить интегральный показатель развития изучаемых качеств или отнести их к какой либо группе («успешных», «не успешных», «норме»). Для этого «сырые» оценки тем или иным способом преобразуют в значения стандартных тестовых шкал. Данные преобразования позволяют оценивать индивидуальный результат тестирования путем сопоставления его с тестовыми нормами (стандартной тестовой шкалой), полученными на выборке стандартизации. Выборка стандартизации специально формируется для разработки стандартной шкалы – она должна быть репрезентативна генеральной совокупности, для которой планируется применять данный тест, методику. Для получения нормального распределения величины измеряемого тестом свойства требуемое число испытуемых в ней обычно составляет не менее 200 человек. Впоследствии при тестировании предполагается, что и испытуемый, и выборка стандартизации принадлежат одной и той же генеральной совокупности. При стандартизации результатов тестовых испытаний чаще всего используется показатель среднеквадратичного отклонения – s. Стандартизация осуществляется при условии нормального распределения тестовых оценок в репрезентативной выборке испытуемых или близком к нему (рис. 1). Нормальным такое распределение называется потому, что оно очень часто встречалось в естественнонаучных исследованиях и казалось «нормой» всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции.
График нормального распределения может быть получен из полигона эмпирического распределения при бесконечном увеличении числа наблюдений и сужении интервалов до размеров точки. Он представляет собой куполообразную кривую, симметричную относительно центра группирования, имеющую строго определенные пропорции.
Рисунок 1 – Нормальное распределение тестовых оценок в репрезентативной выборке испытуемых
Параметры распределения – это его числовые характеристики, указывающие, где «в среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака.
В реальных психофизиологических исследованиях оперируют не параметрами, а их приближенными значениями, так называемыми оценками параметров.
Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют сравнивать их между собой. Наибольшее практическое значение имеют:
— характеристики положения исследуемой совокупности (среднее арифметическое значение признака, медиана, мода);
— характеристики рассеяния (дисперсия);
— характеристики асимметрии (показатели асимметрии и эксцесса).
Среднее арифметическое (оценка математического ожидания) вычисляется по формуле:
Символ S обозначает сумму всех значений xi, когда i принимает значения от 1 до n;
xi – общий член последовательности, подлежащий суммированию;
i – индекс суммирования, порядковый номер члена последовательности;
n – количество наблюдений.
Медианой (Ме) называется такое значение признака, когда одна половина значений экспериментальных данных меньше ее, а вторая больше.
Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто.
При нормальном распределении признака значения среднего арифметического, медианы и моды близки или совпадают друг с другом
где: xi – каждое наблюдаемое значение признака;
n – количество наблюдений.
При нормальном распределении наибольшее отклонение крайней варианты от среднего арифметического составляет примерно 3s (правило «трех сигм»). Имеется определенное статистическое соответствие между отклонением признака от среднего арифметического и положением его в упорядоченном вариационном ряду. Кривая нормального распределения с процентным выражением распределений относительных частот в зависимости от величины отклонения от среднего арифметического представлена на рисунке
Одним из способов преобразования «сырых» результатов тестирования является нормирование. Суть нормирования состоит в переходе к другому масштабу — стандартным единицам измерения. Значимость стандартных шкал заключается, прежде всего, в том, что они позволяют отражать в одинаковых единицах измерения разнородные параметры, которые в обычных для этих параметров единицах измерения несопоставимы.
Простейшей из стандартных шкал является Z-шкала. Первичные значения показателя могут быть преобразованы в Z-оценки по формуле:
где: `x – среднее арифметическое показателя в выборке стандартизации;
xi – величина показателя теста в выборке стандартизации;
s – среднее квадратическое отклонение величин признака в выборке стандартизации.
Использование Z-оценок не всегда удобно, т.к. они могут принимать отрицательные и дробные значения. Поэтому часто Z-оценки преобразуют в другие шкалы, имеющие заданные среднее квадратическое отклонение и среднее значение. При этом используется формула:
где: `xз – заданное среднее значение шкалы;
sз – заданное среднее квадратическое отклонение.
Например, Р.Б. Кеттелл для стандартизации показателей методики 16-ФЛО предложил шкалу стенов – «стандартной десятки», где: 5,5 – заданное среднее значение показателя; 2 – заданное среднее квадратическое отклонение. Стенирование является одним из способов приведения нормированных оценок к виду, удобному для практического использования. Оно представляет собой перевод исходных тестовых оценок в выборке стандартизации в 10-балльную равноинтервальную шкалу (шкалу стенов). Практически это достигается путем разбиения оси значений тестовых оценок в выборке стандартизации на 10 интервалов, соответствующих долям среднеквадратичного отклонения s. При этом M (средняя арифметическая величина признака в выборке стандартизации) принимается за среднюю точку шкалы стенов. При этом всякое значение тестовых оценок, входящее в интервал от M до M + 0,5s, приравнивается к 6 баллам по шкале стенов, а, входящее в интервал от M до M – 0,5s, – к 5 баллам этой шкалы. Такая же процедура с шагом увеличения равным 0,5s проводится для вычисления 7, 8, 9 и 10 баллов стеновой шкалы и с шагом уменьшения на 0,5 s – для вычисления 4, 3, 2, и 1 балла шкалы стенов (рис.1).
1 стен = М – 2,5 σ 2 стена = М – 2 σ 3 стена = М – 1,5 σ 4 стена = М – 1 σ 5 стенов = М – 0,5 σ | 6 стенов = М +0,5 σ 7 стенов = М + σ 8 стенов = М +1,5 σ 9 стенов = М +2 σ 10 стенов = М +2,5 σ |
Получение 10 балльного ряда и есть шкала перевода «сырых» оценок в стены. При такой системе стандартизации диапазон, который принято называть средним или нормой (диапазон в 1s), характеризуется стандартными единицами от 4 до 7 стенов. Стандартные оценки от 3 или 8 стенов свидетельствуют об индивидуальных различиях, выходящих за границы средней нормы. Оценки в 2 и 9 стенов получаются при значительном отклонении индивидуальных оценок, на 2s выше и ниже среднего группового значения. Максимальная оценка в 10 стенов достигается при отклонении индивидуального тестового результата на 2,5s и более, вверх от средней нормы. Аналогичным образом, оценка в 1 стен ставится за все отклонения индивидуального тестового результата от среднего значения на 2,5s и ниже.
Для перевода «сырых» оценок в стены можно также использовать формулу линейного преобразования шкалы Z – оценок ( ) нормального распределения в десятибальную шкалу стенов:
где Xi – значение признака (в «сырых» баллах); M – среднее арифметическое значение признака; σ – среднеквадратичное отклонение значений признака.
При отклонении распределения значений признака (оценок в «сырых» баллах) от их нормального распределения используют процентильную шкалу перевода оценок в стены. Процентиль (X%) – это такое значение «сырой» оценки, которое соответствует частоте оценок меньших и равных по значению данной «сырой» оценке в %.
Перевод значения «сырой» оценки, выраженной в процентилях, в стены осуществляется по стандартной шкале (рисунок 1, таблица 2), где значения оценок в стенах связаны с величинами частот.
Для каждого теста по результатам тестирования стандартизованной выборки с использованием шкалы перевода процентилей в стены определяют границы стеновых оценок в значениях «сырых» оценок и строят шкалу перевода «сырых» оценок теста в стены (рисунок 1, таблица 2),.
Границы стеновых оценок в значениях «сырых» оценок определяют по граничным значениям частотных интервалов, указанных в таблице 1 для каждой стеновой оценки.
Например, по результатам обследования результат испытуемого входит в диапазон «сырых» оценок (X5) стандартизованной выборки, что соответствует частоте оценок в % (процентиль) [30,86; 50,0] и, соответственно, 5 стенам.
Таблица 1. Перевод процентильной шкалы в стены
Стены | ||||||||||
Частота оценок (%) | ||||||||||
Диапазон «сырых» оценок в стандартной выборке | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 |
При создании стеновой шкалы следует учитывать конструктивные особенности теста. Возможно создание стеновой шкалы на основе обратно пропорциональной зависимости, когда более высокий «сырой» балл свидетельствует о меньшей степени выраженности изучаемой характеристики, например, такая шкала применяется в тесте «Адаптивность».
Как разработать тест с нуля? Профессиональный тест: ключи, нормы, сырые и стандартыне баллы (Часть 2)
Привет, друзья! Вот мы и подошли ко второй теме по разработке профессиональных тестовых методик. Сегодня мы обсудим чем профессиональные (психометрические) тесты отличаются от «журнальных» собратьев, поговорим о тестовых нормах и увидим первые формулы.
Если вы тут оказались случайно, но тема вам интересна: добро пожаловать в первую статью цикла
Чем профессиональный тест отличается от развлекательного
Давайте использовать правильные термины:
В хороших тест-опросниках всегда присутствуют поправки на угадывание, которые автоматически «выкидывают» человека на центр шкалы, если он выбрал такую стратегию.
Еще одно отличительное свойство профессионального теста :
В психометрике и тестировании используется т.н. модель Гаусса или нормального распределения. Согласно ей, 68% испытуемых попадают в средний интервал и лишь по 16% в «сильную» и «слабую» группы. Но согласитесь, в развлекательном тесте жалко терять 68% испытуемых и поэтому у них есть весьма однозначные интерпретации.
В общем-то, шутливые тестики полезны, но
Ключи к тесту
Думаю, нет резона объяснять, что в тестологии важно не столько проведение самого теста, сколько анализ и обработка результатов тестирования.
Это примитивный способ подсчета и он скрывает саму суть понятия «ключ к тесту».
Более правильное представление о ключах мы получаем, когда рассматриваем не просто учебные тесты (для них достаточно бывает простой стандартизации баллов). Если мы пытаемся замерить свойство личности или какие-либо ценности человека, то в тест включаются «обратные» вопросы, когда участник получает балл за ответ «неверно».
С различными ответами могут быть начислены разные баллы (от 0 до 1), но о «весах» и цене ответа мы поговорим позже.
Теперь посмотрим на первую универсальную формулу «логического» (поэлементного) подсчета тестовых баллов:
В этой формуле учитывается тот факт, что на один вопрос может быть дано несколько ответов (множественный ответ), но поскольку обычно есть только один правильный ответ из m вариантов, то балл считается просто:
число совпадений ответов испытуемого с неким «идеальным» испытуемым, который набирает максимальный балл.
Соответственно, страшная формула сверху упрощается до следующего вида:
Допустим, в тесте пять вопросов. В каждом вопросе 5 вариантов ответа. Правильными являются в каждом вопросе: 1, 2, 3, 4, 5
Испытуемые отвечает так: 1,2,5,4,3
После можно уже развлекаться с «ценностью» ответа, но нам это пока не нужно. Итак, мы подсчитали результат и можем перейти к следующему аспекту тестирования
Сырые, стандартные тестовые баллы. Нормы
У нас же стоит задача перевести результаты теста в 9-тибалльную шкалу (или шкалу станайнов). Для этого мы используем следующую формулу:
На первом листе у нас указан номер вопрос с ключевым ответом (за который начисляется балл) и ответы испытуемых (выбранные ими варианты).
На третьем листе мы:
Чтобы делать такие вещи в Excel Вам надо уметь пользоваться формулами:
Деление испытуемых на три группы
среднее по выборке ± стандартное отклонение
Но поскольку иногда нам нужно поделить еще и очень сильных от просто сильных, то целесообразней определять эти границы исходя из требований к подготовке. Например, мы можем выделить и группу «очень сильных» добавив, например не 1 стандартное отклонение к среднем, а 1.5. То есть мы сделаем градацию внутри группы «сильных».
Завершая
Итак, сегодня мы разобрали простейшие формулы тестологии и научились переводить сырые балы в стандартную шкалу стенайнов, а также сопоставлять ее со школьной системой оценивания.
Перевод сырых баллов в стены
Стены Шкалы | ||||
2-3 | 4-5 | 6-7 | ||
0-1 | 3-4 | 5-6 | 7-9 | 11-12 |
0-1 | 4-5 | 9-10 | ||
3-4 | 6-7 | |||
0-1 | 4-5 | 6-7 | 9-10 | 13-14 |
0-1 | 3-4 | 6-7 | ||
4-5 | 7-8 | |||
1-2 | 3-4 | 5-7 | 8-10 | 11-12 |
3-4 | 6-7 |
Подсчитанные совпадающие ответы вносятся в колонку результатов “балл” на бланке ответов. Полученные “сырые” баллы по специальной шкале переводятся в стандартные оценки “стены” и заносятся в колонку “стены”. Психологической нормой считаются стены от 3 до 7.
Интерпретация результатов
Описание шкал
Шкала 1. Открытость
Шкала 1 – «внутренняя честность» (открытость) включает 11 пунктов с такими аспектами образа «Я», как самоотношение, поведение, которые, являясь значимыми для личности (с точки зрения моральных норм), с трудом допускаются до сознания.
Низкие значения шкалы говорят о глубокой осознанности Я, повышенной рефлексивности и критичности, способности не скрывать от себя и других даже неприятную информацию, несмотря на её значимость.
Высокие значения шкалы говорят о закрытости, неспособности или нежелании осознавать и выдавать значимую информацию о себе.
Шкала 2. Самоуверенность
Шкала 2 – самоуверенность содержит пункты, задающие представления о себе как самостоятельном, волевом, энергичном, надёжном человеке, которому есть за что себя уважать.
Положительный плюс шкалы соответствует высокому самомнению, самоуверенности, отсутствию внутренней напряженности.
Низкие значения говорят о неудовлетворенности собой и своими возможностями, сомнении в способности вызывать уважение.
Шкала 3. Саморуководство
Шкала 3 – саморуководство отражает представления о том, что основным источником активности и результатов, касающихся как деятельности, так и собственной личности, является он сам.
Высокий балл по шкале свидетельствует, что человек отчётливо переживает собственное «Я» как внутренний стержень, интегрирующий и организующий его личность и жизнедеятельность, считает, что его судьба находится в его собственных руках; чувствует обоснованность и последовательность своих внутренних побуждений и целей.
Низкие баллы свидетельствуют о подвластности «Я» влияниям обстоятельств, неспособности противостоять судьбе, плохой саморегуляции, размытом фокусе «Я», отсутствии тенденций поиска причины поступков и результатов в себе самом.
Данная шкала по содержанию близка к психологической переменной, которую в литературе принято обозначать как локус контроля. В последующей главе мы рассмотрим более подробно методику диагностики локуса контроля.
Шкала 4. Зеркальное Я
Шкала 4 – зеркальное Я (отражённое самоотношение) включает пункты, связанные с ожидаемым отношением к себе со стороны других людей.
Высокие значения шкалы соответствуют представлению субъекта о том, что его личность, характер и деятельность способны вызвать в других уважение, симпатию, одобрение и понимание, с низкими значениями связан ожидание противоположных чувств по отношению к себе от другого.
Шкала 5. Самоценность
Высокие оценки по шкале отражают заинтересованность в собственном Я, любовь к себе, ощущение ценности собственной личности и одновременно предполагаемую ценность своего Я для других. Шкала отражает эмоциональную оценку себя, своего Я по внутренним интимным критериям любви, духовности, богатства внутреннего мира.
Низкие баллы по шкале говорят о переоценке своего духовного Я, сомнении в ценности собственной личности, отстранённости, граничащей с безразличием к своему Я, потере интереса к своему внутреннему миру.
Шкала 6. Самопринятие
Высокий полюс соответствует дружескому отношению к себе, согласию с самом собой, одобрению своих планов и желаний, эмоциональному, безусловному принятию себя таким, каков есть, пусть даже с некоторыми недостатками.
Низкий полюс свидетельствует об отсутствии перечисленных качеств – недостатком самопринятия, что является важным симптомом внутренней дезадаптации.
Шкала 7. Самопривязанность
Высокие значения шкалы говорят о ригидности Я-концепции, привязанности, нежелании меняться на фоне общего положительного отношения к себе. Данные переживания часто сопровождаются привязанностью к неадекватному Я-образу. В последнем случае тенденция к сохранению такого образа – один из защитных механизмов самосознания.
Низкие значения свидетельствуют о противоположных тенденциях: желании что-то в себе изменить, соответствовать идеальному представлению о себе, неудовлетворённости собой.
Шкала 8. Внутренняя конфликтность
Высокие значения по данной шкале свидетельствуют о наличии внутренних конфликтов, сомнений, несогласии с собой, тревожно-депрессивных состояний, сопровождаемых переживанием чувства вины. Постоянная неудовлетворённость и споры с собой протекают на фоне неадекватно заниженной самооценки, что приводит к сомнениям в своей способности что-то предпринять или изменить. Чрезмерные самокопания и рефлексия протекают на общем негативном эмоциональном фоне по отношению к себе. Причем конфликтная аутокоммуникация не только не приносит облегчения, но, наоборот, лишь усугубляет негативные эмоции.
Умеренное повышение по шкале говорит о повышенной рефлексии, глубоком проникновении в себя, осознании своих трудностей, адекватном образе Я и отсутствии вытеснения.
Крайне низкие значения шкалы свидетельствуют об отрицании проблем, закрытости, поверхностном самодовольстве.
Шкала 9. Самообвинение
Высокие значения говорят об самообвинении, готовности поставить себе в вину свои промахи и неудачи, собственные недостатки, По психологическому содержанию шкала в целом сходна с предыдущей (8) шкалой. Однако, если значение 8-й шкалы характеризуется конфликтностью, связанной с недостатком самоуважения (недооценкой своих возможностей, компетентности, знаний и способности), то значение 9-й шкалы является индикатором отсутствия симпатии, что сопровождается негативными эмоциями в свой адрес даже, несмотря на высокую самооценку собственных качеств.
Крайне высокие значения по 8-й и 9-й шкалам при общем снижении профиля по предыдущим параметрам являются индикаторами глубокой внутренней дезадаптации и кризисной ситуации, требующей принятия психокоррекционных мер.
При факторизации матриц интеркорреляций значений шкал определяются три независимых фактора:
1. Самоуважение. В данный фактор вошли значения шкал: открытость (внутренняя честность) (1), самоуверенность (2), саморуководство (3), зеркальное Я (отражение самоотношения) (4). Совокупность значений шкал выражает оценку собственного “Я” испытуемого по отношению к социально-нормативным критериям: моральности, успешности, воле, целеустемлённости, социальному одобрению.
2. Аутосимпатия. В данный фактор вошли: самоценность (5), самопринятие (6), и самопривязанность (7). Эти шкалы в наиболее чистом виде отражают эмоциональное отношение испытуемого к своему “Я”.
3. Внутренняя неустойчивость. Данный фактор содержит шкалы: внутренняя конфликтность (8), самообвинение (9). Этот фактор связан с негативным самоотношением, не зависящим от аутосимпатии и самоуважения.
Показатели третьего фактора могут свидетельствовать о дезадаптации личности и о потребности респодента в психологической помощи.