Pålidelighed og konsistens i psykometri

Når vi kalder nogen eller noget pålidelig, mener vi, at de er konsistente og pålidelige. Pålidelighed er også en vigtig bestanddel af en god psykologisk test. En test ville trods alt ikke være meget værdifuldt, hvis det var inkonsekvent og producerede forskellige resultater hver gang. Hvordan definerer psykologer pålidelighed? Hvilken indflydelse har den på psykologisk testning?

Pålidelighed refererer til sammenhængen i en foranstaltning. En test betragtes som pålidelig, hvis vi får det samme resultat gentagne gange. For eksempel, hvis en test er designet til at måle et træk (som f.eks. Introversion ), skal resultaterne hver gang prøven administreres til et emne være omtrent det samme. Det er desværre umuligt at beregne pålideligheden nøjagtigt, men det kan estimeres på en række forskellige måder.

Test-Retest Pålidelighed

Test-retest pålidelighed er et mål for sammenhængen i en psykologisk test eller vurdering. Denne form for pålidelighed bruges til at bestemme en testes sammenhæng over tid. Test-retest pålidelighed bruges bedst til ting, der er stabile over tid, såsom intelligens .

Test-retest pålidelighed måles ved at administrere en test to gange på to forskellige tidspunkter. Denne type pålidelighed forudsætter, at der ikke vil blive ændret kvaliteten eller konstruktionen, der måles.

I de fleste tilfælde vil pålideligheden være højere, når der er gået lidt tid mellem testene.

Test-retest-metoden er kun en af ​​de måder, der kan bruges til at bestemme pålideligheden af ​​en måling. Andre teknikker, der kan anvendes, inkluderer inter-rater pålidelighed, intern konsistens og parallel-formet pålidelighed.

Det er vigtigt at bemærke, at test-retest pålidelighed kun refererer til en tests konsistens, ikke nødvendigvis gyldigheden af resultaterne.

Inter-rater Pålidelighed

Denne type pålidelighed vurderes ved at have to eller flere uafhængige dommere scorer testen. Scorerne sammenlignes derefter for at bestemme konsistensen af ​​raters estimater.

En måde at teste inter-rater pålidelighed på er at have hver rater tildele hvert testelement en score. For eksempel kan hver rater score punkter på en skala fra 1 til 10. Herefter beregner du sammenhængen mellem de to ratings for at bestemme niveauet for inter-rater pålidelighed.

Et andet middel til at teste inter-rater pålidelighed er at have ratere bestemme hvilken kategori hver observation falder ind og derefter beregne procentdelen af ​​aftalen mellem raterne. Så hvis raterne er enige om 8 ud af 10 gange, har testen en 80% inter-rater pålidelighed.

Parallel-Forms Pålidelighed

Parallelle former for pålidelighed er målt ved at sammenligne to forskellige tests, der blev oprettet ved hjælp af det samme indhold. Dette opnås ved at skabe en stor pulje af testemner, der måler den samme kvalitet og derefter tilfældigt deler op i to separate prøver. De to test skal derefter administreres til de samme fag på samme tid.

Intern konsistens pålidelighed

Denne form for pålidelighed bruges til at bedømme konsekvensen af ​​resultater på tværs af emner på samme test. I det væsentlige sammenligner du testemner, som måler den samme konstruktion for at bestemme testens interne konsistens. Når du ser et spørgsmål, der ligner meget på et andet testspørgsmål, kan det tyde på, at de to spørgsmål bruges til at måle pålideligheden. Fordi de to spørgsmål er ens og designet til at måle det samme, skal testtageren svare begge spørgsmål ens, hvilket vil indikere, at testen har intern konsistens.

Faktorer, der kan påvirke pålideligheden

Der er en række forskellige faktorer, som kan påvirke pålideligheden af ​​en foranstaltning.

Først og måske helt klart er det vigtigt, at den ting, der måles, er ret stabil og konsistent. Hvis den målte variabel er noget, der ændrer sig regelmæssigt, vil resultaterne af testen ikke være konsistente.

Aspekter af testsituationen kan også påvirke pålideligheden. For eksempel, hvis testen administreres i et ekstremt varmt rum, kan respondenterne blive distraheret og ude af stand til at afslutte testen efter deres bedste evne. Dette kan have indflydelse på foranstaltningens pålidelighed. Andre ting som træthed, stress, sygdom, motivation, dårlige instruktioner og miljømæssige forstyrrelser kan også skade pålideligheden.

Pålidelighed vs. Gyldighed

Det er vigtigt at bemærke, at bare fordi en test har pålidelighed betyder det ikke, at den har gyldighed. Gyldighed refererer til, om en test virkelig måler, hvad det hævder at måle. Tænk på pålidelighed som et mål for præcision og validitet som et mål for nøjagtighed. I nogle tilfælde kan en test være pålidelig, men ikke gyldig. For eksempel forestille sig, at jobansøgere tager en test for at afgøre, om de har en bestemt personlighedstræk . Mens testen muligvis giver konsistente resultater, kan det faktisk ikke måle det træk, som det påtænker at måle.