Metoder for å underbygge gyldigheten av en test

To viktige egenskaper for en test er reliabilitet og validitet . I lekmann vilkår, er pålitelighet et mål på om score på en test er repeterbare og internt konsistent . Gyldighet er en målestokk på om testen måler det du tror det måler . Gyldighet er mye vanskeligere å vurdere, og det er flere måter å gjøre det. Face Gyldighet

Face gyldighet betyr at spørsmålene på testen vises gyldig "på ansiktet". For eksempel , i en test av aritmetikk for tredjeklassinger, vil spørsmål om multiplikasjon og divisjon har høy ansiktet gyldighet. Formålet med aritmetisk test ville være klart for studentene, men hensikten med spørsmål om verb og substantiver er kanskje ikke så opplagt til tredje -klassinger , og at testen ville ha lav ansikt gyldighet. Vanligvis er ansikt gyldighet antatt, men noen ganger et spørsmål kan være gyldig på andre måter , men ikke ansikt gyldig . .
Criterion Gyldighet (også kjent som Criterion Relaterte Gyldighet )

Criterion gyldighet vurderer resultatene av en test sammenlignet med noen kriterium som allerede har blitt validert . Ofte den nye testen er billigere eller mer praktisk enn tidligere test. For eksempel kan du vurdere gyldigheten av en kjøresimulator ved å sammenligne den med ytelse i en faktisk bil. Hvis simulatoren hadde god validitet , kan det være en billigere (og en mindre farlig ) måte å vurdere kjøreferdigheter .
Begrepsvaliditet

begrepsvaliditet tiltak forholdet mellom skårer på en test og tiltak av andre teoretiske utlegninger . Det finnes to typer begrepsvaliditet : Konvergent og diskriminere . Konvergent validitet betyr at resultatet på en test bør korrelerer sterkt med score på tester av relaterte konstruksjoner. Diskriminere gyldighet betyr at resultatet bør korrelerer dårlig med score på tester av urelaterte konstruksjoner. For eksempel bør score på en test av depresjon korrelerer mer høyt med score på angst tester enn med score på tester av aritmetikk.
Content Gyldighet

Content gyldighet betyr at testen dekker hele bredden av materialet som den er beregnet til å måle . Det er vanligvis vurdert ved å konsultere eksperter på feltet . For eksempel bør en test av aritmetiske dekke alle områdene av aritmetikk som er dekket av barn i en bestemt klasse. For et annet eksempel , bør en test av kjøreferdigheter dekke alle nødvendige ferdighetene for å kjøre en bil .

Hobbyer, spill © (www.northgames.biz)