Det finns många tester – hur vet du vilka som är bra eller dåliga?

Det finns en uppsjö av olika tester och alla hävdar att de är bäst på att mäta det ena eller det andra. Men hur vet du som ska köpa in eller använda ett test vilka som faktiskt håller måttet? Det är lätt att gå vilse i vad som låter bra, och vad som faktiskt är objektivt bra. För att ta reda på fakta behöver du huvudsakligen titta på två parametrar: Validitet och Reliabilitet.

Detta är del 6 av 6 i en artikelserie om tester. Du kan läsa Del 1 här, Del 2 här, Del 3 här, Del 4 här och Del 5 här.

Validitet ställer frågan om testet mäter det vi vill mäta. Det finns olika typer av validitet beroende på vad tester avser mäta.

Innehållsvaliditet

Innehållsvaliditet handlar om hur väl frågorna täcker av ett område. Ett exempel är kunskapstester som syftar till att undersöka om en person verkligen har de kunskaper som de säger. Täcker då testet av hela kunskapsområdet eller bara en del?

Empirisk validitet

Empirisk validitet handlar om hur väl testresultatet möter ett uppsatt kriterium. Ett exempel på detta är högskoleprovet, där ett högt resultat förväntas kunna förutsäga framgång på universitet och högskola.

Begreppsvaliditet

Begreppsvaliditet handlar om hur väl ett test mäter ett abstrakt begrepp. Ett exempel på detta är personlighetstester som säger sig mäta drivkraft. Då måste begreppet ”drivkraft” vara tydligt definierat, för hur vet du annars om det mäter drivkraft eller inte?

Face validity

Face validity är den enklaste formen av validitet och handlar om hur väl testet ser ut att mäta det vi vill mäta. Här är det lätt att bli lurad av att testet ”ser snyggt ut” och därför antas kunna ge bra resultat. Många tester av låg kvalitet brukar ofta se väldigt proffsiga ut.

Reliabilitet ställer frågan om testet är pålitligt oberoende av kringfaktorer. Här pratar man om två huvudsakliga typer av reliabilitet:

Test-retest reliabilitet

Test-retest reliabilitet undersöker om samma person får samma resultat om testet görs med några veckors mellanrum. I de allra flesta fall hinner inte tillräckligt mycket ändras i en persons liv på några veckor för att det ska ge utslag i ett test. Om resultatet därför ändras är det inte personen, utan testet det är fel på.

Interbedömarreliabilitet

Interbedömarreliabilitet undersöker om resultatet blir detsamma om två olika personer ger testet. Det kan dels handla om hur väl testpersonen förstår vad som ska göras, och del om hur resultatet tolkas. Idag avhjälps detta ofta genom digital administration och resultattolkning. Men i slutändan är det ändå en person som ska ge återkoppling på testet, och då gäller det att resultatet kan tolkas lika oavsett vem som ger återkopplingen.

Mycket av den här informationen ska finnas i testets tekniska manual. Om det inte finns en teknisk manual så är testet sannolikt inte mycket att ha. Men även med en teknisk manual kan det vara svårt att veta om testet är bra eller dåligt. Då kan man vända sig till Stiftelsen för tillämpad Psykologi (STP) eller Buros Center for Testing.

STP lyder under Psykologförbundet och arbetar med att granska tester och användares certifieringar.
Buros är ett oberoende forskningsinstitut inom University of Nebraska och är världens främsta center för att undersöka tester.

Om det test du är intresserad av inte är undersökt av någon av dessa (eller fått dålig kritik i granskningen) så skulle jag leta efter ett annat test, oavsett hur billigt eller enkelt det är att använda.

Poängen med att använda ett test är ju att du vill få information som är kritisk för ditt företag, inte göra testleverantören glad.