simpson’s paradox

Getallen kunnen je op het verkeerde been zetten. Simpson’s paradox is een voorbeeld van een situatie waarin een oppervlakkige bestudering van cijfers tot een verkeerde conclusie kan leiden en van een effect dat tegen de menselijke intuïtie indruist.
Een eenvoudig voorbeeld ter illustratie (een vereenvoudigde versie van een onderzoek bij de University of California, Berkeley begin jaren ’70 in verband met een klacht over ‘sex bias‘):
Hogeschool X met slechts twee faculteiten (A en B) wil meer vrouwelijke docenten in dienst nemen en voert daartoe een voorkeursbeleid. Faculteit A neemt 10% van de mannelijke en 20% van de vrouwelijke kandidaten aan terwijl Faculteit B 50% van de mannelijke en 60% van de vrouwelijke  kandidaten aanneemt. Er solliciteren 50 mannen en 50 vrouwen. Het percentage aangenomen mannen blijkt 42 te zijn en voor de vrouwen is dat 36. Hoe kan het percentage voor de mannelijke kandidaten hoger zijn dan voor de vrouwelijke kandidaten terwijl beide faculteiten het voorkeursbeleid ten uitvoer brengen?
Nadere bestudering van de data wijst uit dat van de 50 mannelijke kandidaten er 10 bij faculteit A en 40 bij faculteit B solliciteert terwijl dat voor de vrouwelijke kandidaten 30 resp. 20 is. Er speelt dus nog iets anders mee, ook wel ‘confounding effect‘ genoemd.
Misschien zie je al wat hier aan de hand is:  de vrouwelijke kandidaten solliciteren vooral bij de faculteit waar relatief weinig docenten worden aangenomen en voor de mannelijke kandidaten geldt het omgekeerde. De bias zit dus niet bij de universiteit maar bijvoorbeeld bij de opleidingsachtergrond van vrouwelijke en mannelijke kandidaten waardoor vrouwelijke kandidaten vooral solliciteren bij faculteiten die, misschien vanuit financiële overwegingen, minder docenten aanstellen.

Blijft de vraag over voor de onderzoeker: hoe bewust ben je je van dit effect? Hoe vaak treedt het bij jou op?

 

Internetadressen:

https://www.youtube.com/watch?v=hURWC05Iu74https://www.youtube.com/watch?v=hURWC05Iu74