column

22 juni 2017

In de discussie rond etnisch profileren komt vaak de vraag naar voren, meer of minder expliciet gesteld, hoe etnisch profileren zich verhoudt tot het gegeven dat (sommige) etnische minderheden oververtegenwoordigd zijn in de criminaliteitscijfers. Deze twee fenomenen hebben wel met elkaar te maken maar vallen niet samen, zo lijkt het soms geformuleerd te worden. Maar hoe zit dat nu precies?

In een artikel van Mickey Steijaert in het tijdschrift SKEPTER van deze zomer (Jrg. 30, nummer 2, p. 23-28) getiteld ‘Etnisch profileren’ wordt een mogelijke opvatting als volgt beschreven (een opvatting die de auteur overigens niet onderschrijft):
“Etnische minderheden domineren de criminaliteitscijfers, dus is het logisch om hen vaker staande te houden ….” (p. 24).

Voor het betreffende artikel zie:
Mickey Steijaert (2017). Etnisch profileren. Skepter 30/2: 23-28.
(Met dank aan de redactie van Skepter)
Etnisch profileren
Kader bij Etnisch profileren

Naar mijn mening kan het gebruik van het begrip voorwaardelijke kans verhelderend werken. Etnisch profileren kan dan opgevat worden als het schatten van de kans dat iemand crimineel (of anderszins verdacht is), gegeven het feit dat die persoon behoort tot een (specifieke) etnische minderheidsgroep. In termen van een voorwaardelijke (conditionele) kans:
de kans op criminaliteit gegeven een etnische achtergrond, kortweg: de kans op C gegeven (of onder de voorwaarde) dat E het geval is.

Aan de andere kant is het gegeven dat etnische minderheden (of een specifieke etnische minderheidsgroep) de criminaliteitscijfers domineren, ook te schrijven als een voorwaardelijke kans:
de kans op een etnische minderheidsgroep gegeven dat het criminelen betreft, kortweg: de kans op E gegeven dat C het geval is.

Het door elkaar halen van deze twee voorwaardelijke kansen komt regelmatig voor en wordt in de (statistische) literatuur wel de prosecutor’s fallacy genoemd en kan m.b.v. de regel van Bayes verhelderd worden (zie bijv. Rob Flohr  2012: De Bayesiaanse benadering. Den Haag: SDU Uitgevers/Academic Service p. 36-37 en op deze site:
-Statistiek/Kansen en kansverdelingen/Het driedeurenvraagstuk
-Cursusaanbod/Oriëntatie op statistiek/kritisch omgaan met kwantitatieve informatie, dia’s 22 en 23
-Cursusaanbod/Oriëntatie op statistiek/Alledaagse dingen vanuit statistisch perspectief, college 2, dia’s 6 en 7, 12 en 13
-Actueel/30 maart 2017, RIVM (darmkanker bevolkingsonderzoek)

Er zijn een paar factoren die uiteindelijk bepalen op welke wijze de twee voorwaardelijke kansen aan elkaar gerelateerd zijn zoals bijv. de zogenoemde a prior kans (in dit geval de kans op criminaliteit in het algemeen) en de voorwaardelijke kans op een etnische achtergrond gegeven dat het de niet-criminele bevolking betreft.

Ter illustratie het volgende (fictieve) voorbeeld.
Stel dat 5% van de totale bevolking uit criminelen bestaat en dat de oververtegenwoordiging van een bepaalde etnische minderheidsgroep tot uitdrukking komt in het feit dat 40% van de totale groep criminelen tot deze etnische minderheidsgroep behoort terwijl deze etnische minderheidsgroep slechts 20% van de totale bevolking uitmaakt. Met behulp van de regel van Bayes kan dan berekend worden dat de kans dat iemand crimineel is, gegeven dat die persoon tot de betreffende etnische minderheidsgroep behoort, 0.10 is.

Hopelijk kan het begrip voorwaardelijke kans bijdragen aan een beter begrip van dit onderwerp.

 

14 augustus 2016

Wat is en waarvoor dient de statistiek?

Zestig jaar geleden publiceerde prof. dr. J. Hemelrijk een artikel in Euclides, Tijdschrift voor de didactiek der exacte vakken (tegenwoordig Vakblad voor de wiskundeleraar), jrg. 31, 1955-1956,
V-VI, pag. 233-244). De titel van het artikel was “Wat is en waarvoor dient de statistiek?”, en het betrof een rapport van de Statistische afdeling van het Mathematisch Centrum, Amsterdam.

Hier volgen een paar citaten uit het artikel.
“De bekendheid van de methoden en principes van de statistiek is in het algemeen nog zeer gering, evenals het besef, dat een kritische instelling bij de toepassing en interpretatie van het grootste belang is.” (p. 234)
en
“De statistiek wordt wel eens kortweg beschreven als een methode om langs exacte weg tot een beslissing of een conclusie te geraken in onzekere situaties. De onzekerheid is het centrale kenmerk van de statistiek, zowel wat de gegevens als wat de conclusies betreft.” (p. 235)

Nu is er de afgelopen zestig jaar veel gebeurd op het gebied van statistiek. Mede dankzij de beschikbaarheid van statistische software, de rekenkracht van de computer en een grote hoeveelheid leerboeken statistiek is de kennis van het vak enorm toegenomen, ook onder docenten en studenten bij het HBO  i.v.m. de plaats die onderzoek en statistiek sinds 2000 in het curriculum gekregen hebben.
Maar ondanks deze ontwikkeling blijft het van groot belang om de vraag ‘Wat is en waarvoor dient de statistiek?’ te blijven stellen en wat mij betreft zou het bespreken van die vraag ook een veel grotere rol in het onderwijs moeten spelen. En je kunt je in dit verband ook afvragen of er ten aanzien van ‘het besef, dat een kritische instelling bij de toepassing en interpretatie van het grootste belang is’ wel enige vooruitgang geboekt is. Het gebruik van statistische software heeft ook een keerzijde, namelijk het gevaar dat statistiek en statistisch redeneren gereduceerd worden tot wat Gerd Gigerenzer ‘rule-driven, or mechanized decisions to accept or reject a hypothesis‘ genoemd heeft (G.Gigerenzer e.a., The Empire of Chance, 1989/1997 , pag. 83).

Het is in mijn ogen dan ook verheugend om te merken dat de conventionele (frequentistische) significantietoets momenteel stevig onder de loep  wordt genomen – zie de opmerkingen van de American Psychological Association (APA) in 2010 (in haar Publication Manual, 6th ed.) en van de American Statistical Association (ASA) in 2016 (The American Statistician, 70:2,129-133) – aangezien er daardoor een discussie over de grondslagen van het vak op gang komt. Daarnaast is er in toenemende mate literatuur beschikbaar die de reflectie op het gebruik van statistiek stimuleert, ik noem als voorbeeld het boek van Nassim Nicholas Taleb (2008/2016), De Zwarte Zwaan.

De tijd van het doceren van een standaardpakket frequentistische statistiek lijkt voorbij, het gaat er nu om een visie op het gebruik van statistiek te ontwikkelen in de context van een specifieke opleiding. Kortom, laten we ons vooral buigen over de vraag  ‘Wat is en waarvoor dient de statistiek?’ en, in het verlengde hiervan, wat voor soort statistiek is relevant voor onze opleiding en beroepspraktijk?

Rob Flohr
14 augustus 2016