schatten van een gemiddelde of een proportie

Binnen de conventionele (traditionele, klassieke, frequentistische) statistiek zijn er twee hoofdvormen van inductieve statistische technieken, namelijk toetsen en schatten. Sinds 2010 adviseert de APA onderzoekers om de aandacht te richten op schatten en om de nulhypothesetoetsing (NHST) minder of niet te gebruiken vanwege de theoretische bezwaren die eraan kleven. De techniek van het schatten komt neer op het berekenen van een betrouwbaarheidsinterval (confidence interval), doorgaans op basis van een betrouwbaarheid van 95%.
Maar wat betekent dat precies? Een lastig aspect van statistiek betreft de correcte interpretatie van concepten en uitkomsten en daar gaat dan ook vaak een en ander mis.
In het filmpje bij deze map (‘Calculating a confidence interval’) is er sprake van een steekproef van 15 appels op basis waarvan we een uitspraak willen doen over het gemiddelde gewicht van alle appels in de boomgaard (populatie). We vinden een steekproefgemiddelde van 149.3 gram en een standaarddeviatie van 4.758 gram. Middels een formule en/of software vinden we een 95% betrouwbaarheidsinterval van [ 146.7, 151.9]. Betekent dit dat het populatiegemiddelde (het gemiddelde gewicht van alle appels in de boomgaard) tussen 146.7 en 151.9 gram ligt? Het antwoord luidt: dat weten we niet, het kan zo zijn maar het kan ook niet zo zijn. Maar we weten wel iets meer dan dat. Het element van de 95% betrouwbaarheid houdt namelijk het volgende in:
wanneer we de procedure van het nemen van een steekproef van 15 appels, het bepalen van het steekproefgemiddelde en de steekproefstandaarddeviatie en het bepalen van een 95% betrouwbaarheidsinterval, vele malen zouden herhalen, dan zal in 95% van de gevallen het berekende betrouwbaarheidsinterval het populatiegemiddelde bevatten en slechts in 5% van de gevallen niet. Maar we weten dus niet of ons interval van [ 146.7, 151.9 ] tot de 95% goede of tot de 5% foutieve intervallen behoort.
We kunnen niet zeggen: er is een kans van 95% dat ons interval het populatiegemiddelde bevat. Want de kans dat ons interval het populatiegemiddelde bevat is of 1 (ons interval bevat het populatiegemiddelde) of 0 (ons interval bevat het populatiegemiddelde niet). Wat we wel kunnen zeggen is: we hebben een kans van 95% om een interval te vinden dat het populatiegemiddelde bevat. Maar het is dus mogelijk dat ons interval het populatiegemiddelde niet bevat.

De betrouwbaarheid waar we over spreken betreft dus de gehanteerde methode en niet het gevonden interval zelf!!!
Dat is dus ook statistiek: onze uitspraken over de werkelijkheid gaan gepaard met onzekerheid en wat we proberen te doen is het zo goed mogelijk kwantificeren van die onzekerheid.
Overigens wordt de theoretische basis van betrouwbaarheidsintervallen (en van significantietoetsing) gevormd door een wiskundig leerstuk, de Centrale Limiet Stelling. Er bestaat een instructieve Java-applet (zie: http://onlinestatbook.com/stat_sim/sampling_dist/ waarbij dit fundamentele theorema inzichtelijk gemaakt wordt.

 

Internetadressen:

Understanding confidence intervals

https://www.youtube.com/watch?v=tFWsuO9f74o

(let op de betekenis van het begrip ‘sampling error’)

Calculating the confidence interval for a mean using a formula

https://www.youtube.com/watch?v=s4SRdaTycaw

(let op de betekenis van de begrippen ‘standard error’ en ‘margin of error’)