Organisatie - 1 april 2010

Statistische vergissingen: de top 3

Promovendi maken geregeld fouten bij hun onderzoek vanwege onvoldoende kennis van statistiek. Saskia Burgers probeert er wat aan te doen met het boek ‘Statistiek voor onderzoekers’. Hierbij haar top 3 van statistische vergissingen.

Statistics.gif
 
1)      Voor de proef wordt lang niet altijd nagedacht over het aantal waarnemingen dat je moet doen om bijvoorbeeld een verschil aan te tonen tussen behandeling A en B. Nadat de proef is uitgevoerd is men vervolgens teleurgesteld dat een verschil dat wel relevant is, niet significant is geworden. Een simpel voorbeeld: we vergelijken twee niveaus van stikstofgiften. Als je evenveel stikstof op de veldjes doet, heb je toch variatie in gewasopbrengst vanwege allerlei oorzaken. Je neemt dan bijvoorbeeld tien veldjes, zodat je per gift vijf herhalingen kunt doen. Dan reken je het gemiddelde opbrengst van de vijf veldjes met lage stikstofgift uit en vergelijkt die met de gemiddelde opbrengst bij de hoge stikstofgift. Het is heel eenvoudig om van tevoren uit te rekenen welke steekproefgrootte je nodig hebt om relevante verschillen te ontdekken.’
2)      Onderzoekers denken dat ze onafhankelijke metingen aan een object doen, terwijl het eigenlijk pseudoherhalingen zijn. ‘Bij humaan onderzoek kan iedereen zich dat voorstellen. Bijvoorbeeld: ik meet iemands gezondheid door de tijd. Dat zijn geen tien onafhankelijke metingen, die metingen zijn gerelateerd. Maar nu hebben we een kruisingsproef met dertig nieuwe stekken in een kas. Tien plantjes staan in een kas van 18 graden Celsius, tien plantjes bij 20 graden en tien plantjes bij 22 graden Celsius. Dan denken veel onderzoekers dat ze dertig onafhankelijke metingen hebben, maar ze hebben er maar drie. Als er iets fout gaat in een van de kassen, hebben alle plantjes daar last van. Je past de temperatuur niet onafhankelijk toe op de plantjes, het is een pseudoherhaling.’
3)       Rubbish in, rubbish out. Onderzoekers hebben tegenwoordig de beschikking over menu-gestuurde statistische programma’s, met allerlei opties die je kunt aanklikken. ‘Als je dan op OK drukt, komt er vrijwel altijd een uitkomst uit. Als je de structuur van je proef niet goed opgeeft, heb je toch een uitkomst. Soms komen er dan rare dingen uit. Je moet weten wat je doet.’
 
Drie redenen voor scholing dus, met opnieuw drie opties;
-         Een vak volgen in je reguliere onderwijsprogramma. Er is van alles, zoals de vakken ‘modern statistics for the life sciences’ en ‘statistiek voor ecologen’.
-         Een cursus Statistiek doen bij de Wageningen Business School (WBS).
-         Het boek ‘Statistiek voor onderzoekers, met voorbeelden uit de landbouw- en milieuwetenschappen’, van S.L.G.E. Burgers en J.H. Oude Voshaar, van Wageningen Academic Publishers, ISBN: 978-90-8686-135-5, 49 euro.
Saskia Burgers werkt bij Biometris, het instituut voor toegepaste wiskunde en statistiek van Wageningen UR.

Re:ageer