Varukorg
Cart Item Title
Name
:
value
4.5€
Varukorgen är tom.
Oops! Something went wrong while submitting the form.

Statistik i odlingsförsök

Hur vi arbetar metodiskt med statistik i odlingsförsök – från hypotes och kontroller till biologisk variation, replikat och hur resultat ska tolkas.

Varför statistik är avgörande i odlingsförsök

Statistik är kanske inte det mest spännande man kan arbeta med inom odling, men det är ett absolut måste. Varje gång vi vill pröva något nytt behöver vi kunna avgöra om det vi ser faktiskt beror på det vi testar – eller om det lika gärna kan vara slumpen som spelar oss ett spratt.

Det räcker inte att en planta ser större ut än en annan. Vi behöver ett arbetssätt som gör att vi kan dra slutsatser som håller, även när biologin beter sig som biologi gör.

Hypotesen – alltid startpunkten

Varje odlingsförsök vi genomför börjar med en hypotes. Hypotesen är ett antagande om en trolig förändring som vi vill testa.

Det kan till exempel vara:

  • att en torvfri jord ger en annan tillväxt än en jord med torv
  • eller att växtnäring A ger större tillväxt än en kontroll

I statistiska termer formulerar vi då:

  • en nollhypotes, som säger att ingen skillnad finns
  • och en alternativhypotes, som säger att en verklig skillnad finns

I vissa fall är hypotesen tvåsidig – vi vet inte om effekten blir positiv eller negativ. I andra fall är den ensidig, till exempel när vi uttryckligen testar om en ny växtnäring ger större tillväxt än kontrollen. Valet görs alltid innan försöket startar och styr hur resultaten analyseras.

Kontroller – grunden för all jämförelse

I alla våra odlingsförsök arbetar vi med någon form av kontroll. Kontrollen representerar det vi utvärderar våra behandlingar mot, och utan den går det i praktiken inte att dra några meningsfulla slutsatser.

Kontrollen kan vara ett etablerat substrat, en standardnäring eller ett odlingssystem som vi vet fungerar under de aktuella förhållandena. När vi säger att en behandling fungerar bättre eller sämre är det alltid i relation till kontrollen.

Nollkontroll och positiv kontroll

I vissa försök använder vi flera typer av kontroller. En nollkontroll är ett försökled där den faktor vi undersöker medvetet saknas helt. Den fungerar som en baslinje och visar hur systemet beter sig utan påverkan.

Ett exempel är när vi testar material för förekomst av pyralider. Då använder vi en nollkontroll som vi vet inte är kontaminerad, för att se hur grödan utvecklas under helt rena förhållanden.

I vissa fall använder vi också en positiv kontroll, där vi medvetet skapar den effekt vi vill studera, till exempel genom att tillsätta pyralider i känd koncentration. Den positiva kontrollen visar hur grödan reagerar när påverkan faktiskt finns, och gör det möjligt att tolka hur väl vår behandling fungerar under just de förhållandena.

Stickprov och biologisk verklighet

När vi genomför ett försök arbetar vi alltid med ett stickprov. Det är ett begränsat urval ur en i praktiken oändlig population, till exempel basilikaplantor. Den variation vi ser i försöket beror på genetiska skillnader, mikroklimat, mätosäkerhet och faktorer vi inte fullt ut kunnat kontrollera.

Två plantor blir aldrig exakt lika, även om de haft samma förutsättningar. Det är helt normalt – och det är också därför statistik behövs.

Biologisk variation i praktiken

I praktiska odlingsförsök stöter vi nästan alltid på variation och outliers, som ni ser i exemplen här nedan:

Exempel 1: Tomatplanta som avviker kraftigt

I ett tomatförsök har vi drivit upp 30 plantor där en individ sticker ut tydligt och är betydligt högre än samtliga andra.

Exempel 2: Basilikaplanta som knappt växer

I ett annat försök ser vi en basilikaplanta som knappt har vuxit alls, trots att den haft samma förutsättningar som övriga plantor.

Exempel 3: Småbladig basilika som inte blir småbladig

I ett tredje exempel ser vi hur en småbladig basilika inte alltid blir just småbladig.

Den här typen av avvikelser är inte fel i försöket – de är en del av den biologiska verkligheten. Frågan blir därför inte om de finns, utan hur stor påverkan de ska få på våra slutsatser.

Normalfördelning – vad gör vi med datan?

När vi har samlat in den data vi behöver, utifrån ett tillräckligt stort stickprov, behöver vi analysera datan för att se om hypotesen stämmer eller om vi har motbevisat den. Men innan vi kan välja hur resultaten ska analyseras behöver vi först förstå hur stor variationen är inom stickprovet.

Normalfördelning med tvåsidigt test vid 5 % signifikansnivå.
Områden utanför ±1,96 utgör signifikansområdet (p < 0,05), medan området däremellan är icke-signifikant.

Det kan till exempel vara så att vi får två mycket låga individer, flera mellanhöga och någon enstaka extremt hög planta. Frågan blir då om detta är ett rimligt biologiskt utfall, eller om datan avviker på ett sätt som påverkar hur den bör analyseras.

Val av statistisk metod vid odlingsförsök

Genom att först undersöka hur datan fördelar sig kan vi avgöra om vi kan analysera resultaten mot en normalfördelad modell, eller om vi istället behöver använda ett test som inte förutsätter normalfördelning.

När datan är normalfördelad

Om datan är ungefär normalfördelad använder vi parametriska test. Vid jämförelse mellan två behandlingar använder vi t-test. När flera behandlingar jämförs samtidigt använder vi först ANOVA för att avgöra om det över huvud taget finns någon skillnad mellan grupperna.

Visar ANOVA att en skillnad finns går vi vidare med Dunnetts test, där varje behandling jämförs mot kontrollen. På så sätt kan vi utvärdera flera behandlingar utan att öka risken för falskt positiva resultat, vilket kan hända vid upprepade t-test.

När datan inte är normalfördelad

Om datan inte är normalfördelad, eller om enstaka individer får oproportionerligt stor påverkan på resultatet (många outliers), använder vi istället icke-parametriska test.

Vid jämförelse mellan två behandlingar använder vi då Mann–Whitney U-test. När flera behandlingar jämförs samtidigt använder vi Kruskal–Wallis-test. Visar detta test att en skillnad finns går vi vidare med Dunns test, där behandlingarna jämförs mot kontrollen eller nollkontrollen.

Detta gör att vi kan hantera biologisk variation på ett robust sätt, även när datan inte uppfyller de antaganden som krävs för parametriska test.

Frihetsgrader, t-fördelning och vägen mot z-fördelningen

När vi arbetar med stickprov känner vi inte till den sanna variationen i hela populationen – den måste uppskattas från datan. Det är därför vi i praktiken använder t-fördelningen snarare än normalfördelningen.

Här ser vi ett diagram som visar både z-fördelningen (normalfördelningen) och t-fördelningen med 9 frihetsgrader, vilket motsvarar ett stickprov med 10 observationer. Z-fördelningen är ritad med streckade linjer och har kritiska värden vid ±1,96 för ett tvåsidigt test med 5 % signifikansnivå. T-fördelningen är ritad med heldragna linjer och har kritiska värden vid cirka ±2,26 vid samma signifikansnivå och antal frihetsgrader. Skillnaden mellan fördelningarna är att t-fördelningen har tjockare svansar än z-fördelningen. Det innebär att man behöver ett större t-värde än z-värde för att uppnå statistisk signifikans när stickprovet är litet. Ju fler observationer och frihetsgrader man har, desto mer närmar sig t-fördelningen z-fördelningen.

Antalet frihetsgrader beskriver hur mycket information vi har kvar efter att vi till exempel har beräknat ett medelvärde. I ett stickprov med n observationer får vi därför n − 1 frihetsgrader.

Ju fler frihetsgrader vi har, desto mindre blir osäkerheten i variansskattningen. T-fördelningen smalnar då av och närmar sig successivt z-fördelningen, vilket innebär att kraven på hur stort t-värdet måste vara för signifikans gradvis minskar.

Exempel: frihetsgrader i praktiken

Anta att vi jämför två näringslösningar och mäter biomassa hos basilika vid skörd.

Om vi odlar 10 plantor per behandling har vi 9 frihetsgrader i varje grupp. Då vet vi fortfarande ganska lite om den verkliga variationen i populationen, och t-fördelningen har relativt tjocka svansar. Vid ett tvåsidigt test med 5 % signifikansnivå krävs då ett t-värde på cirka ±2,26 för att resultatet ska räknas som signifikant.

Om vi istället hade odlat 20 plantor per behandling har vi 19 frihetsgrader. Variansskattningen blir säkrare, t-fördelningen smalnar av och det kritiska t-värdet sjunker till cirka ±2,09.

Vid ännu större stickprov, till exempel 50 plantor, ligger det kritiska t-värdet mycket nära ±1,96, vilket är det värde som används i z-fördelningen. I praktiken betyder det att skillnaden mellan t-test och z-test då är försumbar.

Detta illustrerar varför fler frihetsgrader minskar kraven på hur extremt resultatet måste vara för att klassas som statistiskt signifikant – inte för att vi “sänker ribban”, utan för att osäkerheten i variansskattningen minskar.

Signifikansnivåer – varför just 5 %

När vi säger att vi arbetar med en signifikansnivå på 5 % är det viktigt att förstå att detta inte är någon naturlag. Det är en överenskommen standard som innebär en balans mellan försiktighet och praktisk användbarhet.

I vissa sammanhang accepterar man högre risk, till exempel i tidiga eller explorativa försök. I andra, mycket kritiska sammanhang – till exempel inom medicin eller säkerhet – arbetar man istället med betydligt striktare krav, motsvarande 99 % säkerhet eller mer.

Det viktiga är inte siffran i sig, utan att vi är tydliga med vilken risknivå vi accepterar och varför.

P-värde, effektstorlek och konfidensintervall

Ett p-värde ger i grunden ett ja-eller-nej-svar: finns det en statistiskt säkerställd skillnad eller inte? Men p-värdet säger ingenting om hur stor skillnaden är, eller hur osäker uppskattningen är.

Därför använder vi konfidensintervall. Ett konfidensintervall visar inom vilket spann den sanna skillnaden rimligen kan ligga och hur osäkra vi är i vår uppskattning. Om intervallet för skillnaden ligger helt över eller under noll kan vi utesluta att effekten är noll. Om intervallet däremot korsar noll finns det fortfarande en rimlig möjlighet att ingen verklig skillnad finns.

Till skillnad från ett p-värde stannar konfidensintervallet alltså inte vid ett ja eller nej. Det visar hur stor skillnaden kan vara – effektstorleken – och hur säker den uppskattningen är.

Detta blir särskilt tydligt i våra odlingsförsök. I ett basilikaförsök med endast tre plantor per behandling kan skillnaden i medelvärde vara stor och till och med statistiskt signifikant. Skillnaden i medelvärde kan till exempel vara omkring 5 gram bladmassa, vilket i praktiken är en tydlig och relevant effekt.

Samtidigt blir konfidensintervallet vid så få replikat ofta mycket brett. Förenklat kan konfidensintervallet skrivas som:

skillnad ± osäkerhetsmarginal

Med tre plantor per led blir osäkerhetsmarginalen ofta lika stor som, eller större än, själva skillnaden. I ett sådant fall kan det till exempel se ut som:

−5 g ± stor osäkerhet

Det innebär att konfidensintervallet sträcker sig från en tydligt negativ effekt till värden nära eller över noll. Eftersom intervallet korsar noll kan vi inte utesluta att den sanna skillnaden i populationen är liten eller obefintlig, trots att stickprovet visar en tydlig effekt.

Vid n = 3 är konfidensintervallet brett och korsar noll, vilket gör resultatet osäkert trots stor observerad effekt. Vid n = 7 smalnar intervallet av och korsar inte noll, vilket gör skillnaden robust.

När vi istället ökar antalet replikat, till exempel till sju plantor per behandling, förändras inte effektens storlek nämnvärt – skillnaden i medelvärde är ofta ungefär densamma. Det som förändras är osäkerheten. Konfidensintervallet smalnar av och hamnar helt över eller under noll. Först då kan vi säga att skillnaden är både statistiskt säker och tillräckligt stabil för att ligga till grund för beslut.

I ett sådant läge säger signifikansen i praktiken bara att de plantor vi råkade mäta skiljde sig åt. Den säger betydligt mindre om hur stabil, tillförlitlig och reproducerbar skillnaden är. Först när konfidensintervallet smalnar av – till exempel genom fler replikat – kan vi avgöra om effekten är tillräckligt stor och robust för att bygga vidare på.

Det är just därför vi använder minst sju plantor per behandling, och varför det är direkt missvisande att jämföra planta mot planta. En enskild individ kan aldrig representera ett tillräckligt representativt stickprov ur en population.

Vi nöjer oss alltså inte med att en skillnad är statistiskt säker. Vi vill också se var hela konfidensintervallet hamnar i relation till noll och om det ligger inom ett spann som är biologiskt och praktiskt relevant. Först då blir ett resultat meningsfullt i praktiken.

Ett signifikant resultat är ingen absolut sanning

Ett statistiskt signifikant resultat är inte en absolut sanning. Det är ett matematiskt sätt att visa att datan pekar tydligt åt ett håll, givet de antaganden och den osäkerhet som finns i försöket.

För oss är statistiken ett verktyg för att identifiera mönster och trender i biologisk variation – inte ett facit. Det är genom upprepade försök, samstämmiga resultat och praktisk erfarenhet som kunskap blir robust.

Redo att planera er konferensdag?

Skicka en förfrågan via formuläret och läs mer om oss på vår konferenssida. Här hittar du också vanliga frågor och våra kontaktuppgifter om du vill prata vidare.
Tyckte du om innehållet? Dela det med andra.

Statistik i odlingsförsök

Hur vi arbetar metodiskt med statistik i odlingsförsök – från hypotes och kontroller till biologisk variation, replikat och hur resultat ska tolkas.

Varför statistik är avgörande i odlingsförsök

Statistik är kanske inte det mest spännande man kan arbeta med inom odling, men det är ett absolut måste. Varje gång vi vill pröva något nytt behöver vi kunna avgöra om det vi ser faktiskt beror på det vi testar – eller om det lika gärna kan vara slumpen som spelar oss ett spratt.

Det räcker inte att en planta ser större ut än en annan. Vi behöver ett arbetssätt som gör att vi kan dra slutsatser som håller, även när biologin beter sig som biologi gör.

Hypotesen – alltid startpunkten

Varje odlingsförsök vi genomför börjar med en hypotes. Hypotesen är ett antagande om en trolig förändring som vi vill testa.

Det kan till exempel vara:

  • att en torvfri jord ger en annan tillväxt än en jord med torv
  • eller att växtnäring A ger större tillväxt än en kontroll

I statistiska termer formulerar vi då:

  • en nollhypotes, som säger att ingen skillnad finns
  • och en alternativhypotes, som säger att en verklig skillnad finns

I vissa fall är hypotesen tvåsidig – vi vet inte om effekten blir positiv eller negativ. I andra fall är den ensidig, till exempel när vi uttryckligen testar om en ny växtnäring ger större tillväxt än kontrollen. Valet görs alltid innan försöket startar och styr hur resultaten analyseras.

Kontroller – grunden för all jämförelse

I alla våra odlingsförsök arbetar vi med någon form av kontroll. Kontrollen representerar det vi utvärderar våra behandlingar mot, och utan den går det i praktiken inte att dra några meningsfulla slutsatser.

Kontrollen kan vara ett etablerat substrat, en standardnäring eller ett odlingssystem som vi vet fungerar under de aktuella förhållandena. När vi säger att en behandling fungerar bättre eller sämre är det alltid i relation till kontrollen.

Nollkontroll och positiv kontroll

I vissa försök använder vi flera typer av kontroller. En nollkontroll är ett försökled där den faktor vi undersöker medvetet saknas helt. Den fungerar som en baslinje och visar hur systemet beter sig utan påverkan.

Ett exempel är när vi testar material för förekomst av pyralider. Då använder vi en nollkontroll som vi vet inte är kontaminerad, för att se hur grödan utvecklas under helt rena förhållanden.

I vissa fall använder vi också en positiv kontroll, där vi medvetet skapar den effekt vi vill studera, till exempel genom att tillsätta pyralider i känd koncentration. Den positiva kontrollen visar hur grödan reagerar när påverkan faktiskt finns, och gör det möjligt att tolka hur väl vår behandling fungerar under just de förhållandena.

Stickprov och biologisk verklighet

När vi genomför ett försök arbetar vi alltid med ett stickprov. Det är ett begränsat urval ur en i praktiken oändlig population, till exempel basilikaplantor. Den variation vi ser i försöket beror på genetiska skillnader, mikroklimat, mätosäkerhet och faktorer vi inte fullt ut kunnat kontrollera.

Två plantor blir aldrig exakt lika, även om de haft samma förutsättningar. Det är helt normalt – och det är också därför statistik behövs.

Biologisk variation i praktiken

I praktiska odlingsförsök stöter vi nästan alltid på variation och outliers, som ni ser i exemplen här nedan:

Exempel 1: Tomatplanta som avviker kraftigt

I ett tomatförsök har vi drivit upp 30 plantor där en individ sticker ut tydligt och är betydligt högre än samtliga andra.

Exempel 2: Basilikaplanta som knappt växer

I ett annat försök ser vi en basilikaplanta som knappt har vuxit alls, trots att den haft samma förutsättningar som övriga plantor.

Exempel 3: Småbladig basilika som inte blir småbladig

I ett tredje exempel ser vi hur en småbladig basilika inte alltid blir just småbladig.

Den här typen av avvikelser är inte fel i försöket – de är en del av den biologiska verkligheten. Frågan blir därför inte om de finns, utan hur stor påverkan de ska få på våra slutsatser.

Normalfördelning – vad gör vi med datan?

När vi har samlat in den data vi behöver, utifrån ett tillräckligt stort stickprov, behöver vi analysera datan för att se om hypotesen stämmer eller om vi har motbevisat den. Men innan vi kan välja hur resultaten ska analyseras behöver vi först förstå hur stor variationen är inom stickprovet.

Normalfördelning med tvåsidigt test vid 5 % signifikansnivå.
Områden utanför ±1,96 utgör signifikansområdet (p < 0,05), medan området däremellan är icke-signifikant.

Det kan till exempel vara så att vi får två mycket låga individer, flera mellanhöga och någon enstaka extremt hög planta. Frågan blir då om detta är ett rimligt biologiskt utfall, eller om datan avviker på ett sätt som påverkar hur den bör analyseras.

Val av statistisk metod vid odlingsförsök

Genom att först undersöka hur datan fördelar sig kan vi avgöra om vi kan analysera resultaten mot en normalfördelad modell, eller om vi istället behöver använda ett test som inte förutsätter normalfördelning.

När datan är normalfördelad

Om datan är ungefär normalfördelad använder vi parametriska test. Vid jämförelse mellan två behandlingar använder vi t-test. När flera behandlingar jämförs samtidigt använder vi först ANOVA för att avgöra om det över huvud taget finns någon skillnad mellan grupperna.

Visar ANOVA att en skillnad finns går vi vidare med Dunnetts test, där varje behandling jämförs mot kontrollen. På så sätt kan vi utvärdera flera behandlingar utan att öka risken för falskt positiva resultat, vilket kan hända vid upprepade t-test.

När datan inte är normalfördelad

Om datan inte är normalfördelad, eller om enstaka individer får oproportionerligt stor påverkan på resultatet (många outliers), använder vi istället icke-parametriska test.

Vid jämförelse mellan två behandlingar använder vi då Mann–Whitney U-test. När flera behandlingar jämförs samtidigt använder vi Kruskal–Wallis-test. Visar detta test att en skillnad finns går vi vidare med Dunns test, där behandlingarna jämförs mot kontrollen eller nollkontrollen.

Detta gör att vi kan hantera biologisk variation på ett robust sätt, även när datan inte uppfyller de antaganden som krävs för parametriska test.

Frihetsgrader, t-fördelning och vägen mot z-fördelningen

När vi arbetar med stickprov känner vi inte till den sanna variationen i hela populationen – den måste uppskattas från datan. Det är därför vi i praktiken använder t-fördelningen snarare än normalfördelningen.

Här ser vi ett diagram som visar både z-fördelningen (normalfördelningen) och t-fördelningen med 9 frihetsgrader, vilket motsvarar ett stickprov med 10 observationer. Z-fördelningen är ritad med streckade linjer och har kritiska värden vid ±1,96 för ett tvåsidigt test med 5 % signifikansnivå. T-fördelningen är ritad med heldragna linjer och har kritiska värden vid cirka ±2,26 vid samma signifikansnivå och antal frihetsgrader. Skillnaden mellan fördelningarna är att t-fördelningen har tjockare svansar än z-fördelningen. Det innebär att man behöver ett större t-värde än z-värde för att uppnå statistisk signifikans när stickprovet är litet. Ju fler observationer och frihetsgrader man har, desto mer närmar sig t-fördelningen z-fördelningen.

Antalet frihetsgrader beskriver hur mycket information vi har kvar efter att vi till exempel har beräknat ett medelvärde. I ett stickprov med n observationer får vi därför n − 1 frihetsgrader.

Ju fler frihetsgrader vi har, desto mindre blir osäkerheten i variansskattningen. T-fördelningen smalnar då av och närmar sig successivt z-fördelningen, vilket innebär att kraven på hur stort t-värdet måste vara för signifikans gradvis minskar.

Exempel: frihetsgrader i praktiken

Anta att vi jämför två näringslösningar och mäter biomassa hos basilika vid skörd.

Om vi odlar 10 plantor per behandling har vi 9 frihetsgrader i varje grupp. Då vet vi fortfarande ganska lite om den verkliga variationen i populationen, och t-fördelningen har relativt tjocka svansar. Vid ett tvåsidigt test med 5 % signifikansnivå krävs då ett t-värde på cirka ±2,26 för att resultatet ska räknas som signifikant.

Om vi istället hade odlat 20 plantor per behandling har vi 19 frihetsgrader. Variansskattningen blir säkrare, t-fördelningen smalnar av och det kritiska t-värdet sjunker till cirka ±2,09.

Vid ännu större stickprov, till exempel 50 plantor, ligger det kritiska t-värdet mycket nära ±1,96, vilket är det värde som används i z-fördelningen. I praktiken betyder det att skillnaden mellan t-test och z-test då är försumbar.

Detta illustrerar varför fler frihetsgrader minskar kraven på hur extremt resultatet måste vara för att klassas som statistiskt signifikant – inte för att vi “sänker ribban”, utan för att osäkerheten i variansskattningen minskar.

Signifikansnivåer – varför just 5 %

När vi säger att vi arbetar med en signifikansnivå på 5 % är det viktigt att förstå att detta inte är någon naturlag. Det är en överenskommen standard som innebär en balans mellan försiktighet och praktisk användbarhet.

I vissa sammanhang accepterar man högre risk, till exempel i tidiga eller explorativa försök. I andra, mycket kritiska sammanhang – till exempel inom medicin eller säkerhet – arbetar man istället med betydligt striktare krav, motsvarande 99 % säkerhet eller mer.

Det viktiga är inte siffran i sig, utan att vi är tydliga med vilken risknivå vi accepterar och varför.

P-värde, effektstorlek och konfidensintervall

Ett p-värde ger i grunden ett ja-eller-nej-svar: finns det en statistiskt säkerställd skillnad eller inte? Men p-värdet säger ingenting om hur stor skillnaden är, eller hur osäker uppskattningen är.

Därför använder vi konfidensintervall. Ett konfidensintervall visar inom vilket spann den sanna skillnaden rimligen kan ligga och hur osäkra vi är i vår uppskattning. Om intervallet för skillnaden ligger helt över eller under noll kan vi utesluta att effekten är noll. Om intervallet däremot korsar noll finns det fortfarande en rimlig möjlighet att ingen verklig skillnad finns.

Till skillnad från ett p-värde stannar konfidensintervallet alltså inte vid ett ja eller nej. Det visar hur stor skillnaden kan vara – effektstorleken – och hur säker den uppskattningen är.

Detta blir särskilt tydligt i våra odlingsförsök. I ett basilikaförsök med endast tre plantor per behandling kan skillnaden i medelvärde vara stor och till och med statistiskt signifikant. Skillnaden i medelvärde kan till exempel vara omkring 5 gram bladmassa, vilket i praktiken är en tydlig och relevant effekt.

Samtidigt blir konfidensintervallet vid så få replikat ofta mycket brett. Förenklat kan konfidensintervallet skrivas som:

skillnad ± osäkerhetsmarginal

Med tre plantor per led blir osäkerhetsmarginalen ofta lika stor som, eller större än, själva skillnaden. I ett sådant fall kan det till exempel se ut som:

−5 g ± stor osäkerhet

Det innebär att konfidensintervallet sträcker sig från en tydligt negativ effekt till värden nära eller över noll. Eftersom intervallet korsar noll kan vi inte utesluta att den sanna skillnaden i populationen är liten eller obefintlig, trots att stickprovet visar en tydlig effekt.

Vid n = 3 är konfidensintervallet brett och korsar noll, vilket gör resultatet osäkert trots stor observerad effekt. Vid n = 7 smalnar intervallet av och korsar inte noll, vilket gör skillnaden robust.

När vi istället ökar antalet replikat, till exempel till sju plantor per behandling, förändras inte effektens storlek nämnvärt – skillnaden i medelvärde är ofta ungefär densamma. Det som förändras är osäkerheten. Konfidensintervallet smalnar av och hamnar helt över eller under noll. Först då kan vi säga att skillnaden är både statistiskt säker och tillräckligt stabil för att ligga till grund för beslut.

I ett sådant läge säger signifikansen i praktiken bara att de plantor vi råkade mäta skiljde sig åt. Den säger betydligt mindre om hur stabil, tillförlitlig och reproducerbar skillnaden är. Först när konfidensintervallet smalnar av – till exempel genom fler replikat – kan vi avgöra om effekten är tillräckligt stor och robust för att bygga vidare på.

Det är just därför vi använder minst sju plantor per behandling, och varför det är direkt missvisande att jämföra planta mot planta. En enskild individ kan aldrig representera ett tillräckligt representativt stickprov ur en population.

Vi nöjer oss alltså inte med att en skillnad är statistiskt säker. Vi vill också se var hela konfidensintervallet hamnar i relation till noll och om det ligger inom ett spann som är biologiskt och praktiskt relevant. Först då blir ett resultat meningsfullt i praktiken.

Ett signifikant resultat är ingen absolut sanning

Ett statistiskt signifikant resultat är inte en absolut sanning. Det är ett matematiskt sätt att visa att datan pekar tydligt åt ett håll, givet de antaganden och den osäkerhet som finns i försöket.

För oss är statistiken ett verktyg för att identifiera mönster och trender i biologisk variation – inte ett facit. Det är genom upprepade försök, samstämmiga resultat och praktisk erfarenhet som kunskap blir robust.

Tyckte du om innehållet? Dela det med andra.
x
Prenumerera på vår nyhetsbrev.