Noen temaer er for kule til ikke strikkes. Statistiske modeller er et sånt tema.
Statistiske modeller kan også være en utfordring å blogge om (i motsetning til modeller på og utenfor catwalken). Dette er derfor en tekst som kanskje er i overkant teknisk til å være et blogginnlegg, for personlig til å være et statistikk-oppslag på snl.no, for plaprete til å være undervisningsmateriale (eller ikke?), og for uferdig til å være en strikkeoppskrift. Men jeg klarte ikke å la være å skrive det! (Eller illustrere det!)
Værsågod!
I statistisk teori finnes det mange statistiske modeller. En statstisk modell er akkurat som andre modeller vi kjenner: En forenklet fremstilling av virkeligheten.
Alle kjenner til modelltog, bamser, dukker og catwalkmodeller. Modelltog er forenklede, små versjoner av ekte tog. De har det viktigste på plass: Fasong, hjul og skinner. Men de fleste modelltog har verken fungerende toaletter, nummererte seter og passasjerer med bagasje, eller restaurant med kjøleskap og pølsegrill. Det er detaljer vi har valgt bort når vi har laget tog som barn (og voksne) kan underholde seg med. Bamser som ligner på bjørner har sjelden klør, tenner og dårlig ånde (noen ganger er de til og med konstruert for å gå på to bein - og har armer!), men allikevel skjønner vi at de er ment å være bjørner. Dukker ligner ofte på mennesker, men er ofte ikke helt realistiske. Barbiedukker har for eksempel ikke hår under armene.
Felles for modellene er at de er nyttige til noen formål. Sånn er det også med statistiske modeller.
Statistiske modeller beskriver hovedtrekkene i noe vi har observert, for eksempel høydemålinger i en befolkning, smerteterskelen hos ulike idrettsutøvere, eller hvilke grupperinger i befolkningen som stemmer hva. En statistisk modell vil beskrive hvilke verdier vi kan observere (det har vært dokumentert høydemålinger for voksne mennesker mellom 54 og 272 cm, men de mest ekstreme verdiene er høyst uvanlige). Modellen vil også beskrive hvor vanlige de ulike verdiene er. Det siste kaller vi en sannsynlighetsfordeling.
Statistiske modeller brukes til så å si alle statistiske beregninger, enten du gjør dem selv, eller får en datamaskin til å gjøre dem. Derfor er det verdt å snakke om dem. Og får vi enda flere til å snakke om dem ved å strikke dem, er det også verd å strikke statistiske modeller.
La oss først se på det litt kjedelige eksemplet med høydemålinger. En vanlig modell for høydemålinger er den såkalte normalfordelingen.
Normalfordelingen er en generell modell som tilpasses til det vi er interessert i, for eksempel høydemålinger. For å finne den normalfordelingen som passer best til høydemålinger, må vi spesifisere 1) midtpunktet i fordelingen, og 2) variasjonen.
Vi starter med midtpunktet, som er det samme som gjennomsnittet. Tar vi utgangspunkt i gjennomsnittshøyden til norske rekrutter i 2023, som var 181 cm, plasserer vi toppen på fordelingen over 181. OBS: Vårt fokus er på verdien 181 cm, ikke på hvor høy toppen er.
Deretter må vi spesifisere variasjonen i høydemålingene. Det gjøres ved å oppgi det såkalte standardavviket. Det er forbausende vanskelig å finne en artikkel eller oppslag som gir oss standardavviket for høydemålinger for norske rekrutter (eller noen som helst andre tall som beskriver variasjonen i høyden til norske rekrutter). Basert på det jeg vet fra diverse medisinske forskningsprosjekter, antar jeg at variasjonen i høyden til norske rekrutter tilsvarer et standardavvik på 7 cm. I så fall viser figuren over en god modell for høydefordelingen blant norske unge voksne menn.
Når vi bruker normalfordelingen som modell for høydemålingene, antar vi implisitt at
halvparten av rekruttene er høyere enn 181 cm og halvparten er lavere enn 181 cm
ca 68% av rekruttene er mellom \((181 - 7)\) cm og \((181 + 7)\) cm, altså mellom 174 cm og 188 cm
ca 95% av rekruttene er mellom \((181 - 2\cdot 7)\) cm og \((181 + 2 \cdot 7)\) cm, altså mellom 167 cm og 195 cm
nesten ingen er lavere enn \((181 - 3\cdot 7)\) cm, altså 160 cm, og nesten ingen rekrutter er høyere enn \((181 + 3 \cdot 7)\) cm, altså 203 cm
Og før du nå roper “men jeg kjenner en som er 155 cm! Og en som er to-ti!”, så vil jeg rolig svare “Jada, jeg sa nesten ingen, ikke ingen, og husk nå at dette er en modell.” Akkurat som modelltogene og Barbie-dukkene, vil også normalfordelingsmodellen ha sine begrensninger.
Til tross for sitt enkle utseende og enkle tolkning, brukes normalfordelingen ofte som modell for noe vi kan observere eller har observert. Både høydemålinger, fødselsvekt, IQ og målefeil kan antas være ganske normalfordelt. Normalfordelingen var derfor utgangspunktet for et av de aller første statistikkedesignene, nemlig normalfordelingsskjerfet.
Verdiene vi kan observere (skalaene) er veldig forskjellig for ulike ting som er normalfordelt, som høydemålinger, IQ og målefeil.
Men selv om skalaen, altså tallene på \(x\)-aksen (de verdiene modellen sier at vi kan observere), og tallene på \(y\)-aksen (som angir hvor vanlige de ulike verdiene er) er forskjellige, er fasongen til fordelingene lik. Når jeg sier at “fasongen til fordelingen er lik”, til tross for at vi ofte ser noen normalfordelinger som er spissere og noen som er flatere, mener jeg dette:
Fordelingen av verdier er symmetrisk
Fordelingen har én topp
Fordelingen har flest målinger i midten, med få eller ingen ekstreme verdier (vi sier at fordelingene har “lette haler”)
Men normalfordelingen brukes ikke bare direkte som modell for noe vi kan observere. Den dukker også opp i matematiske beregninger og formler, og er en viktig antakelse for mange andre statistiske beregninger. Et av de stilige resultatene der normalfordelingen “dukker” opp, er som modell for en annen statistisk modell, nemlig den binomiske fordelingen. “Men HÆ??” tenker du kanskje nå: “En modell for en modell??” Joda, følg med:
Se for deg at du har ti blomsterert-frø og sår dem i like store potter som får like mye vann og lys. Så følger du med og teller opp hvor mange av de ti frøene som gir blomster.
Eller tenk deg at du har fått deg jobb som telefonselger og hver dag har du en liste med 100 personer du skal ringe til og prøve å overtale til å kjøpe det du selger. Hvor mange salg lykkes du med i løpet av en dag?
Dette er utgangspunktet for den binomiske modellen: Anta at du gjør mange små forsøk etter hverandre, der hvert forsøk gir ett av to mulige resultater (suksess eller fiasko), og der sannsynligheten for suksess er lik i hvert forsøk. Forsøkene må være uavhengige. Det betyr at resultatet fra ett forsøk ikke påvirker resultatet i noen av de andre forsøkene. Til slutt teller du opp hvor mange suksesser du har fått. Da sier vi at antall suksesser er binomisk fordelt.
Meningsmålinger er som skapt for den binomiske modellen! (Eller omvendt!) Ta for eksempel en meningsmåling om vindkraft, “Ja” eller “Nei”. Spør tusen tilfeldige folk, tell antall som svarer “Ja”, og pling! Antallet “Ja” er binomisk fordelt!
Ti blomsterert-frø som sås i like store potter som får like mye vann og lys: Antallet som spirer er binomisk fordelt!
Antallet gutter som fødes i løpet av et år med fødsler i Norge? Binomisk fordelt! Og så videre.
I motsetning til normalfordelingen, som ble bestemt av gjennomsnittet* og standardavviket, blir den binomiske fordelingen bestemt av antallet forsøk og suksessansynligheten. Antallet forsøk noteres \(n\), og suksessannsynligheten noteres \(p\), der \(p\) er et tall mellom 0 (null sannsynlighet for suksess) og 1 (suksess hver eneste gang, alltid).
* Dette er bittelitt upresist, for de teoretiske størrelsene som tilsvarer gjennomsnitt og standardavvik er forventningsverdien og det teoretiske standardavviket, men la oss tillate oss et litt lavere presisjonsnivå enn i lærebøkene akkurat nå, og si at gjennomsnittet er nesten det samme som forventningsverdien.
For åtte erter med høy sannsynlighet for suksess, la oss si 90%, ser fordelingen for antall suksesser slik ut:
Hvis du har åtte gode frø med høy suksessannsynlighet, vil du med høy sannsynlighet få sju eller åtte planter som gir deg blomster.
La oss se hvordan fordelingen til antall blomsterplanter ser ut hvis frøene ikke er fullt så gode:
Tyngdepunktet i fordelingen flytter seg fra mange planter med blomster til få planter med blomster, når suksessannsynligheten blir lavere. Det er vel egentlig ganske logisk?
Vi kan faktisk regne ut tyngdepunktet i hver fordeling helt nøyaktig. Det er antall forsøk ganger suksessannsynlighet, \(n \cdot p\), og dette er den enkle formelen for forventningsverdien i en binomisk fordeling. I det øverste plottet er forventningsverdien \(8 \cdot 0.9 = 7.2\). Vi forventer suksess med 7.2 frø. I den nest øverste fordelingen er forventningsverdien \(8 \cdot 0.8 = 6.4\).
I den midterste fordelingen er forventningsverdien \(8 \cdot 0.5 = 4\). Med andre ord: Halvparten av de åtte frøene forventes å gi blomster. Det er ikke så rart når suksessannsynligheten er 0.5 = 50%, vel?
Se litt nærmere på den midterste fordelingen:
Ligner ikke den mistenkelig på en fordeling vi kjenner?
Ja, jeg mener normalfordelingen.
Se hva som skjer hvis jeg tegner en knallrosa normalfordeling med forventningsverdi 4 og et standardavvik på \(\sqrt{8 \cdot 0.5 \cdot (1-0.5)} = 1.41\) oppå den binomiske fordelingen:
Den passer ganske så godt!
Og dette er det vi mener med normalfordelingsapproksimasjonen til den binomiske fordelingen: I noen tilfeller, nærmere bestemt når vi gjør mange nok forsøk (\(n\) er stor nok), og suksessannsynligheten ikke er for liten eller for stor, finnes det en normalfordeling som er ganske lik den binomiske fordelingen. Da kan vi bruke formler som er basert på normalfordelingen i stedet for den binomiske fordelingen, og da blir livet lettere for oss.
Vi finner den normalfordelingen som passer best, ved å regne ut forventningsverdien og standardavviket til den binomiske fordelingen. Forventningsverdien til en binomisk fordeling er \(n \cdot p\), og standardavviket er \(\sqrt{n \cdot p \cdot (1-p)}\). Derfor var det en normalfordeling med en topp på 4 og et standardavvik på 1.41 som passet best til den binomiske fordelingen med 8 forsøk og suksessannsynlighet på 50%.
De andre binomiske fordelingene i plottene over, er for skjeve til at normalfordelingen er en god modell.
Når vi har en liten n, slik vi hadde med frøene (åtte forsøk er ikke så mange), må p være nesten midt mellom 0 og 1 for at den binomiske fordelingen skal være symmetrisk nok til at normalfordelingstilnærmingen skal fungere.
Når n er større, kan normalfordelingen brukes for mange flere verdier av suksessannsynligheten. Se for eksempel på n=30:
Ser du at både for suksessannsynlighet på 20% og 80%, så er normalfordelingen en tålelig bra tilnærming til den binomiske? Og at når suksessannsynligheten er 0.1 eller 0.9, så er fordelingene altfor skjeve?
Dette synes jeg er verdt et strikkedesign!
Skissestadiet:
Vams farge 418 lun kobber melert, 600 g 12 nøster
Vams farge 401 rustrød melert, 50 g 1 nøste
Vams farge 00 hvit, 1 rest (annet garn eller farge med god kontrast kan
også brukes)
Settpinner str 4.5 og 5.5 og liten rundpinne 5.5 til ermene. Rundpinne 4.5 og 5.5 til bolen.
Strikkefasthet: 15 m på p 5.5 = 10 cm
Str M (overvidde 112 cm, lengde 62 cm, ermlengde etter eget ønske):
Bol
Legg opp 160 m med farge 418 på p 4.5.
Strikk vrangbord (vridd rett + vrang) i 15 omg.
Strikk 1 omg r, bytt til p 5.5 og strikk glattstrikk i 5 omg.
Strikk glattstrikk: * 1 omg med farge 401, 9 omg med farge 418 * Gjenta fra * til * til du har totalt 11 tynne striper med farge 401.
For større størrelser: Legg opp flere masker for å få bolen bredere, og strikk noen flere omg glattstrikk nederst før du skifter til farge 401, og øverst, etter den siste stripa med farge 401 for å få den litt lengre.
Strikk 5 omganger med farge 418. Så kommer halsen, og den har jeg ikke tenkt ut ennå. Finn på noe selv, eller vent på oppdatering!
Ermer
Legg opp 40 m med farge 418 på p 4.5.
Strikk vrangbord (vridd rett + vrang) i 15 omg.
Strikk 1 omg r.
Bytt til p 5.5 og strikk glattstrikk samtidig som du øker 2 m på hver
pinne, 8 m i alt.
Du har nå 40 m på pinnen. Strikk glattstrikk i 2 omg.
På neste omg øker du 2 m på undersiden av ermet.
Strikk glattstrikk: * 1 omg med farge 401, 9 omg med farge 418. I løpet av de 9 omg med farge 418, øker du 2 m på undersiden av ermet, én gang* Gjenta fra * til * til ermet er så langt som du vil ha det. Jeg har totalt 10 tynne striper med farge 401.
Montering
Ja, si det! Her må det klippes opp og sys i ermer, men lenger enn det har jeg ikke kommet. Kjør på og gjør som du bruker, eller vent på oppdatering!
Grafisk mønster
På den ene siden av genseren skal vi sy på binomiske fordelinger for \(n=8\) og \(p= 0.1, 0.2, 0.5, 0.8\) og \(0.9\). Det er fem fordelinger, så hver av dem får to brune striper i høyden.
En genser i str M er 80 masker bred, og hvis vi setter av 10 masker på hver side (så mønsteret ikke forsvinner på siden rundt hjørnet og under ermet og sånn), skal vi brodere på de midterste 60 maskene. En binomisk fordeling med 8 forsøk teller opp antall suksesser på 8 forsøk, og kan derfor ha verdiene 0, 1, 2, 3, 4, 5, 6, 7 og 8. Det blir altså ni søyler i hver figur. Det går ikke opp i 60, så jeg velger å brodere på de midterste 54 maskene.
Høyden til boksene må skaleres etter strikketøyet. Vi har totalt 20 omganger til rådighet for hver fordeling. Dette må vente til en annen dag. Nå skal jeg strikke litt foran TV-skjermen! På gjensyn!