Formularium - Statistiek deel 2

1-2 Steekproevenverdeling

  • concepten (herhaling statistiek 1)
    • populatie
    • (populatieverdeling)
    • (populatie)parameter
    • toevalsvariabele (TV)
      • heeft een verdeling, gemiddelde, variantie, ...
      • symbolen altijd in hoofdletters ()
        • uitzondering:
    • trekking op zuiver toevallig wijze (ZTW)
      • met teruglegging
    • steekproef
      • steekproefgrootte
    • statistische maat
      • vast recept
      • input: een steekproef
      • output: exact één getal
      • symbolen altijd met kleine letters
      • voorbeelden
    • statistiek
      • gelijkaardig aan statistische maat
      • input: meerdere steekproeven van gelijke grootte
      • output: toevalsvariabele
        • dus niet meer één getal
        • dus symbolen met hoofdletters
      • voorbeelden
    • standaardfout / standard error (SE)
      • standaardafwijking van statistiek
    • steekproevenverdeling of
      • verdelingsfunctie van statistiek
    • (parameter)schatter
      • statistiek die populatieparameter benadert
      • voorbeelden
        • voor
        • voor
    • i.d. = identically distributed
    • i.i.d. = independent and identically distributed
      • onafhankelijk
      • identiek verdeeld
        • of
        • niet:
  • enumeratieve methode van steekproevenverdeling
    • bepaal verdeling door alle combinaties uit te schrijven
    • enkel haalbaar voor kleine

Twee studenten kiezen elk random één van de getallen 0, 1 of 2. Wat is de kans dat het gemiddelde van hun getallen kleiner is dan 1.5?

0 0 0.0
0 1 0.5
0 2 1.0
1 0 0.5
1 1 1.0
1 2 1.5
2 0 1.0
2 1 1.5
2 2 2.0

1.1 Gemiddelde en variantie van

  • met teruglegging: i.i.d.
    • en
      • dus schatting van populatiegemiddelde wordt beter en beter (kleinere spreiding) als groter wordt
  • zonder teruglegging: i.d.
    • eindige populatie
      • populatiecorrectiefactor (PCF):
    • oneindige populatie
      • zelfde als met teruglegging
      • gebruik als benadering vanaf

We trekken met teruglegging een steekproef van grootte 70 uit een eindige populatie van grootte 500 met populatiegemiddelde 220 en variantie 324. Wat is de standaarddeviatie van het steekproefgemiddelde?

  • gegeven
    • met teruglegging
  • gevraagd
  • oplossing
      • dus correctiefactor voor teruglegging nodig
  • antwoordmogelijkheden
    • A: met correctiefactor
    • B: met correctiefactor
    • C: zonder correctiefactor
    • D: zonder correctiefactor

2.1 Verdeling van

  • als
    • dan
  • als niet normaal verdeeld is
    • als
      • met teruglegging: i.i.d.
        • centrale limietstelling:
      • zonder teruglegging
        • eindige populatie
        • oneindige populatie of
          • centrale limietstelling:
    • als
      • andere oplossing (computersimulatie, ...)

Een psychologisch onderzoeker bestudeert reactietijden bij een cognitieve taak. De reactietijden zijn normaal verdeeld met verwachte waarde milliseconden en een standaardafwijking milliseconden. Als de onderzoeker een steekproef van 25 personen neemt, wat is dan de kans dat de gemiddelde reactietijd van deze 25 personen meer is dan 620 milliseconden?

  • gegeven
      • dus oneindige populatie
  • gevraagd
  • oplossing

De tijd die een patiënt doorbrengt bij de psycholoog heeft een exponentiële verdeling. De verwachte duur van een therapiesessie is 1 uur en de standaardafwijking is 1 uur. Een psycholoog heeft 70 patiënten in behandeling. Wat is de kans dat de gemiddelde therapiesessie langer duurt dan 50 minuten?

  • gegeven
    • : tijd bij psycholoog (in minuten)
  • gevraagd
  • oplossing
    • niet normaal verdeeld
    • oneindige populatie
    • centrale limietstelling:

Een farmabedrijf telt 3500 werknemers. Uit voorgaande tests is gebleken dat de gemiddelde IQ-score van de werknemers 110 is met een standaardafwijking gelijk aan 12. Je neemt een steekproef van 200 verschillende werknemers en je vraagt je af of hun IQ-scores representatief zijn voor de gehele werkvloer. Wat is de kans dat het gemiddeld IQ in je steekproef binnen 2 punten van het gemiddelde van het ganse bedrijf valt?

  • gegeven
    • : IQ van werknemers farmabedrijf
  • gevraagd
  • oplossing
    • niet normaal verdeeld
      • (IQ is meestal wel normaal verdeeld, maar hier niet gegeven)
    • zonder teruglegging
    • eindige populatie met
      • dus correctiefactor nodig

2.2 Toepassing: normale benadering voor binomiale verdeling

  • exacte oplossing vraagt vaak veel rekenwerk
  • alternatief: benadering via normale verdeling
  • merk op:
  • als en
    • met teruglegging: i.i.d.
      • centrale limietstelling
    • zonder teruglegging
      • eindige populatie ()
        • benadering niet geldig
      • oneindige populatie of
        • idem als met teruglegging
  • continuiteitscorrectie
Bionomiaal Normaal

6 procent van de bevolking is universele bloeddonor (kan bloed doneren aan iedereen). Een ziekenhuis heeft 10 universele bloeddonoren nodig. Er bieden zich 200 kandidaten aan om bloed te geven. Wat is de kans dat hier minstens 10 universele bloeddonoren bij zijn?

  • gegeven
    • : aantal universele bloeddonoren
  • gevraagd
  • oplossing
    • en
    • oneindige populatie
    • continuiteitscorrectie

2.3 Andere steekproevenverdelingen

  • als
    • dan
    • en dus
  • rest: zie formularium

Een socioloog onderzoekt de onderlinge verschillen in het aantal uren per week dat studenten aan een universiteit gemiddeld besteden aan sociale media. Eerder onderzoek heeft aangetoond dat de populatiestandaarddeviatie van het aantal uren dat studenten op sociale media doorbrengen 4 uur is. Voor een steekproef van 35 studenten blijkt de steekproefvariantie in hun gebruik van sociale media 20 uur te zijn. Hoe extreem is deze waarde, m.a.w. wat is de kans om een steekproefvariantie te observeren die minstens even groot is? (bij een even grote steekproef)

  • gegeven
    • : uren sociale media
  • gevraagd
  • oplossing
    • extra assumptie: normaal verdeeld

3 Schatters

  • kwaliteit kwaliteit van schatter
    • vertekening = bias
    • zuiver
    • asymptotisch zuiver
    • variabiliteit
    • nauwkeurigheid / betrouwbaarheid
      • kleine variabiliteit
    • mean squared error (MSE)
    • consistente schatter
      • dus als EN asymptotisch zuiver

3.1 Puntschatter voor het gemiddelde

  • schatter voor
  • eigenschappen
    • zuiver
    • asymptotisch zuiver
    • consistent

Veronderstel dat i.i.d. toevalsvariabelen zijn met verwachte waarde . Welk van onderstaande schatters voor is zuiver? Welke schatter zou je verkiezen? En waarom?

  • zuiver
    • (1) ja
    • (2) ja:
    • (3) ja
    • (4) nee
  • beste keuze
    • (1) dit is
      • neemt elke toevalsvariabele mee in rekening
      • geeft elke variabele evenveel gewicht

3.2 95% intervalschatting voor het gemiddelde

  • assumpties
    • gekende variantie
  • bereken betrouwbaarheidsinterval (BI)
    • ondergrens OG
    • bovengrens BG
  • interval waarbinnen zich in 95% van alle steekproeven bevindt
    • in symbolen:
  • verschillend per steekproef
  • symmetrisch rond
    • merk op: BIs zijn niet voor alle parameters symmetrisch (maar wel voor gemiddelde)
  • kritieke waarden
  • foutenmarge

Gegeven een normaalverdeelde toevalsvariabele 𝑋 met gekende populatievariantie. Waaraan is het 95% BI voor gelijk als je gebruikmaakt van onderstaande gegevens?

  • gegeven
  • gevraagd
    • 95% BI voor
  • oplossing

3.3 C-intervalschatting voor het gemiddelde

  • assumpties
      • anders: zie vorig hoofdstuk over bepaling verdeling
    • gekende variantie
  • gelijkaardig aan hierboven, behalve ...
  • kritieke waarden
  • foutenmarge
  • hogere
    • lagere
    • grotere foutenmarge
    • breder interval
    • meer zekerheid
    • minder nauwkeurig
  • lagere
    • hogere
    • lagere foutenmarge
    • smaller interval
    • minder zekerheid
    • meer nauwkeurig

Gegeven een normaal verdeelde toevalsvariabele met gekende populatievariantie. Waaraan is het 99% BI voor gelijk als je gebruikmaakt van onderstaande gegevens?

  • gegeven
  • gevraagd
    • 99% BI voor
  • oplossing

Het 99% betrouwbaarheidsinterval zal in vorige oefening ... zijn aan/dan het 90% betrouwbaarheidsinterval

  • breder

3.4 C-intervalschatting voor andere parameters

  • zie formularium

Gegeven een normaal verdeelde variabele met onbekende variantie. Als je gebruikmaakt van onderstaande gegevens, hoeveel bedraagt dan een 80% BI voor ?

  • gegeven
  • gevraagd
    • 80% BI voor
  • oplossing

4 Hypothesetoetsing

  • nulhypothes
  • alternatieve hypothese
    • eenzijdig ()
    • tweezijdig ()
  • soorten toetsen
    • Z-toets (dit hoofdstuk)
      • parameter:
      • bekend
      • drie manieren
        • via kritieke waarden
        • via p-waarde
        • via BI
    • t-toets (zie hoorcollege 6)
      • parameter:
      • onbekend
    • andere grootheden (zie hoorcollege 7)
    • toets voor goodness of fit (zie hoorcollege 10)

Na het tweede zitexamen berekent een docent de verschilscores tussen de behaalde score in januari (J) en de behaalde score in september (S). Hij wil nagaan of studenten in september gemiddeld hoger scoren dan in januari. Formuleer de achterliggende .

4.1 Tweezijdige toetsen via kritieke waarden

  • stap 1: bepaal en
  • stap 2: bepaal en significantieniveau
    • groter: sneller verwerpen
    • kleiner: sneller aanvaarden
  • stap 3: kies geschikte toetsstatistiek (TS) en bijhorende steekproevenverdeling onder
  • stap 4: bereken toetsstatistiekwaarde (ts) onder
  • stap 5: welke ts waarden zijn verdacht (doen vermoeden dat waar is)?
  • stap 6: bereken kritieke waarden
    • bepalen aanvaardings- en verwerpingsgebied
    • tweezijdige : en
    • beslissing
      • in aanvaardingsgebied: aanvaard op significantieniveau
      • in verwerpingsgebied: verwerp op significantieniveau
        • synoniem: kritiek gebied

Een onderzoeker beschikt over normaalverdeelde gegevens en wil de volgende hypothese toetsen met en : vs. . Om de hypothese te toetsen trekt de onderzoeker een steekproef van 64 personen; het steekproefgemiddelde in deze steekproef bedraagt 44. Welke beslissing neem je? Voer de hypothesetoets uit m.b.v. kritieke waarden.

  • gegeven
  • gevraagd
    • hypothesetoetsing m.b.v. kritieke waarden
  • oplossing
    • stap 1
      • (tweezijdig)
    • stap 2
    • stap 3
    • stap 4
    • stap 5
      • sterk verschillend van nul is verdacht, dus beide staarten
    • stap 6
      • valt buiten dit bereik (in verwerpingsgebied)
      • dus verwerp op significantieniveau

4.2 Tweezijdige toetsen via p-waarde

  • stap 1-5: idem
  • stap 6
    • p-waarde = overschrijdingskans: kans om - onder - een minstens even verdachte waarde te observeren
      • tweezijdige : tweemaal de kans op de kleinste staart
      • kleinste staart links:
      • kleinste staart rechts:
      • bij symmetrische verdelingen:
    • beslissing
      • als
        • behoorlijk verdacht om een waarde als tegen te komen als waar is
        • maar onze steekproef leverde wel die op
        • dus initiele assumptie () is waarschijnlijk fout
        • verwerp op significantieniveau
      • als
        • niet erg verdacht om een waarde als tegen te komen als waar is
        • aanvaard op significantieniveau
  • voordeel t.o.v. kritieke waarden
    • p-waarde is onafhankelijk van
    • gemakkelijker om test te herhalen voor verschillende waarden

Een onderzoeker beschikt over normaalverdeelde gegevens en wil de volgende hypothese toetsen met en : vs. . Om de hypothese te toetsen trekt de onderzoeker een steekproef van 64 personen; het steekproefgemiddelde in deze steekproef bedraagt 44. Welke beslissing neem je? Voer de hypothesetoets uit o.b.v. de p-waarde.

  • gegeven
  • gevraagd
    • hypothesetoetsing o.b.v. p-waarde
  • oplossing
    • stap 1
      • (tweezijdig)
    • stap 2
    • stap 3
    • stap 4
    • stap 5
      • sterk verschillend van nul is verdacht, dus beide staarten
    • stap 6
      • dus verwerp op significantieniveau

4.3 Tweezijdige toetsen via betrouwbaarheidsinterval (BI)

  • bereken BI voor
  • beslissing
    • : aanvaard
    • : verwerp
  • werkt enkel voor tweezijdige testen

Een onderzoeker beschikt over normaalverdeelde gegevens en wil de volgende hypothese toetsen met en : vs. . Om de hypothese te toetsen trekt de onderzoeker een steekproef van 64 personen; het steekproefgemiddelde in deze steekproef bedraagt 44. Welke beslissing neem je? Voer de hypothesetoets uit m.b.v. een betrouwbaarheidsinterval.

  • gegeven
  • gevraagd
    • hypothesetoetsing m.b.v. BI
  • oplossing
    • opstellen BI
    • beslissing
      • verwerp op significantieniveau

4.4 Eenzijdige toetsen

  • stap 5
    • welke staart verdacht?
        • rechterstaart
        • linkerstaart
  • stap 6
    • o.b.v. kritieke waarde
      • linkerstaart:
      • rechterstaart:
    • o.b.v. p-waarde
      • linkerstaart:
      • rechterstaart:
    • o.b.v. BI
      • (!) niet mogelijk

Een onderzoeker beschikt over normaalverdeelde gegevens en wil de volgende hypothese toetsen met en : vs. . Om de hypothese te toetsen trekt de onderzoeker een steekproef van 64 personen; het steekproefgemiddelde in deze steekproef bedraagt 44.

(a) Waaraan zijn en gelijk? Welke conclusie trekt de onderzoeker?

(b) Hoeveel bedraagt de p-waarde? Wat is de conclusie van de onderzoeker?

  • gegeven
  • (a) gevraagd
    • conclusie
  • (a) oplossing
    • verwerp op significantieniveau 0.01
  • (b) gevraagd
    • p-waarde
    • conclusie
  • (b) oplossing
    • verwerp

5 Power

  • soorten fouten
    • type 1 fout:
    • type 2 fout:
  • power = onderscheidingsvermogen (OV) =
  • stappenplan
    • (1) hypothesetoetsing uitgaande van
      • bepaal verwerpingsgebied
    • (2) bereken kans op verwerping uitgaande van waarheid

(1) Een onderzoeker wil de volgende hypothese toetsen, met : vs. . Om de hypothese te toetsen trekt de onderzoeker een steekproef van 64 personen uit een normaalverdeelde populatie met . Voor welke waarden van het steekproefgemiddelde zal de onderzoeker aanvaarden?

  • gegeven
  • gevraagd
    • aanvaardingsgebied
  • oplossing
    • o.b.v. kritieke waarden
      • alternatief: a.h.v. 95% BI voor
    • stap 1
      • (tweezijdig)
    • stap 2
    • stap 3
    • stap 4
    • stap 5
      • sterk verschillend van nul is verdacht, dus beide staarten
    • stap 6
    • aanvaardingsgebied

(2) Voortbouwend op de vorige even oefenen, hoeveel bedraagt het onderscheidingsvermogen als in werkelijkheid ?

  • vals
  • OV

5.1 Hoe power maximaliseren

  • grotere
    • wordt sneller verworpen
  • waarheid ligt verder weg van , in richting
  • kleinere
  • grotere

5.2 Power in praktijk

  • waarheid niet gekend tijdens experiment
  • kies i.f.v. gewenste power en effectgrootte

6 t-toetsen

6.1 Inferentie voor het gemiddelde

  • tot nu toe (z-toets): normaalmodel met gekende
  • nieuw (t-toets): normaalmodel met onbekende
    • gebruik schatter
    • verder exact zelfde aanpak voor BI en hypothesetoetsing
  • student t-verdeling
    • lijkt op standaardnormale verdeling
      • met iets dikkere staarten
    • : degrees of freedom = vrijheidsgraden

6.2 Vergelijken van twee verwachtingen

    • speciaal geval:
  • (of of )
6.2.1 Afhankelijke steekproeven
  • is een nodige maar geen voldoende voorwaarde voor gepaarde steekproeven
  • gebruik z-toets of t-toets voor
6.2.2 Onafhankelijke steekproeven
6.2.2.1 Beide varianties bekend
  • voorwaarden
    • en onafhankelijk
    • en beide normaal verdeeld
      • of benaderd normaal via centrale limietstelling ()
    • en bekend
  • onafhankelijk:
6.2.2.2 Beide varianties volledig onbekend
  • voorwaarden
    • en onafhankelijk
    • en beide normaal verdeeld
      • of benaderd normaal via centrale limietstelling ()
    • beide met onbekende variantie
  • Satterthwaite benadering
      • afronden naar beneden
6.2.2.3 Beide varianties onbekend maar gelijk (homoscedasticiteit)
  • voorwaarden
    • en onafhankelijk
    • en beide normaal verdeeld
      • of benaderd normaal via centrale limietstelling ()
    • beide met onbekende maar gelijke variantie:
  • pooled estimator

7 Inferentie met andere grootheden dan het gemiddelde

7.1 Inferentie voor één fractie

  • (of of )
  • (i.i.d.)
    • populatiefractie (parameter)
    • we hebben geen goede schatter voor deze parameter als
    • dus herhaal experiment keer
  • (als groot genoeg)
    • zie hoorcollege 2
  • (als voldoende groot)
    • gebruik steekproefproportie als schatter
      • TS = PROP
      • ts = prop
  • voorwaarden (herhaling)
    • en
  • keuze succes vs mislukking maakt niet uit
    • omwisselen geeft zelfde conclusie

Het stadsbestuur claimt dat 92% van de inwoners regelmatig het openbaar vervoer gebruikt om naar het werk te gaan. Een stedenbouwkundige denkt dat dit percentage in werkelijkheid lager ligt. Om dit te testen ondervraagt hij 200 mensen, 87% van hen geeft aan regelmatig het openbaar vervoer te gebruiken. Gegeven , test of de stedenbouwkundige gelijk heeft d.m.v. de -waarde.

  • gegeven
  • gevraagd
    • hypothesetoets d.m.v. -waarde
  • oplossing
    • check voorwaarden
    • stap 1
    • stap 2
    • stap 3
    • stap 4
    • stap 5
      • linkerstaart verdacht
    • stap 6
      • verwerp

Een vader heeft 8 zonen en 0 dochters. Hij wil de hypothese toetsen dat de kans op een meisje verschillend is van kans op jongen. Welke van onderstaande uitspraken is correct?

  • gegeven
  • gevraagd
    • -waarde
  • oplossing
    • check voorwaarden
      • -> niet voldaan onder
      • dus we mogen geen normale benadering gebruiken
      • dus gebruik exacte binomiale kans
7.1.1 Betrouwbaarheidsintervallen
  • voorwaarden (herhaling)
    • en
    • gebruik populatiecorrectiefactor indien nodig ()
  • gebruik als schatting voor
    • gevolg: BI niet meer equivalent met tweezijdige hypothesetoets
  • BI
  • foutenmarge vs
    • kies
      • zodat foutenmarge maximaal is
      • ongekend?
        • zoek in literatuur
        • of gebruik (geeft grootst mogelijke )

Een departement psychologie vermoedt dat onder hun studenten een significant percentage problematische angst ervaart. Het departement telt in totaal 5000 studenten. Om het percentage studenten dat met angst kampt te schatten, ondervraagt men 300 verschillende studenten. 120 onder hen rapporteren met angst te kampen. Geef een 95% betrouwbaarheidsinterval van de fractie psychologiestudenten aan dit departement die angstproblemen hebben.

  • gegeven
    • : fractie psychologiestudenten met angstproblemen
  • gevraagd
    • 95% BI
  • oplossing
    • check voorwaarden
      • en
        • OK (o.b.v. )
        • dus gebruik correctiefactor

Een onderzoeker wil het percentage leerlingen in het basisonderwijs schatten dat regelmatig gepest wordt op school. Hij wil dit doen aan de hand van een 99% BI voor de fractie gepeste leerlingen. Hoeveel leerlingen moet hij minstens betrekken in zijn onderzoek als de foutmarge hoogstens 1% mag bedragen?

Ga er hierbij van uit dat het percentage leerlingen dat gepest wordt in het basisonderwijs ongeveer gelijk is aan het percentage leerlingen dat gepest wordt in het secundair onderwijs (15%).

  • gegeven
    • : fractie gepeste leerlingen
  • gevraagd
    • minimale voor
  • oplossing
    • dus

7.2 Vergelijken van twee fracties

  • van twee onafhankelijke groepen: en
  • voorwaarden
    • ZTW of grote populatie ()
    • minstens 10 successen en 10 mislukkingen in beide steekproeven
  • (of of )
  • pooled estimate:
  • onder
  • BI:

Is er een significant verschil in alcoholmisbruik tussen mannen en vrouwen? Je neemt een steekproef met 7180 mannen en 9916 vrouwen, waarvan 1630 mannen en 1684 vrouwen te veel alcohol consumeren.

(a) Wat beslis je op basis van een 95% BI?

(b) En op basis van de p-waarde van een significantietoets ()?

  • gegeven
  • gevraagd (a)
    • 95% BI
  • oplossing (a)
    • conclusie
      • niet in interval
      • fracties significant verschillend
  • gevraagd (b)
    • o.b.v. p-waarde
  • oplossing (b)
    • check voorwaarden
      • ✅ grote populatie ()
      • ✅ minstens 10 successen en 10 mislukkingen in beide steekproeven
    • stap 1
    • stap 2
    • stap 3
      • onder
    • stap 4
    • stap 5
      • beide staarten verdacht
    • stap 6
      • verwerp

7.3 Inferentie voor populatiespreiding

  • o.b.v. chi kwadraat () verdeling
    • opgelet: asymmetrisch
  • ter herinnering:
  • voorwaarden
  • onder
  • BI:

Een fabriek produceert vijzen die een diameter van 5 mm horen te hebben. De maximaal toegelaten variantie in diameter is 0.01 mm². Om zeker te zijn dat er geen problemen zijn met het productieproces wordt er een kwaliteitscontrole gedaan: er wordt een steekproef van 20 vijzen getrokken. De variantie binnen deze steekproef blijkt gelijk te zijn aan 0.015mm². Is er een probleem in de fabriek?

  • gegeven
    • : diameter vijzen (in mm)
  • gevraagd
    • probleem in fabriek? moeten we verwerpen?
  • oplossing
    • check voorwaarden
      • extra assumptie:
    • stap 1
    • stap 2
    • stap 3
      • onder
    • stap 4
    • stap 5
      • rechterstaart verdacht
    • stap 6
      • dus niet verwerpen voor meest gangbare waarden van
      • dus geen probleem in fabriek

7.4 Vergelijken van twee populatiestandaarddeviaties (F-toets)

  • voorwaarden
    • onafhankelijk
    • opgelet: verdeling is asymmetrisch
      • belangrijk om met kleinste staart te werken voor -waarden
      • bepaal a.h.v. mediaan
        • onder mediaan: links kleiner
        • boven mediaan: rechts kleiner
  • wat als we teller en noemer omwisselen?
    • dan ook en omwisselen
    • beslissing blijft hetzelfde

Een onderzoeker wil nagaan of studenten pedagogie meer variëren in hoeveel geld ze uitgeven tijdens een avondje stappen in Leuven dan studenten logopedie. Hieronder zie je wat gegevens hierover.

Studierichting gemiddelde
Pedagogie (P) 51 8.6667 3.1535
Logopedie (L) 201 7.6235 2.1023

Hoeveel bedraagt ?

  • gegeven
    • gemiddeldes (niet belangrijk)
  • gevraagd
    • waarde
  • oplossing
    • stap 1
      • (eenzijdig)
    • stap 2
    • stap 3
    • stap 4
    • stap 5
      • rechterstaart verdacht
    • stap 6

8-9 Niet-parametrische statistiek

  • niet-parametrisch = verdelingsvrij
  • geschikt voor
    • kleine steekproeven
    • niet-numerieke data
    • scheve verdelingen of uitschieters

8 Werken met geobserveerde scores

8.1 Bootstrapmethode
  • trek originele steekproef uit populatie
  • trek herhaaldelijk met teruglegging bootstrapsteekproeven uit originele steekproef
    • allemaal even groot als originele steefproef
  • bereken verdeling van statistiek over deze bootstrapsteekproeven heen
  • geschikt voor
    • gemiddelde, regressiecoefficienten ()
  • minder geschikt voor
    • kleine
    • kwantielen (incl. mediaan)

Gegeven dat je volgende steekproef hebt geobserveerd: , om iets te zeggen over . Welk van volgende steekproeven is dan een geldige bootstrapsteekproef?

  • (A) 4, 8, 1, 7
  • (B) 3, 1, 4, 8, 7
  • (C) 7, 8, 8, 1, 4, 5
  • (D) 7, 1, 1, 4, 5
  • (A) ongeldig,
  • (B) ongeldig, komt niet uit originele steefproef
  • (C) ongeldig,
  • (D) geldig

Hoe ga je concreet te werk als je twee onafhankelijke steekproeven hebt en je iets wil besluiten over het verschil in populatiegemiddelde tussen de twee corresponderende groepen?

  • (A) ik doe alle scores in 1 bak, trek ZTL evenveel scores en steek ze random in groep 1 en groep 2
  • (B) Ik doe alle scores in 1 bak, trek MTL evenveel scores en steek ze random in groep 1 en groep 2
  • (C) Ik doe de scores van groep 1 in een bak en de scores van groep 2 in een tweede bak. Voor groep 1 trek ik ZTL evenveel scores uit bak 1 en voor groep 2 trek ik ZTL evenveel scores uit bak 2
  • (D) Ik doe de scores van groep 1 in een bak en de scores van groep 2 in een tweede bak. Voor groep 1 trek ik MTL evenveel scores uit bak 1 en voor groep 2 trek ik MTL evenveel scores uit bak 2.
  • (D)
8.2 Permutatietoets
8.2.1 Onafhankelijke groepen
  • groep en groep
  • TS:
  • ts:
    • als waar is, maakt het niet uit in welke groep een observatie zit
    • bereken alle mogelijke permutatiesteekproeven
      • aantal =
    • bereken -waarde o.b.v. deze geschatte steekproevenverdeling van
      • eenzijdige alternatieve hypothese: oppervlakte verdachte staart
      • tweezijdige alternatieve hypothese: tweemaal oppervlakte kleinste staart

Wat als we een extra proefpersoon toevoegen aan controleconditie: de controleconditie (C) bevat dan 5 personen, de behandelingsconditie (B) 4. Hoeveel permutaties zijn er mogelijk?

Toets de hypothese . Hoeveel bedraagt de -waarde?

Controle Behandeling
1 10
7 9
3 5
0 8
2
    • incl. originele steekproef
    • slechts 1 andere permutatiesteekproef met groter verschil:
Controle Behandeling
1 10
5 9
3 7
0 8
2
8.2.2 Afhankelijke groepen
  • en
    • als waar is, kunnen resultaten per observatie omgewisseld worden
      • dus het verschil verandert van teken want
    • bereken alle mogelijke permutatiesteekproevenn
      • aantal =
    • bereken gemiddelde verschilscore voor elke permutatiesteekproef
    • bereken -waarde o.b.v. deze geschatte steekproevenverdeling van
      • eenzijdige alternatieve hypothese: oppervlakte verdachte staart
      • tweezijdige alternatieve hypothese: tweemaal oppervlakte kleinste staart

We willen toetsen of tweelingen significant verschillen in lichaamslengte (). Hoeveel bedraagt de tweezijdige -waarde, gegeven onderstaande data van 8-jarige tweelingen?

Tweeling Lengte oudste kind (cm) Lengte jongste kind (cm) Verschil
1 145 138 +7
2 140 136 +4
3 144 147 −3
4 144 139 +5
5 142 143 −1
6 147 141 +6
  • gevraagd
    • tweezijdige -waarde
  • oplossing
    • aantal permutaties:
    • tweezijdige -waarde, dus teller moet een even getal zijn
      • schrap antwoorden (B) en (C)
      • dus oudste kind is gemiddeld groter
      • dus rechterstaart is de kleinste
    • zoek permutaties waarbij oudste kind gemiddeld 3cm of meer groter is
      • antwoord (A) kan enkel als de gegeven tabel al het meeste extreme verschil geeft -> schrappen
      • antwoord (D) moet correct zijn
Tweeling Verschil
1 +7
2 +4
3 -3
4 +5
5 −1
6 +6
18/6
Tweeling Verschil
1 +7
2 +4
3 +3
4 +5
5 −1
6 +6
24/6
Tweeling Verschil
1 +7
2 +4
3 -3
4 +5
5 -1
6 +6
20/6
Tweeling Verschil
1 +7
2 +4
3 +3
4 +5
5 -1
6 +6
26/6
Tweeling Verschil
1 +7
2 -4
3 +3
4 +5
5 -1
6 +6
18/6

9 Werken met kenmerk van de scores

9.1 Onafhankelijke groepen
9.1.1 Wilcoxon rangsomtoets
  • groep en groep
  • maak tabel met kolommen , rang, groep, gesorteerd op oplopend
    • knopen = ties
      • neem gemiddelde van rangen
  • : som van rangen uit groep
    • kan ook a.h.v.
  • benaderende methode
    • voorwaarden
    • onder
      • denk aan continuiteitscorrectie
  • exacte methode
    • = permutatietoets op rangnummers i.p.v. op waarden
    • want onder zijn rangnummers inwisselbaar over groepen
    • aantal permutaties:

Gegeven onderstaande data, hoeveel bedraagt ?

  • Controle (C): 1, 6, 5, 3
  • Behandeling (B): 7, 4, 9, 10
rang groep
1 1 C
3 2 C
4 3 B
5 4 C
6 5 C
7 6 B
9 7 B
10 8 B

Hoeveel bedragen de exacte en benaderende -waarden bij een tweezijdige toets?

  • benaderend
    • merk op: voorwaarden geschonden ()
      • , dus rechterstaart verdacht
      • (continuiteitscorrectie)
  • exact (permutatietoets op rangen)
    • combinaties van rangen
      • 8 + 7 + 6 + 5 = 26
      • 8 + 7 + 6 + 4 = 25
      • 8 + 7 + 6 + 3 = 24
      • 8 + 7 + 5 + 4 = 24
9.2 Afhankelijke groepen
9.2.1 Wilcoxon rangtekentoets
  • bereken verschilscores
  • schrap koppels met
  • sorteer volgens oplopend
    • knopen = ties
      • neem gemiddelde van rangen
  • bereken rang en signed rang
  • som van rangnummers van positieve verschilscores ()
  • som van rangnummers van negatieve verschilscores ()
  • : verschilscores symmetrisch verdeeld rond nul (mediaan is nul)
  • benaderende methode
    • voorwaarden
      • niet te klein
    • onder
      • denk aan continuiteitscorrectie
  • exacte methode
    • = permutatietoets op rangnummers i.p.v. op waarden
    • want onder zijn rangnummers inwisselbaar binnen koppels
    • aantal permutaties: (na schrappen van koppels met gelijke scores)

Hoeveel bedraagt bij de rangtekentoets om na te gaan of tweelingen significant verschillen in lichaamslengte ()?

Tweeling Lengte oudste kind (cm) Lengte jongste kind (cm) Verschil Rang Signed rank
1 142 138
2 140 136
3 144 147
4 144 139
5 142 143
6 146 141
7 149 143
8 150 145
9 142 136
10 148 146
Tweeling Lengte oudste kind (cm) Lengte jongste kind (cm) Verschil Rang Signed rank
5 142 143 -1 1 -1
10 148 146 2 2 +2
3 144 147 -3 3 -3
1 142 138 4 4.5 +4.5
2 140 136 4 4.5 +4.5
4 144 139 5 7 +7
6 146 141 5 7 +7
8 150 145 5 7 +7
7 149 143 6 9.5 +9.5
9 142 136 6 9.5 +9.5
9.2.2 Gepaarde tekentoets
  • kijk enkel naar teken van verschil en niet naar grootte
  • voordelen
    • robuuster tegen uitbijters
    • ook geschikt voor kwalitatieve data
  • schrap koppels met
  • : geen effect, dus
  • : aantal positieve verschilscores
  • onder

Hoeveel bedraagt de -waarde bij de tekentoets om na te gaan of tweelingen significant verschillen in lichaamslengte?

Tweeling Lengte oudste kind (cm) Lengte jongste kind (cm) Verschil
1 142 138
2 140 136
3 144 147
4 144 139
5 142 143
6 146 141
7 149 143
8 150 145
9 142 136
10 148 146
Tweeling Lengte oudste kind (cm) Lengte jongste kind (cm) Verschil
1 142 138 +
2 140 136 +
3 144 147 -
4 144 139 +
5 142 143 -
6 146 141 +
7 149 143 +
8 150 145 +
9 142 136 +
10 148 146 +
  • tweezijdig
    • , dus rechterstaart verdacht

10 Goodness of fit

  • : vooropgesteld model is houdbaar
  • : vooropgesteld model is onhoudbaar
  • m.b.v. verdeling
    • i.i.d.

10.1 Twee onafhankelijke Bernouilli variabelen

  • : aantal categorieen
    • hier:
  • per categorie
    • observed waarde
    • expected waarde
  • onder
    • : aantal geschatte parameters uit geobserveerde gegevens
      • hier:
    • model onhoudbaar?
      • dan grotere verschillen tussen en
      • dus grotere
      • dus steeds rechterstaart verdacht
  • voorwaarden
    • in theorie: oneindig groot
    • in praktijk:
      • anders categorieen samenvoegen
  • toepassing: test onafhankelijkheid
    • expected
  • equivalent aan z-toets voor twee populatiefracties
    • met
    • enkel voor tabellen
  • : opleidingsgraad moeder
  • : kinderen naar methodeschool
Methodeschool Geen hoger onderwijs Hoger onderwijs Totaal
nee (0) 1243 1089 2332
ja (1) 51 205 256
Totaal 1294 1294 2588

Is er een verband tussen de opleidingsgraad van de moeder en of haar kinderen al dan niet naar een methodeschool gaan?

  • gegeven
  • gevraagd
    • afhankelijk?
  • oplossing
    • tabel voor opstellen
    • of
Methodeschool Geen hoger onderwijs Hoger onderwijs Totaal
nee 2332
ja 256
Totaal 1294 1294 2588
  • oplossing (vervolg)
    • check voorwaarden
    • stap 1
      • X, Y$ onafhankelijk
      • X, Y$ afhankelijk
    • stap 2
    • stap 3
    • stap 4
    • stap 5
      • rechterstaart verdacht
    • stap 6
      • conclusie
        • verwerp
        • dus afhankelijk

Bepaal de 𝑧-waarde voor een toetsing van het verschil tussen de fracties kinderen die niet naar een methodeschool gaan conditioneel op het opleidingsniveau van de moeder.

  • gegeven
    • groep A: moeder geen hoger onderwijs ()
    • groep B: moeder wel hoger onderwijs ()
  • gevraagd
    • z-waarde voor toetsing verschil fracties
  • oplossing
    • check voorwaarden
      • ✅ grote populatie ()
      • ✅ minstens 10 successen en 10 mislukkingen in beide steekproeven
    • stap 1
    • stap 2
    • stap 3
      • pooled estimate:
        • onder
    • stap 4
      • ✅ dubbelcheck

10.2 Twee onafhankelijke kwalitatieve variabelen

  • met verschillende waarden
  • met verschillende waarden
  • zelfde principe als in 10.1
    • onder

Er zijn 2 basisscholen die leerlingen leveren aan een secundaire school. Men gaat na in welke stroom (ASO, BSO, TSO, KSO) deze leerlingen terechtkomen. Hieronder vind je een kruistabel met de gegevens van 78 leerlingen. Hoeveel studenten zou je verwachten in het BSO bij basisschool A als er statistische onafhankelijkheid zou zijn tussen school en stroom?

School ASO BSO TSO KSO Totaal
Basisschool A 7 8 13 5 33
Basisschool B 17 12 11 5 45
Totaal 24 20 24 10 78
  • gegeven
    • : basisschool
    • : stroom
  • gevraagd
    • indien onafhankelijk
  • oplossing

Bereken de toetsstatistiekwaarde om na te gaan of er een samenhang is tussen basisschool en stroom.

School ASO BSO TSO KSO Totaal
Basisschool A 10.1538 8.4615 10.1538 4.2308 33
Basisschool B 13.8462 11.5385 13.8462 5.7692 45
Totaal 24 20 24 10 78
  • gevraagd
  • oplossing
    • onder
    • (ZRM)

Wat is de kritieke waarde voor een −toets om de samenhang tussen variabele met 3 niveaus en variabele met 4 niveaus na te gaan zonder verdere modelveronderstellingen ()?

  • gegeven
  • gevraagd
    • kritieke waarde
  • oplossing
    • eenzijdige alternatieve hypothese (rechterstaart verdacht)
      • dus we moeten niet meer door twee delen

10.3 Algemeen model

  • waardebereik opdelen in niet-overlappende en niet-lege categorieen

Een psycholoog onderzoekt de reactietijden van proefpersonen bij het oplossen van een eenvoudige taak. Volgens eerder onderzoek zouden de reactietijden normaal verdeeld moeten zijn met een gemiddelde van 500 ms en een standaardafwijking van 100 ms. De psycholoog meet de reactietijden van 120 personen (samengevat in onderstaande tabel). Toets of het model de geobserveerde gegevens fit.

Reactietijden
25
50
35
10
  • gegeven
    • : reactietijd (ms)
  • gevraagd
    • ?
  • oplossing
    • (symmetrie)
    • (symmetrie)
Reactietijden
  • oplossing (vervolg)
    • check voorwaarden
    • stap 1
    • stap 2
    • stap 3
      • onder
        • ( en zijn gegeven en werden niet geschat uit de observaties)
    • stap 4
    • stap 5
      • rechterstaart verdacht
    • stap 6
      • conclusie
        • hangt af van
        • verwerp voor
        • dus niet normaal verdeeld