Statistische maten voor lineaire transformaties

Lineaire transformaties: wie zijn ze? Wat doen ze? Wat drijft hen?

Stel je hebt een variabele . Dan kan je een nieuwe variabele berekenen aan de hand van een lineaire transformatiefunctie door die functie op elke waarde van toe te passen. Notatie: .

Voorbeeld:

  • gegeven
    • : zie tabel
  • gevraagd
  • oplossing

De normale manier ()

Op basis van deze gegevens kunnen we de tabel uitbreiden met . Eens je alle waarden van berekend hebt, kan je er verdere analyses op doen. Zo kan je verschillende statistische maten van (gemiddelde, variantie, ...) berekenen. Je hebt daarvoor geen speciale formules van lineaire transformaties nodig. Je kan gewoon dezelfde formules gebruiken als diegene die je zou gebruiken om te analyseren.

  • oplossing (vervolg)

De shortcut ()

Wat hierboven opvalt is dat net die -waarde is die bij de -waarde hoort, en dat . Met andere woorden: . Dat is geen toeval:

Meer algemeen geldt dus: . Dit inzicht kunnen we gebruiken als shortcut. In plaats van eerst de tabel uit te breiden met alle waardes van - wat voor grotere steekproeven toch wat werk vraagt - kunnen we direct uit berekenen. De formules voor lineaire transformaties openen dus geen nieuwe deuren, ze stellen ons enkel in staat om bepaalde berekeningen efficienter te doen.

We nemen opnieuw hetzelfde voorbeeld:

  • gegeven
    • : zie tabel
  • gevraagd
  • oplossing

We komen dus inderdaad dezelfde uitkomst uit, maar op een veel kortere manier.

Overzicht formules

We hebben de shortcut voor lineaire transformaties nu aangetoond voor gemiddeldes, maar er zijn ook shortcuts voor een hele hoop andere statistische maten. Probeer elk van onderstaande maten eens te berekenen op het voorbeeld hierboven met en zonder shortcut. Je zal snel merken dat je op de tweede manier veel tijd bespaart. Door dit op beide manieren uit te testen ga je ook beter begrijpen waarom onderstaande formules wel of niet werken.

  • centrale tendensmaten
    • gemiddelde
    • mediaan
    • modus
  • spreidingsmaten
    • komt enkel voor als absolute waarde of kwadraat zodat ook bij de spreiding positief blijft
    • geeft geen effect want verschuivingen beinvloeden de spreiding niet
    • variantie
    • standaarddeviatie
    • bereik
    • interkwartielbereik
  • associatiematen
    • heeft opnieuw geen effect
    • de transformatie mag ook in de tweede variabele zitten aangezien en
    • covariantie
      • mag negatief zijn, dus heeft geen absolute waarde of kwadraat nodig
      • merk op dat
    • correlatie
      • moet in interval blijven liggen, dus we kunnen niet zomaar met vermenigvuldigen
        • enkel het teken van heeft nog een effect
      • als
      • als
      • als
      • als

Voor de tegenhangers uit inductieve statistiek () gelden dezelfde regels.

Conclusie

Voor lineaire transformaties is het meestal een goed idee om de shortcuts te gebruiken om statistische maten te berekenen. Onthoud wel dat deze shortcuts enkel gelden voor lineaire transformaties. Niet-lineaire transformaties zoals hebben geen kortere formules. Daarbij moet je dus de normale manier blijven gebruiken.