Notatie: kleine en grote letters

De prof hecht enorm veel belang aan de juiste notatiewijze op het examen. Symbolen uit inductieve statistiek (Griekse letters) gebruiken in de context van beschrijvende statistiek of omgekeerd leidt direct tot puntenverlies. Maar zelfs binnen deze twee luiken moet je goed oppassen. Voor standaarddeviaties en (co)varianties moet je o.a. volgende symbolen goed uit elkaar kunnen houden:

  • : standaardafwijking
  • : variantie (als statistische spreidingsmaat van een steekproef)
  • : variantie (met in noemer)
  • : standaardafwijking als toevalsvariabele
  • : foutenvariantie bij voorspelling van o.b.v.
  • : standaardafwijking van maal
  • : covariantie tussen en
  • : covariantie tussen ( maal ) en

In deze blogpost ligt de focus op het verschil tussen kleine en grote letters zoals en of en .

De notatiewijze met grote letters kom je pas helemaal op het einde van statistiek 1 tegen, wanneer de link gelegd wordt tussen steekproef en populatie. In de vervolgvakken zoals statistiek 2 ga je deze notatie veel vaker tegenkomen. Bij twijfel op het examen statistiek 1 gok je dus best op de kleine variant. Wie liever niet gokt moet nog even verder lezen.

Ter herinnering: een statistische maat is een berekening die je toepast op een steekproef waarbij je als uitkomst één getal krijgt. Het gemiddelde is een statistische (centrum)maat, maar je kan ook zelf maten verzinnen. is bijvoorbeeld een (weinig zinvolle) maat.

Statistische maten uit inductieve statistiek hebben geen tegenhanger met een grote letter: (hoofdletter ) ga je niet tegenkomen als maat; enkel als sommatieteken. Maten uit beschrijvende statistiek hebben wel soms een tegenhanger met een hoofdletter. In dat geval spreken we niet meer van een statistische maat maar van een statistiek. In plaats van observaties uit een steekproef te combineren tot één getal, rekenen we bij statistieken met hele steekproeven . Het klassieke voorbeeld is . Aangezien elke statistiek een toevalsvariabele is, heeft die een eigen verdelingsfunctie, een gemiddelde, een minimum en een maximum. Aangezien we elke toevalsvariabele met een hoofdletter schrijven, doen we dat ook voor statistieken.

Goed om weten: een statistiek noemen we een schatter als de verwachte waarde ervan een goede schatting oplevert voor de onderliggende populatieparameter. Zo is een schatter voor aangezien en een schatter voor .

Conclusie: heeft het ding één specifieke waarde, dan is het een statistische maat en moet je het met een kleine letter schrijven. Heeft het ding zelf een verdeling, een gemiddelde e.d., dan schrijf je het met een grote letter.

Merk daarnaast op dat bij beschrijvende statistiek de subscripts van statistische maten altijd in kleine letters voorkomen: . In het inductieve luik daarentegen hebben de statistische maten altijd grote subscripts: .

Bij andere symbolen waar de toevalsvariabele in subscript staat behouden we wel over heel de lijn hoofdletters: .