Dissectie van formules

Biologie

Een bioloog die een muis bestudeert, kan er eens oppervlakkig naar kijken en dan direct zijn conclusies trekken.

  • vier poten met elk 5 vingers
  • staart
  • zoogdier
  • vacht
  • knaagdier, grote snijtanden
  • twee ogen, lateraal
  • twee oren, grote oorschelpen
  • snorharen

Dat is een goede eerste stap maar er valt nog veel meer te leren over muizen, bijvoorbeeld hoe hun lichaam intern werkt. Onze bioloog gaat dan wel zijn handen moeten vuilmaken door een dissectie uit te voeren.

Statistiek

Bij wiskunde en statistiek gebeurt er vaak iets gelijkaardig, maar dan met formules in plaats van met muizen. Een student ziet een formule, probeert die hopelijk minstens oppervlakkig te begrijpen in plaats van die van buiten te leren, en gaat dan snel verder naar de volgende formule in de cursus.

Hoe moeten we ons dat praktisch voorstellen? Neem een formule die iedereen kent:

Wat zijn onze voorlopige conclusies?

  • is het (steekproef)gemiddelde
  • berekening: tel eerst alle -waarden bij elkaar op, en deel dan door

Mystery solved. Of toch niet helemaal? Hoe kunnen we deze formule net als onze muis binnenstebuiten keren om er alles over te leren?

We kunnen beginnen met de vaststelling dat de formule drie componenten heeft.

In de originele vorm berekenen we (1) uit (2) en (3), maar andere combinaties zijn ook mogelijk. Stel dat we (3) willen berekenen uit (1) en (2).

Dit doet je misschien denken aan de formule , maar die heeft er niets rechtstreeks mee te maken aangezien geen constante is binnen de som. Je kan de formule hier wel andersom toepassen met . Dan krijgen we

Hier leren we plots iets heel anders uit. Als je keer het gemiddelde neemt, kom je uit op de som van alle -waarden. Stel dat we als -waarden gevonden hebben met als som . Dan is het gemiddelde want . Grafisch voorgesteld:

+--+-----+----+-+
| 2|  5  |  4 |1|
+--++---++--+-+-+
| 3 | 3 | 3 | 3 |
+---+---+---+---+

Je kan je afvragen of de omgekeerde redenering met de rol van en omgewisseld ook zinvol is. Vanwege commutativiteit zal je inderdaad altijd op het juiste getal uitkomen, maar hier zit niet echt een intuitieve logica achter. Als een decimaal getal is, loopt het trouwens helemaal in het honderd want dan is het geen zinvolle index meer voor het sommatieteken. Dit is duidelijk geen goede manier om er naar te kijken, maar het was zeker een poging waard. Niet elke dissectie hoeft een succes te zijn.

Als laatste kunnen we ook (2) berekenen uit (1) en (3).

Toegepast op ons voorbeeld: als de som is, en het gemiddelde , kunnen we afleiden dat .

Deze formules staan niet expliciet in de cursus, maar blijken vaak best belangrijk te zijn. Ga dus niet te snel over eender welke formule, maar probeer de vergelijking altijd vanuit meerdere perspectieven te bekijken. Voor mensen met een wiskundeknobbel is dit vanzelfsprekend. De prof gaat hier meestal dan ook niet dieper op in, maar dat maakt het niet minder belangrijk.

Nog een inzicht: eens je het gemiddelde kent, kan je de andere getallen ook voorstellen als afwijking ten opzichte daarvan. Voor krijgen we dan of ook . Als we van deze nieuwe getallen het gemiddelde berekenen moeten we altijd op uitkomen aangezien . (Dit is ook de reden waarom .) In ons geval is inderdaad . De laatste deling door is zelfs overbodig. Als de teller gelijk is aan weet je genoeg. Deze techniek is vooral nuttig als je voor een kleine dataset het gemiddelde "op het zicht" wil gokken en daarna snel wil checken of dat getal ook echt het gemiddelde is. Voor zou je kunnen gokken dat het gemiddelde is. Aangezien was dat inderdaad een goede gok.

Een andere belangrijke wiskundige vaardigheid is het vinden van verbanden tussen verschillende formules. Vaak moet je het niet al te ver zoeken. Voor het steekproefgemiddelde hebben we bijvoorbeeld drie verschillende formules die voor een gegeven steekproef altijd dezelfde uitkomst geven.

Kan jij in eigen woorden uitleggen waarom dat zo is?

To be continued...