Optimale voorspelling - coefficienten

Bij optimale lineaire voorspelling hebben we een statistisch model van de vorm met volgende waarden voor de coefficienten:

Deze formules kunnen worden afgeleid uit door de Z-transformaties uit te schrijven en de vergelijking vervolgens uit te werken naar . In dit artikel wil ik niet zozeer focussen op de algebraische uitwerking, maar wel op het intuitief begrip van deze formules. Zorg dat je eerstegraadsfuncties (leerstof derde middelbaar) goed onder de knie hebt voor je verder leest.

Intercept

De eerste formule is de gemakkelijkste. Ze gaat er van uit dat je al kent, en op zoekt bent naar de gepaste . Wat bedoelen we hier met gepast? Het valt op dat deze formule sterk lijkt op de formule van ons model. Herschrijven geeft . De gepaste is dus diegene die ervoor zorgt dat, indien onze predictor gelijk is aan , ons criterium gelijk is aan .

Beeld je in dat je de waarde van met een draaiknop kan regelen. Dan zal je merken dat onze rechte, door heen en weer aan die knop te draaien, enkel naar boven of naar onder schuift. De rico ligt al vast op , dus kantelen kan niet meer. De gepaste waarde voor is dan diegene waardoor de rechte precies door punt gaat.

Zie ook https://www.desmos.com/calculator/axxshcb5mh.

Als we in plaats van met de originele en werken met en , hebben we . Dan gaat de rechte volgens onze redenering hierboven door . Dat klopt helemaal met de fundamentele formule waarvan we met optimale lineaire voorspelling vertrokken zijn: . Die formule is van de vorm en gaat ook gegarandeerd door . Enkel rechten van de vorm met gaan niet door .

Richtingscoefficient

Ik schrijf de formule liever als . Dat is niet bepaald korter, maar toont wel beter welke stappen er achtereenvolgens gezet worden. Deze wordt uiteindelijk vermenigvuldigd met (en bij geteld) om te berekenen, dus we moeten het vanuit dat perspectief bekijken. De drie stappen zijn dan de haakjes in volgende formule van binnen naar buiten uitwerken: .

De eerste stap is de (gedeeltelijke) standaardisatiestap door vermenigvuldiging van met . Vergelijk het met een Z-transformatie: de standaardafwijking wordt teruggebracht van tot maar van het gemiddelde trekken we ons voorlopig niets aan. (Dat deel van de standaardisatie zit in .) Zo zetten we intuitief de stap van de -wereld naar de wereld.

Eens we gestandaardiseerd hebben, kunnen we de vertaalslag maken van de -wereld naar de -wereld. Dat doen we door te vermenigvuldigen met . Reminder: .

Tot slot de-standaardiseren we door te vermenigvuldigen met en dus de standaardafwijking te veranderen van naar . Opnieuw trekken we ons van nog niets aan. Zo belanden we van de -wereld in de -wereld. Zo zijn we in drie stappen van de -wereld in de -wereld geraakt.

Je kan beschouwen als de correctiefactor die we achteraf nog nodig hebben omdat we in de stappen hierboven en niet in rekening gebracht hebben.

Als je deze logica kan volgen, moet je nooit meer twijfelen of het nu of was. Je vertrekt van in de -wereld, dus het zou niet erg logisch zijn om daar direct op los te laten. Dat heeft alleen zin in de -wereld.