Kansbomen

Examenvragen over kansrekenen kunnen best pittig zijn. Als je op goed geluk formules begint toe te passen, weet je halverwege vaak niet meer waar je zit en hoe je verder moet. De vraag hieronder is op examenniveau. Zonder hulpmiddelen is het best moeilijk om die op te lossen. Met de juiste visualisatie (bijvoorbeeld een kansboom) valt het nochtans goed mee.

Oefening

Stel dat de kans 40% bedraagt dat iemand met gescheiden ouders een onveilig hechtingstype heeft. De kans dat iemand met een onveilig hechtingstype gescheiden ouders heeft, is 30%. De kans op onveilige hechting is 15%. Wat is de kans dat iemand die geen gescheiden ouders heeft veilig gehecht is?

(De cijfers zijn niet erg realistisch gekozen, maar het is zoals gewoonlijk vooral de techniek die telt.)

Gegeven

  • : veilig hechtingstype
  • : gescheiden ouders

Gevraagd

Oplossing

Een kansboom bestaat uit knooppunten en takken. De relaties tussen knooppunten drukken we soms uit alsof het om een familiestamboom zou gaan (ouder, kind, ...). Knooppunten met een voorwaardelijke kans hebben een stippellijn. We vertrekken uit een speciaal knooppunt genaamd de stam . is immers de zekere gebeurtenis en dus het ideaal startpunt. Vaak wordt deze formule niet expliciet vermeld, maar hier schrijven we het er voor de volledigheid toch bij. Uit de stam kunnen we nu een afsplitsing maken tussen ofwel veilige-onveilige hechting ofwel al-dan-niet gescheiden ouders. We kiezen voor het eerste omdat we daar de meeste gegevens over hebben. Pas op het tweede niveau maken we in elk van de knooppunten een nieuwe opsplitsing naar soort ouders. In deze kansboom kunnen we direct twee gegevens invullen en een aantal extra kansen berekenen.

kansboom-1

Een kansboom visualiseert mooi de formule van voorwaardelijke kans: . Om de onvoorwaardelijke kans van een dieper gelegen knooppunt te berekenen, vermenigvuldig je gewoon de kansen van alle bovenliggende knooppunten (de voorouders). Concreet:

De som van een kans en zijn complement is altijd gelijk aan , dus we kunnen ook direct berekenen dat . Achteraf zal blijken dat we die waarde niet echt nodig hadden, maar dat kan je op dit moment moeilijk voorspellen. Vul dus zeker direct alle waarden aan die je op het zicht kan berekenen.

Voorwaardelijke kansen hebben een gelijkaardige regel: . Dat helpt ons weer een stap verder in de kansboom:

Daarmee kunnen we de laatste tak in de linkerhelft van de boom uitrekenen:

De som van de twee onderste knooppunten zou opnieuw de kans op hun gemeenschappelijke bovenliggend knooppunt moeten zijn, m.a.w.

Dat lijkt goed te zitten. We hadden ons dus de moeite kunnen besparen om te berekenen, maar dit soort dubbelchecks zijn anderzijds wel heel nuttig om rekenfoutjes op te sporen.

Over de rechterhelft van de kansboom hebben we geen informatie, dus nu zitten we vast. Bij eenvoudigere oefeningen heb je hier typisch meer gegevens over. Dan kan je in deze ene boom blijven verder rekenen. Voor moeilijkere oefeningen zoals deze moeten we er een tweede kansboom bijhalen. Deze keer splitsen we eerst in gescheiden-niet gescheiden ouders en in twee instantie pas in veilig-onveilig gehecht.

kansboom-1kansboom-2

De voorwaardelijke kansen in deze tweede boom staan nu in omgekeerde volgorde van die in de eerste boom: i.p.v. . Die zou je met Bayes kunnen berekenen, maar zo moeilijk moet je het zelfs niet maken. Aangezien kan je een deel van de kansen uit de eerste boom letterlijk overnemen in de tweede. In de onderste tekening staan de middelste takken gekruist om de volgorde te laten overeenkomen met die van de eerste boom. Verder vullen we het laatste gegeven in en ook het complement daarvan.

Nu moeten we de formule voor voorwaardelijke kans andersom toepassen om te berekenen:

Daar krijgen we gratis het complement bij:

Nu kunnen we de formule voor voorwaardelijke kans weer in originele vorm toepassen:

Op dit punt is het weer nuttig om kort een dubbelcheck te doen:

Aangezien we nu drie van de vier doorsnedes kennen, en hun som uiteraard gelijk moet zijn aan , kunnen we de vierde berekenen:

Tot slot kunnen we de kans op de tussenliggende tak berekenen:

Daarmee hebben we het gevraagde gevonden. Wie wil kan de resterende kansen in de twee kansbomen nog verder uitrekenen. Elke tak zou berekenbaar moeten zijn op basis van de gegevens.

Recap

In de eerste plaats zijn kansbomen dus een manier om de regel rond voorwaardelijke kansen overzichtelijker te maken. Afhankelijk van wat er al bekend is en wat je nog moet berekenen ga je de formule wat moeten herschrijven.

Verder zijn er de rekenregels rond kansen die je goed in de vingers moet hebben. Zo wordt de (onvoorwaardelijke) kans in een bepaald knooppunt altijd verdeeld onder de vertakkingen. Als je de kansen van al die kinderen terug optelt, moet je dus opnieuw bij de kans van die ouder uitkomen. Dit werkt trouwens niet alleen met kinderen, maar ook met kleinkinderen. In een boom van twee niveaus diep heb je bijvoorbeeld vier kleinkinderen die samen evenveel kans hebben als de stam ( dus). In symbolen:

Uit de algemene formule voor onvoorwaardelijke kansen kan je ook de formule voor voorwaardelijke kansen afleiden:

De som van de voorwaardelijke kansen van alle mogelijke gebeurtenissen binnen voorwaarde is dus niet de kans op zelf, maar gewoon . Concreet:

Uitbreidingen

In bovenstaande oefening hebben we steeds met twee opsplitsingen gewerkt: een kans en zijn complement. Zo krijg je een binaire kansboom. Afhankelijk van de oefening kan het nuttig zijn om met meer vertakkingen te werken. Als je bijvoorbeeld verschillende kansen wil berekenen naargelang een waarde stijgt, daalt of gelijk blijft, heb je op die plaats drie vertakkingen nodig. Op andere plaatsen in de kansboom mag je een ander aantal vertakkingen gebruiken, het moet niet overal evenveel zijn. In wiskundige termen is het enkel belangrijk dat elke opsplitsing van een knooppunt een partitie vormt. De unie van alle kinderknopen moet dus gelijk zijn aan de ouderknoop, en er mag geen overlap zijn tussen de kinderen. Een opdeling in leeftijd en mag dus niet, want dan zitten achttienjarigen in beide vertakkingen.

De diepte van de boom bleef hierboven ook beperkt tot twee niveaus. In theorie kan je een kansboom zo diep maken als nodig, al zal je dat in de praktijk niet vaak nodig hebben. De basisprincipes blijven alleszins overeind. Voor drie niveaus geldt bijvoorbeeld:

En Bayes dan?

We hebben in heel deze oefening geen enkele keer Bayes gebruikt. Als het er in een oefening dik op ligt dat je een kans van de vorm moet berekenen op basis van een gegeven kans , kan je natuurlijk perfect de regel van Bayes toepassen. Toch is het voor veel studenten moeilijk om een goede intuitie te ontwikkelen over wat die regel nu eigenlijk echt betekent. In dat geval is het beter om het bij de simpele en begrijpbare formule van voorwaardelijke kans te houden. Daar kan je evenveel mee, maar je gaat waarschijnlijk een paar extra tussenstappen nodig hebben. In bovenstaande oefening hadden we uit de gegevens rechtstreeks kunnen berekenen aan de hand van de regel van Bayes. Toch zijn we zonder die regel ook tot het juiste resultaat gekomen.

Andere visualisaties

Naast kansbomen zijn Venn diagrammen en kruistabellen ook handige hulpmiddelen bij vragen over kansrekenen. Er bestaat geen perfect hulpmiddel dat in alle gevallen werkt, dus je zal moeten experimenteren om het juiste te vinden. Hoe dan ook zijn al deze manieren beter dan blindelings formules toe te passen.

Tot slot nog een vraag voor jullie: hoe kan je aan een kansboom zien dat twee gebeurtenissen onafhankelijk van elkaar zijn?