Bayes se stelling

in Wikipedia, die vrye ensiklopedie
Spring na: navigasie, soek

Bayes se stelling (ook Bayes se reël) is 'n kansrekening reël vir die bepaling van die waarskynlikheid dat 'n spesifieke onderliggende moontlikheid as grondslag lê vir 'n gebeurtenis. Die waarskynlikheid word uitgedruk in terme van die voorwaardelike waarskynlikhede van die gebeurtenis by al die verskillende onderliggende moontlikhede. Hoewel die reël vernoem is na Thomas Bayes, op wie se 1763 artikel die reël gebaseer is, is dit beslis nie deur hom geformuleer nie, maar wel deur Pierre-Simon Laplace, wat heeltemal onafhanklik die stelling nagemaak en verbeter het in 1774. Die reël kom voor in Laplace se Théorie analytique des probabilités (1812). Die reël word ook die omkeerformule genoem, omdat dit die "omgekeerde" voorwaardelike waarskynlikheid bereken. In formulevorm lyk die reël as volg:

P(A|B) = \frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|A^c)P(A^c)}.

Die gebeurtenis B kan plaasvind as A plaasvind, maar ook as A nie plaasvind nie. Volgens die voorwaardelike kanse op B met gegewe moontlikhede "A" en "nie A", word die kans bepaal dat, as B reeds gebeur het, dat dit die gegewe moontlikheid A was waaronder B gebeur het.

Die formule is 'n direkte toepassing van die definisie van voorwaardelike waarskynlikheid

P(A|B) = \frac{P(A\cap B)}{P(B)}=\frac{P(B|A)P(A)}{P(B)}

en die wet van totale waarskynlikheid:

P(B) =P(B|A)P(A)+P(B|A^c)P(A^c)\,.

In die toepassing van die reël word daar gebruik gemaak van waarskynlikhede wat reeds bekend is op die basis van vorige navorsing (a priori-kanse). As hierdie informasie egter nie beskikbaar is nie, kan die oordeel van 'n ervaringsdeskundige gevra word wat waarskynlikhede kan toeken aan gebeurtenisse, deur byvoorbeeld te skat dat 'n waarskynlikheid van 0.7 (70%) korrek klink.

Voorbeeld[wysig]

In 'n bevolking ly 1 uit 100 mense aan rumatiese artritis. Daar is 'n toets, die "Rumatoets", wat by rumatiekpasiënte meestal positief is en by gesondes meestal negatief is. Die toets is egter nie 100% akkuraat nie en het 'n spesifisiteit (die kans van 'n negatiewe toets vir 'n pasiënt sonder rumatiese artritis) van 0.8 en 'n sensitiwiteit (kans van 'n positiewe toets vir 'n pasiënt met rumatiese artritis) van 0.7.

Vraag: Is dit sinvol om die bevolking met hierdie toets vir rumatiese artritis te toets?

Ons bepaal wat die kans van die siekte is as ons iemand uit die bevolking toets en die uitslag positief is.

Met Z dui ons aan dat die toetspersoon aan die siekte ly en met +/- dat die uitslag van de toets positief/negatief is. Uit die bostaande feite volg daar dus:

P(Z)=0,01 (kans dat iemand die siekte het)
P(+|Z)= 0,70 (die kans van 'n positiewe uitslag as die sieke aanwesig is)
P(-|nie Z)=0,80 (die kans van 'n negatiewe uitslag as die siekte afwesig is)

Met Bayes se reël kan ons nou bereken:

P(Z|+) = \frac{P(+|Z)P(Z)}{P(+|Z)P(Z)+P(+|nie \ Z)P(nie \ Z)} = \frac{0,70 \times 0,01}{0,70 \times 0,01 + 0,20 \times 0,99}= 0,034.

Gevolglik, selfs by 'n positiewe uitslag van die toets, is die kans dat die persoon die siekte het net bo drie persent. Die "rumatoets" is in hierdie situasie amper onbruikbaar.

Veralgemening[wysig]

As 'n mens by die gebeurtenis B nie net tussen die moontlikhede "A" en "nie A" onderskei nie, maar tussen 'n reeks disjunkte moontlikhede A_1,...,A_n, wat 'n partisie van die steekproefruimte vorm, dan lyk die formule soos volg:

P(A_i|B) = \frac{P(B|A_i)P(A_i)}{P(B|A_1)P(A_1)+\ldots+P(B|A_n)P(A_n)}= \frac{P(B|A_i)P(A_i)}{\sum_{k=1}^nP(B|A_k)P(A_k)}.

'n Soortgelyke, maar meer algemene reël kan geformuleer vir kansverdelings. Vir die gelyktydige kontinue verdeling van twee stogastiese veranderlikes X en Y kry 'n mens die formule:

 f_X(x|Y=y) = \frac{f_Y(y|X=x)\,f_X(x)}{\int_{-\infty}^{\infty} f_Y(y|X=\xi )\,f_X(\xi )\,d\xi }.\!

Bayesiaanse statistiek[wysig]

Bayes se reël word in Bayesiaanse statistiek gebruik as 'n basis.

Hierdie artikel is in sy geheel of gedeeltelik vanuit die Nederlandse Wikipedia vertaal.