From veky@student.math.hr Wed Jan 14 21:03:48 2004
Newsgroups: hr.comp.mathematica,hr.sci.matematika
Subject: Re: vjerojatnost ?
Followup-To: hr.sci.matematika
Lines: 191
Message-ID: <slrnc0b842.3d5.veky@student.math.hr>
References: <brrlce$5b3$1@ls219.htnet.hr>

In article <brrlce$5b3$1@ls219.htnet.hr>, Dragutin Culinovic wrote:
>Imamo kutiju sa 2/3 kuglica jedne boje (ili crvena ili bijela, ne znamo
>koja) i 1/3 kuglica druge boje(takodjer ne zanmo koje boje, ili crvena
>ili bijela). Damo jednom covjeku da izvlaci 5 kuglica 
>i on izvuce 4 crvene i 1 bijelu.
>Damo drugom da izvlaci 20 kuglica i on izvuce 12 crvenih i 8 bijelih.

Hm. Kao prvo, zadatak je konceptualno laksi ako se kuglice vracaju
u kutiju (ili ako ih ima toliko puno da tih 20ak izvucenih ne mijenja
bitno omjer 2:1 boja u kutiji).
Pise li sto o tome?
Ja cu rijesiti za slucaj kad se vracaju, jer to se slaze s rezultatima
dolje navedenim (donekle:). Ako treba rijesiti bez vracanja, javi.

>Koji od te dvojice ljdi ce biti vise uvjeren da kutija sadrzi 2/3 
>crvenih i 1/3 bijelih prije nego obrnuto (da sadrzi 1/3 bijeli i 2/3 
>crvenih)

Ovdje pretpostavljam da imas jos jedan mali lapsuz (ovo "obrnuto"
ti je zapravo jednako).

>U knjizi je izneseno i objasnjenje.
>Kaze: "U tom problemu, tocne naknadne sanse su 8 prema 1 za 4:1 uzorak
>(prvi covjek) dok su te sanse 16 prema 1 za 18:8 uzorak, uz uvjet 
>jednakih vjerojatnosti prije izvlacenja."
>
>Jel mi moze tko malo rastumaciti to objasnjenje?

Mrzim tumaciti objasnjenja koja se ne sluze standardnom
terminologijom. [:-)]

Evo mog objasnjenja:
[lesson title="uvjetne vjerojatnosti i neki terminoloski detalji"]
Detaljno cu raspisati kako prvi covjek razmislja, iz toga bi trebalo
biti prilicno jasno kako razmislja onaj drugi (samo drugi brojevi
su u igri).

Imamo dvije hipoteze,
H1:={"kutija sadrzi 2/3 crvenih kuglica i 1/3 bijelih"}
H2:={"kutija sadrzi 1/3 crvenih kuglica i 1/3 bijelih"}
Dogadaj koji se dogodio (za prvog covjeka) je
A:={"od 5 nasumce izvucenih kuglica, izvucene su 4 crvene i jedna
bijela"}

Ono sto mi zelimo je usporediti vjerojatnosti od H1 i H2 , _pod uvjetom_
da se dogodio dogadaj A . Ako dogadaje interpretiramo kao skupove
(standardno u modernoj teoriji vjerojatnosti), to (zove se uvjetna
vjerojatnost i biljezi s P(A1|A2) ) definira novu vjerojatnost "P"_A2
( P uz uvjet A2 ), koja se racuna na A1 tako da nas zanima samo onaj dio
dogadaja A1 koji je upao u A2 - dakle P(A1 n A2) 
("n" mi oznacava presjek skupova). 
Tako bi to bilo, kad ne bi bilo zahtjeva da vjerojatnost bude
_normirana_, odnosno P(Omega)=1 (gdje je Omega univerzalan skup
dogadaja, u starijoj terminologiji zvan i siguran dogadaj).

Lako je vidjeti da je "P"_A2(Omega)=P(Omega n A2)=P(A2) , 
sto ne mora biti 1 . No kako nas ionako zanimaju samo omjeri 
pojedinih vjerojatnosti, stvar se ne mijenja ako sve pomnozimo 
(ili podijelimo) s nekom konstantom. U ovom slucaju, naravno,
treba podijeliti s P(A2) (pretpostavimo da A2 nije vjerojatnosti nula )
da se dobije 1 na Omega (a vidi se da svi
ostali aksiomi vjerojatnosti ostaju sacuvani).

So, formula je 
	P(A1|A2)="P"_A2(A1)/P(A2)=P(A1nA2)/P(A2) .
Iz toga odmah dobijemo P(A1nA2)=P(A1|A2)P(A2) . No kako je 
presjek komutativna operacija ( A1nA2=A2nA1 ), to je ujedno jednako
i P(A2|A1)P(A1) . 
To ce nam omoguciti da invertiramo uvjetne vjerojatnosti,
sto ce nam trebati za ovaj zadatak kao sto cemo uskoro vidjeti.

Sad mozemo precizno formulirati zadatak: treba izracunati P(H1|A) i
P(H2|A) , odnosno njihovu razliku/omjer, i to usporediti s analognom
razlikom/omjerom za drugog covjeka (tj. H1 i H2 ostaju, a dogadaj
A postaje dogadaj
B:={"od 20 nasumce izvucenih kuglica, izvuceno je 12 crvenih i 8
bijelih"} ).

Kako izracunati P(H1|A) , npr. ? Prvo primijetimo da H1 i H2 cine
takozvan _potpun sustav_ hipoteza, odnosno
->nijedna od njih nije vjerojatnosti 0 ( P(H1)!=0!=P(H2) )
->bar jedna od njih je sigurno ispunjena 
    ( H1uH2=Omega , "u" mi znaci uniju)
->nikad nisu ispunjene obje 
    ( H1nH2=0 <- prazan skup, dakle disjunktne su)

Dakle, P(H1)+P(H2)=P(Omega)=1 . Stovise, H1 i H2 tvore tzv. Laplaceov
sustav hipoteza, odnosno buduci da na pocetku ne znamo nista o tome je
li vjerojatnija H1 ili H2 , a zadatak djeluje dovoljno simetricno 
(prije nego sto se spomenu dogadaji A i B ), logicno je pretpostaviti
da imaju jednake vjerojatnosti: P(H1)=P(H2) . Iz onog gore sad ocito
P(H1)=P(H2)=1/2 . Zapamtimo ovo.

Remember, mi trebamo P(H1|A) , sto je jednako P(H1nA)/P(A) .
P(H1nA) po onom sto smo gore pisali je isto sto i P(AnH1) , dakle
P(A|H1)P(H1) . P(A|H1) kao i P(A|H2) cemo izracunati malo kasnije.

Sad idemo napasti P(A) (nazivnik od P(H1|A) ). Buduci da je ocito
A=AnOmega , a Omega=H1UH2 
("U" mi je disjunktna unija, odnosno unija skupova koji su disjunktni), 
vrijedi A=An(H1UH2)=(AnH1)U(AnH2) (ako su H1 i H2 bili disjunktni, 
ocito su ostali disjunktni i nakon sto ih presjecemo s A ).
Dakle P(A)=P(AnH1)+P(AnH2) . Prvi clan smo vec izracunali (primijeti,
to je upravo brojnik), a drugi je potpuno analogno sednak P(A|H2)P(H1) .

Izveli smo dakle dvije vazne formule:
Ako je {H1,H2} potpun sustav hipoteza (lako se generalizira i na
vise njih), tad za bilo koji A vrijedi:
 P(A)=P(A|H1)P(H1)+P(A|H2)P(H2) <- formula totalne vjerojatnosti
 P(H1|A)=P(A|H1)P(H1)/(P(A|H1)P(H1)+P(A|H2)P(H2)) <- Bayesova formula
Cak stovise, buduci da je P(H1)=P(H2) (Laplaceov sustav), oni se mogu
u drugoj formuli izluciti u nazivniku i skratiti s brojnikom, pa
dobijemo:
Ako je {H1,H2} Laplaceov sustav hipoteza (takoder, lako se generalizira
na vise njih), tad za bilo koji A vrijedi
->	P(H1|A)=P(A|H1)/(P(A|H1)+P(A|H2)) <- Laplace-Bayesova formula

Dakle, sve smo sveli na racunanje P(A|H1) i P(A|H2) . Detaljno cu
izracunati samo P(A|H1) , P(A|H2) tad stvarno ne bi trebalo
predstavljati problem.
So, treba nam P(A|H1) , odnosno kolika je vjerojatnost da bismo
izvukli 4 crvene i jednu bijelu kuglicu, ako je u kutiji 2/3 crvenih
i 1/3 bijelih kuglica?

Kao prvo, od tih 5 izvucenih moramo precizirati jednu bijelu (ostalr
su tada odredene, crvene). To mozemo uciniti na (5povrh1) nacina
(s binomnim koeficijentima se nadam da si upoznat, ako nisi
procitaj moj lesson na hr.sci.matematika o tome;). Sad moramo izracunati
vjerojatnost da uz taj preciziran polozaj bijele kuglice (sto je ocito
svejedno, recimo da je prva) izvucemo jednu bijelu, pa nakon toga jednu
crvenu, pa jednu crvenu, jednu crvenu i joos jeednu crrvenu, kao sto
bi rekao Rafo. ;-)

Sad do izrazaja dolazi ono sto sam rekao o vracanju kuglica - jer 
nakon sto smo izvukli prvu bijelu, omjer strogo gledano vise nije
isti (ima jedna bijela manje u kutiji, a crvenih je ostalo jednako).
No ako vratimo tu bijelu nakon izvlacenja natrag u kutiju, sve ostaje
kako treba, i kao sto rekoh, pod tom pretpostavkom cu rijesiti zadatak.

So, vjerojatnost da ce prva biti bijela je 1/3 (jer ima 1/3 bijelihbu
kutiji). Jednako tako, vjerojatnost da ce i-ta (za i@{2..5} ) biti
crvena je 2/3 . S obzirom da se sve to mora dogoditi upravo tim redom
(dogadaji su nezavisni), ti brojevi se mnoze. Dakle imam
P(A|H1)=(5povrh1)*(1/3)*(2/3)^4=5*2^4/3^5=80/243 .
(samo kratka napomena, ako ti se ne da trazit moj lesson o binomnim
koeficijentima: (npovrhk)=n!/(k!*(n-k)!) - sto su faktorijele valjda
znas:)

Potpuno analogno, dobijem P(A|H2)=10/243 (raspisi za domacu zadacu:).
Uvrstivsi to u Laplace-Bayesovu formulu, dobijem
P(H1|A)=(80/243)/(80/243+10/243)=80/(80+10)=8/9 .
Opet potpuno analogno, dobijem i 
P(H2|A)=(10/243)/(90/243) , odnosno 1/9 (a to sam mogao i elegantnije,
jer znam da mora biti zbroj 1 - dakle 1-8/9=1/9 ).
E sad, ono sto uputa zeli reci je 
da je omjer ta dva broja u ovom slucaju
8:1 u korist hipoteze H1 (da ima vise crvenih nego bijelih). Opcenito
se u ne_bas_previse_mathematickim tekstovima
vjerojatnost koja je racionalan broj p/q prikazuje kao omjer nje i
njoj komplementarne 1-p/q , dakle kao p:(q-p) . No to moze zbuniti, 
poput tvog pitanja "hoce li onaj drugi biti dvostruko uvjereniji...".

Pa da vidimo tog drugoga. Rekoh, necu sve raspisivati, ali dobije se
	P(B|H1)=171991040/1162261467 (hint: (20povrh8)=125970 , 
				      no i to se zapravo skrati)
	P(B|H2)=10749440/1162261467
	P(H1|B)=16/17
	P(H2|B)=1/17 ,
dakle omjer je u ovom slucaju 16:1 u korist H1 . No to IMO ne znaci da
ce drugi biti dvostruko uvjereniji (iako ce biti uvjereniji) u H1 , jer
ako razmislja strogo mathematicki (a jako malo ljudi tako 
razmislja - napravljena je hrpa studija na temu psiholoskog dozivljaja
vjerojatnosti, ali to ovdje nije tema:), dozivjet ce to kao P(H1|B) ,
dakle 16/17 , sto je tocno 128/119 puta vece od P(H1|A)=7/8 , odnosno
onog sto ce prvi covjek percipirati (opet pod istom pretpostavkom o
psihologiji:). Kao sto se vidi, da, vece je, ali niposto dvostruko vece.
[/lesson]

>Kako se doslo do tih 8-1 i 16-1?
>Po tome bi bilo da je drugi covjek duplo sigurniji od prvog da su 2/3 
>kuglica crvene, a ne obrnuto. Jel to to znaci?

Pise gore. Ne. Ni blizu. Prije ~~1.0756 puta sigurniji. :-)

>Intuitivno mi je ok da je to tako ali me zanima dokaz toga matematicki.

Nadam se da je ovo gore dovoljno matematicki za tebe. :-)

>Kako se prevodi u matematickoj struci "prior probability"
>"posterior probability", "odds ratio" ?

Sluzbeni prijevodi: "vjerojatnost a priori", "vjerojatnost a
posteriori", "omjer (sanse)".
Moji "prijevodi":
-> "vjerojatnost kako je dozivljavamo prije nekog fiksnog dogadaja"
-> "vjerojatnost kako je dozivljavamo nakon (tog) fiksnog dogadaja"
-> "lousy nacin izrazavanja vjerojatnosti za ljude koji nisu svladali
   razlomke:-p"

-- 
Veky           ... did they play the pipe lowly ...