Razlika med pogojno in mejno porazdelitvijo (razloženo) - Vse razlike
Kazalo
Verjetnost je veja matematike, ki količinsko opredeljuje predvidevanje, da se bo določen dogodek zgodil za dani niz podatkov. Matematično razlaga verjetnost doseganja želenega rezultata.
Verjetnost, da se bo kateri koli dogodek zgodil, je med nič in ena. Nič pomeni, da ni nobenih možnosti ali verjetnosti, da se bo ta dogodek zgodil, ena pa pomeni, da je verjetnost, da se bo določen dogodek zgodil, 100-odstotna.
Študij verjetnosti nam omogoča, da predvidimo ali ocenimo možnosti za uspeh ali neuspeh želenega dogodka in sprejmemo ukrepe za njegovo izboljšanje.
Na primer, pri testiranju novega izdelka velika verjetnost neuspeha pomeni, da je izdelek nekakovosten. Kvantifikacija verjetnosti neuspeha ali uspeha lahko proizvajalcem pomaga izboljšati kakovost in izkušnje z izdelki.
V podatkovni analitiki se za ugotavljanje verjetnosti v bivariatnih podatkih uporabljata marginalna in pogojna porazdelitev. Preden pa se lotimo tega, si poglejmo nekaj osnov.
Osnove verjetnosti
Pogosto uporabljen izraz v verjetnosti je "naključna spremenljivka". Naključna spremenljivka se uporablja za količinsko opredelitev izidov naključnega dogodka.
Na primer, šola izvaja raziskavo, da bi na podlagi predhodnih dosežkov svojih učencev pri matematiki napovedala njihov uspeh na prihajajočih izpitih. Raziskava je omejena na skupno število 110 učencev od 6. do 8. razreda. Če je naključna spremenljivka "X" opredeljena kot dosežene ocene, so zbrani podatki prikazani v naslednji tabeli:
Razredi | Število študentov |
A+ | 14 |
A- | 29 |
B | 35 |
C | 19 |
D | 8 |
E | 5 |
Skupno število študentov: | 110 |
Vzorec podatkov
P(X=A+) = 14/110 = 0,1273
0.1273 *100=12.7%
To kaže, da lahko približno 12,7 % učencev na prihajajočih izpitih doseže oceno A+.
Kaj pa, če želijo šole analizirati tudi ocene učencev glede na njihove razrede. Koliko od 12,7 % učencev, ki so dosegli oceno A +, spada v 8. razred?
Ravnanje z eno naključno spremenljivko je precej preprosto, če pa so podatki porazdeljeni glede na dve naključni spremenljivki, so lahko izračuni nekoliko zapleteni.
Dva najbolj poenostavljena načina pridobivanja pomembnih informacij iz dvomestnih podatkov sta marginalna in pogojna porazdelitev.
Poglej tudi: Kakšna naj bo optimalna višinska razlika med popolnimi pari? - Vse razlikeZa nazorno razlago osnov verjetnosti si oglejte videoposnetek iz programa Math Antics:
Math Antics - Osnove verjetnosti
Kaj pomeni mejna porazdelitev?
Mejna porazdelitev ali mejna verjetnost je porazdelitev spremenljivke, ki je neodvisna od druge spremenljivke. Odvisna je le od enega od dveh dogodkov, pri čemer vključuje vse možnosti drugega dogodka.
Pojem marginalne porazdelitve je lažje razumeti, če so podatki predstavljeni v obliki preglednice. Izraz marginalna pomeni, da vključuje porazdelitev vzdolž robov.
V naslednjih tabelah so prikazane ocene 110 učencev iz 6.-8. standarda. Te informacije lahko uporabimo za napoved ocene za njihov prihajajoči izpit iz matematike,
Razredi | 6. standard | 7. standard | 8. standard | Skupno število študentov |
A+ | 7 | 5 | 2 | 14 |
A- | 11 | 8 | 10 | 29 |
B | 6 | 18 | 11 | 35 |
C | 4 | 7 | 8 | 19 |
D | 1 | 3 | 4 | 8 |
E | 0 | 3 | 2 | 5 |
SUM | 29 | 44 | 37 | 110 |
Vzorec podatkov
S pomočjo te tabele ali vzorčnih podatkov lahko izračunamo mejno porazdelitev ocen glede na skupno število učencev ali mejno porazdelitev učencev v določenem standardu.
Pri izračunu mejne porazdelitve ne upoštevamo pojava drugega dogodka.
Pri izračunu mejne porazdelitve učencev, ki so dobili C, glede na skupno število učencev na primer preprosto seštejemo število učencev za vsak razred v vrstici in to vrednost pomešamo s skupnim številom učencev.
Skupno število učencev, ki so pri vseh standardih skupaj dosegli oceno C, je 19.
Če ga delimo s skupnim številom učencev v 6.-8. razredu: 19/110=0,1727
Če vrednost pomnožimo s 100, dobimo 17,27 %.
17,27 % vseh učencev je doseglo oceno C.
To tabelo lahko uporabimo tudi za določitev mejne porazdelitve učencev po posameznih standardih. Na primer, mejna porazdelitev učencev v 6. standardu je 29/110, kar pomeni 0,2636. Če to vrednost pomnožimo s 100, dobimo 26,36 %.
Podobno je tudi mejna porazdelitev učencev v 7. in 8. razredu, in sicer 40 % oziroma 33,6 %.
Kaj pomenijo pogojne porazdelitve?
Pogojna porazdelitev, kot jo razlagamo po imenu, temelji na vnaprejšnjem stanju. Gre za verjetnost ene spremenljivke, medtem ko je druga spremenljivka nastavljena na določeno stanje.
Pogojne porazdelitve vam omogočajo analizo vzorca glede dveh spremenljivk. Pri analizi podatkov na verjetnost nastanka nekega dogodka pogosto vpliva drug dejavnik.
Pogojna verjetnost uporablja tabelarični prikaz podatkov. To izboljša vizualizacijo in analizo vzorčnih podatkov.
Če na primer raziskujete povprečno življenjsko dobo prebivalstva, lahko upoštevate dve spremenljivki: povprečni dnevni vnos kalorij in pogostost telesne dejavnosti. Pogojna verjetnost vam lahko pomaga ugotoviti vpliv telesne dejavnosti na povprečno življenjsko dobo prebivalstva, če je njihov dnevni vnos kalorij nad 2500 kcal ali obratno.
Ker smo določili dnevni vnos kalorij <2500 kcal, smo postavili pogoj. Na podlagi tega pogoja lahko določimo vpliv telesnih dejavnosti na povprečno življenjsko dobo.
Ali pa pri opazovanju odklona prodaje dveh prevladujočih blagovnih znamk energijskih pijač na prodajo teh energijskih pijač vplivata dve spremenljivki, in sicer njuna prisotnost in cena. Za ugotavljanje vpliva cene in prisotnosti dveh energijskih pijač na nakupno namero kupcev lahko uporabimo pogojno verjetnost.
Za boljše razumevanje si oglejmo enak primer, ki se uporablja pri mejni porazdelitvi:
Razredi | 6. standard | 7. standard | 8. standard | Skupno število študentov |
A+ | 7 | 5 | 2 | 14 |
A- | 11 | 8 | 10 | 29 |
B | 6 | 18 | 11 | 35 |
C | 4 | 7 | 8 | 19 |
D | 1 | 3 | 4 | 8 |
E | 0 | 3 | 2 | 5 |
SUM | 29 | 44 | 37 | 110 |
Vzorec podatkov
Na primer, želite ugotoviti porazdelitev učencev šestega standarda, ki so dosegli oceno C, glede na skupno število učencev. Število učencev šestega standarda, ki so dosegli oceno C, preprosto delite s skupnim številom učencev vseh treh standardov, ki so dosegli oceno C.
Torej bo odgovor b 4/19= 0,21
Če jo pomnožimo s sto, dobimo 21 %.
Porazdelitev učenca sedmega razreda, ki dobi oceno C, je 7/19= 0,37
Poglej tudi: Kopje in sulica - kakšna je razlika? - Vse razlikeČe jo pomnožimo s 100, dobimo 37 %.
Porazdelitev učencev osmega razreda, ki dobijo oceno C, je 8/19 = 0,42
Če jo pomnožimo s 100, dobimo 42,1 %.
Razlika med pogojno in mejno porazdelitvijo
Razlika med pogojno in mejno porazdelitvijo
Marginalna porazdelitev je porazdelitev spremenljivke glede na celoten vzorec, medtem ko je pogojna porazdelitev porazdelitev spremenljivke glede na drugo spremenljivko.
Marginalna porazdelitev je neodvisna od rezultatov druge spremenljivke. Z drugimi besedami, je preprosto brezpogojna.
Če je na primer naključna spremenljivka "X" dodeljena spolu otrok v poletnem taboru, druga naključna spremenljivka "Y" pa starosti teh otrok, potem,
Mejno porazdelitev dečkov v poletnem taboru lahko podamo s P(X=dečki), delež dečkov, mlajših od 8 let, pa s pogojno porazdelitvijo kot P(X=dečki
Zaključne misli
Marginalna porazdelitev prikazuje verjetnosti različnih vrednosti spremenljivk, ne da bi kazala na druge spremenljivke.
Pogojna porazdelitev pa je verjetnost spremenljivke, ki je izračunana glede na drugo spremenljivko.
Obe teoriji verjetnosti sta pravilni, njuna uporaba pa se razlikuje pri različnih problemih, primerih in scenarijih.