Razlika između uslovne i granične distribucije (objašnjeno) – sve razlike
Sadržaj
Vjerovatnoća je grana matematike koja kvantificira predviđanje određenog događaja koji će se dogoditi za dati skup podataka. Daje matematičku interpretaciju vjerovatnosti dobivanja željenog rezultata.
Vjerovatnoća da će se dogoditi bilo koji događaj je između nule i jedan. Nula označava da ne postoje šanse ili vjerovatnoća da će se taj događaj dogoditi, a jedan predstavlja da je vjerovatnoća da će se određeni događaj dogoditi 100%.
Proučavanje vjerovatnoće nam omogućava da predvidimo ili prosudimo šanse uspjeha ili neuspjeha bilo kojeg željenog događaja i poduzmite mjere da ga poboljšate.
Na primjer, kada se testira novi proizvod, velika vjerovatnoća neuspjeha označava proizvod niske kvalitete. Kvantificiranje šansi za neuspjeh ili uspjeh može pomoći proizvođačima da poboljšaju svoj kvalitet proizvoda i iskustvo.
U analitici podataka, marginalne i uslovne distribucije se koriste za pronalaženje vjerovatnoće u bivarijantnim podacima. Ali prije nego što skočimo na to, prođimo kroz neke osnove.
Osnove vjerovatnoće
Često korišten termin u vjerovatnoći je 'slučajna varijabla'. Slučajna varijabla se koristi za kvantificiranje ishoda slučajnog događaja koji se odvija.
Na primjer, škola provodi istraživanje kako bi predvidjela učinak svojih učenika iz matematike na predstojećim ispitima, na osnovu njihovih prethodnih performanse. Istraživanje je ograničeno na ukupan broj od 110učenici od 6. do 8. standarda. Ako je slučajna varijabla “X” definirana kao dobivene ocjene. U sljedećoj tabeli prikazani su prikupljeni podaci:
Ocjene | Broj učenika |
A+ | 14 |
A- | 29 |
B | 35 |
C | 19 |
D | 8 |
E | 5 |
Ukupno učenika: | 110 |
Uzorak podataka
P (X=A+) = 14/110 = 0,1273
0,1273 *100=12,7%
Ovo pokazuje da oko 12,7% učenika može postići na A+ na svojim predstojećim ispitima.
Šta ako i škole žele analizirati ocjene učenika s obzirom na njihove razrede. Dakle, koliko od 12,7% učenika koji su postigli A + pripada 8. standardu?
Radovanje s jednom slučajnom varijablom je prilično jednostavno, ali kada su vaši podaci raspoređeni u odnosu na dvije slučajne varijable , proračuni mogu biti malo složeni.
Dva najjednostavnija načina izvlačenja relevantnih informacija iz bivarijatnih podataka su marginalna i uslovna distribucija.
Da biste vizualno objasnili osnove vjerovatnoće, evo videa iz matematičkih ludorija:
Matematičke ludosti – osnovna vjerovatnoća
Šta se podrazumijeva pod marginalnom distribucijom?
Marginalna distribucija ili marginalna vjerovatnoća je distribucija varijable neovisna o drugoj varijable. Zavisi samo od jednog od ta dvadogađaji koji se događaju dok se poduzmu sve mogućnosti drugog događaja.
Lakše je razumjeti koncept marginalne distribucije kada su podaci predstavljeni u obliku tabele. Pojam marginalni označava da uključuje raspodjelu po marginama.
U sljedećim tabelama prikazane su ocjene 110 učenika od 6. do 8. standarda. Ove informacije možemo koristiti da predvidimo ocjenu za njihov predstojeći ispit iz matematike,
Ocjene | 6. standard | 7. standard | 8. standard | Ukupni br. učenika |
A+ | 7 | 5 | 2 | 14 |
A- | 11 | 8 | 10 | 29 |
B | 6 | 18 | 11 | 35 |
C | 4 | 7 | 8 | 19 |
D | 1 | 3 | 4 | 8 |
E | 0 | 3 | 2 | 5 |
SUM | 29 | 44 | 37 | 110 |
Uzorak podataka
Upotrebom ove tabele ili uzorka podataka možemo izračunati graničnu distribuciju ocjena u odnosu na ukupan broj učenika ili marginalnu distribuciju učenika u određenom standardu.
Vidi_takođe: Razlika između “Watashi Wa”, “Boku Wa” i “Ore Wa” – sve razlikeZanemarujemo pojavu drugog događaja prilikom izračunavanja marginalne distribucije.
Na primjer, dok izračunavamo marginalnu distribuciju učenika koji su dobili C u odnosu na ukupan brojučenika, jednostavno zbrojimo broj učenika za svaki razred u nizu i iscijedimo vrijednost sa ukupnim brojem učenika.
Ukupan broj učenika koji su dobili C u svim standardima zajedno je 19.
Podijelimo ga sa ukupnim brojem učenika u 6-8. standardu: 19/110=0,1727
Množenjem vrijednosti sa 100 dobije se 17,27%.
17,27 % od ukupnog broja učenika postigao je C.
Ovu tabelu možemo koristiti i za određivanje marginalne distribucije učenika u svakom standardu. Na primjer, marginalna distribucija učenika u 6. standardu je 29/110, što daje 0,2636. Množenjem ove vrijednosti sa 100 dobije se 26,36%.
Slično tome, marginalna distribucija učenika u 7. i 8. standardu je 40% i 33,6%, respektivno.
Šta Da li se podrazumijeva pod uslovnim distribucijama?
Uslovna distribucija kako se tumači imenom, zasniva se na već postojećem uslovu. To je vjerovatnoća jedne varijable dok je druga varijabla postavljena na dati uvjet.
Uslovne distribucije vam omogućavaju da analizirate svoj uzorak u vezi s dvije varijable. U analitici podataka, često je na vjerovatnoću da će se događaj dogoditi pod utjecajem drugog faktora.
Uslovna vjerovatnoća koristi tabelarni prikaz podataka. Ovo poboljšava vizualizaciju i analizu podataka uzorka.
Na primjer, ako istražujete prosječan životU rasponu populacije, dvije varijable koje treba uzeti u obzir mogu biti, njihov prosječni dnevni unos kalorija i učestalost fizičke aktivnosti. Uslovna vjerovatnoća vam može pomoći da shvatite utjecaj fizičke aktivnosti na prosječni životni vijek populacije ako je njihov dnevni unos kalorija veći od 2500 kcal ili obrnuto.
Kako postavljamo dnevni unos kalorija < 2500kcal, postavili smo uslov. Na osnovu ovog stanja može se utvrditi uticaj fizičkih aktivnosti na prosječan životni vijek.
Ili, posmatrajući odstupanje u prodaji dvije preovlađujuće marke energetskih napitaka, dvije varijable koje utiču na prodaju ova energetska pića su njihova prisutnost i cijena. Možemo koristiti uslovnu vjerovatnoću da odredimo utjecaj cijene i prisutnosti dva energetska pića na kupčevu namjeru.
Da bismo bolje razumjeli, pogledajmo isti primjer korišten u marginalnoj distribuciji:
Ocjene | 6. standard | 7. standard | 8. standard | Ukupni br. ofstudenti |
A+ | 7 | 5 | 2 | 14 |
A- | 11 | 8 | 10 | 29 |
B | 6 | 18 | 11 | 35 |
C | 4 | 7 | 8 | 19 |
D | 1 | 3 | 4 | 8 |
E | 0 | 3 | 2 | 5 |
SUM | 29 | 44 | 37 | 110 |
Uzorak podataka
Na primjer, želite pronaći distribuciju učenika 6. standarda koji su dobili C, u odnosu na ukupan broj učenika. Jednostavno podijelite broj učenika u 6. standardu koji su postigli C sa ukupnim brojem učenika u sva tri standarda koji su postigli C.
Tako da će odgovor b 4/19= 0,21
Množenjem sa stoticom dobijete 21%
Distribucija učenika 7. standarda koji je postigao C je 7/19= 0,37
Množenjem sa 100 daje 37%
A distribucija 8. standardnog učenika koji je postigao C je 8/19= 0,42
Množenjem sa 100 dobija se 42,1%
Razlika između uslovne i marginalne distribucije
Razlika između uslovne i marginalne distribucije
Vidi_takođe: Razlika između filmskog režisera i producenta (objašnjeno) – sve razlikeMarginalna distribucija je distribucija varijable u odnosu na ukupan uzorak, dok je uslovna distribucija je distribucija varijable u odnosu na drugu varijablu.
Marginalna distribucija je nezavisnaishoda druge varijable. Drugim riječima, to je jednostavno bezuslovno.
Na primjer, ako je slučajna varijabla “X” dodijeljena spolu djece u ljetnom kampu, a druga slučajna varijabla “Y” je dodijeljena dobi ovih djeca tada,
Marginalna distribucija dječaka u ljetnom kampu može se dati sa P(X=dječaci), dok se udio dječaka mlađih od 8 godina daje uslovnom raspodjelom kao P( X=dečaci