Diferența dintre distribuția condiționată și distribuția marginală (explicată) - Toate diferențele

 Diferența dintre distribuția condiționată și distribuția marginală (explicată) - Toate diferențele

Mary Davis

Probabilitatea este o ramură a matematicii care cuantifică predicția apariției unui anumit eveniment pentru un set de date dat. Ea oferă o interpretare matematică a probabilității de a obține rezultatul dorit.

Probabilitatea ca un eveniment să se producă este cuprinsă între zero și unu. Zero înseamnă că nu există nicio șansă sau probabilitate ca acel eveniment să se producă, iar unu reprezintă că probabilitatea ca un anumit eveniment să se producă este de 100%.

Studiul probabilităților ne permite să prezicem sau să evaluăm șansele de succes sau de eșec ale oricărui eveniment dorit și să luăm măsuri pentru a-l îmbunătăți.

De exemplu, atunci când se testează un produs nou, o probabilitate mare de eșec semnifică un produs de calitate scăzută. Cuantificarea șanselor de eșec sau de succes poate ajuta producătorii să își îmbunătățească calitatea și experiența produselor.

În analiza datelor, distribuțiile marginale și condiționate sunt utilizate pentru a găsi probabilitatea în datele bivariate. Dar înainte de a trece la acest lucru, să trecem în revistă câteva noțiuni de bază.

Bazele probabilității

O variabilă aleatoare este utilizată pentru a cuantifica rezultatele unui eveniment aleatoriu.

De exemplu, o școală efectuează o cercetare pentru a prezice performanțele elevilor săi la matematică la examenele viitoare, pe baza performanțelor lor anterioare. Cercetarea se limitează la un număr total de 110 elevi de la 6 la 8. Dacă o variabilă aleatoare "X" este definită ca fiind notele obținute. Tabelul următor prezintă datele colectate:

Clasele Număr de studenți
A+ 14
A- 29
B 35
C 19
D 8
E 5
Total studenți: 110

Eșantion de date

P(X=A+) = 14/110 = 0.1273

0.1273 *100=12.7%

Acest lucru arată că aproximativ 12,7% dintre elevi pot obține un punctaj de până la A+ la viitoarele examene.

Dar dacă școlile vor să analizeze și notele elevilor în raport cu clasele în care sunt înscriși. Deci câți dintre cei 12,7% dintre elevii care au luat 10+ aparțin clasei a VIII-a?

Tratarea unei singure variabile aleatoare este destul de simplă, dar atunci când datele sunt distribuite în raport cu două variabile aleatoare, calculele pot fi puțin mai complexe.

Vezi si: Diferența dintre Gold Plated & Gold Bonded - Toate diferențele

Cele două modalități cele mai simplificate de extragere a informațiilor relevante din datele bivariate sunt distribuția marginală și distribuția condiționată.

Vezi si: Eldienii VS Subiecții lui Ymir: O scufundare profundă - Toate diferențele

Pentru a explica vizual elementele de bază ale probabilității, iată un videoclip de la Math Antics:

Matematica Antics - Probabilitate de bază

Ce se înțelege prin distribuție marginală?

Distribuția marginală sau probabilitatea marginală este distribuția unei variabile independente de cealaltă variabilă. Ea depinde doar de producerea unuia dintre cele două evenimente, incluzând toate posibilitățile celuilalt eveniment.

Este mai ușor de înțeles conceptul de distribuție marginală atunci când datele sunt reprezentate într-o formă tabelară. Termenul marginal denotă faptul că include distribuția de-a lungul marginilor.

În tabelele următoare sunt prezentate notele a 110 elevi din clasele 6-8. Putem folosi aceste informații pentru a prezice o notă la viitorul examen de matematică,

Clasele al 6-lea standard al 7-lea standard al 8-lea standard Nr. total de studenți
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Eșantion de date

Utilizând acest tabel sau aceste date de eșantionare, putem calcula distribuția marginală a notelor în raport cu numărul total de elevi sau distribuția marginală a elevilor la un anumit standard.

Nu ținem cont de apariția unui al doilea eveniment în timpul calculării distribuției marginale.

De exemplu, în timp ce calculăm distribuția marginală a elevilor care au obținut un C în raport cu numărul total de elevi, pur și simplu adunăm numărul de elevi pentru fiecare clasă pe rând și împărțim valoarea cu numărul total de elevi.

Numărul total de elevi care au obținut un C la toate standardele combinate este de 19.

Împărțind-o la numărul total de elevi din clasa a 6-a - a 8-a: 19/110=0.1727

Înmulțind această valoare cu 100, se obține 17,27%.

17,27% din totalul elevilor au obținut nota C.

De exemplu, distribuția marginală a elevilor din clasa a 6-a este de 29/110, ceea ce înseamnă 0,2636. Înmulțind această valoare cu 100 se obține 26,36%.

În mod similar, distribuția marginală a elevilor din clasele a 7-a și a 8-a este de 40% și, respectiv, 33,6%.

Ce se înțelege prin distribuții condiționate?

Distribuția condiționată, așa cum este interpretată de nume, se bazează pe o condiție preexistentă. Este probabilitatea unei variabile în timp ce cealaltă variabilă este stabilită la o anumită condiție.

Distribuțiile condiționate vă permit să vă analizați eșantionul cu privire la două variabile. În analiza datelor, deseori, probabilitatea ca un eveniment să se producă este influențată de un alt factor.

Probabilitatea condiționată utilizează reprezentarea tabelară a datelor, ceea ce îmbunătățește vizualizarea și analiza datelor din eșantion.

De exemplu, dacă studiați durata medie de viață a populației, două variabile de care trebuie să țineți cont pot fi aportul caloric mediu zilnic și frecvența activității fizice. Probabilitatea condiționată vă poate ajuta să vă dați seama de impactul activității fizice asupra duratei medii de viață a populației dacă aportul caloric zilnic este mai mare de 2 500 kcal sau viceversa.

Pe măsură ce am stabilit aportul zilnic de calorii <2500kcal, am pus o condiție. Pe baza acestei condiții, se poate determina impactul activităților fizice asupra duratei medii de viață.

Sau, în timp ce observăm abaterea vânzărilor a două mărci predominante de băuturi energizante, două variabile care influențează vânzările acestor băuturi energizante sunt prezența și prețul acestora. Putem utiliza probabilitatea condiționată pentru a determina influența prețului și a prezenței a două băuturi energizante asupra intenției de cumpărare a clienților.

Pentru a înțelege mai bine, să analizăm același exemplu utilizat în distribuția marginală:

Clasele al 6-lea standard al 7-lea standard al 8-lea standard Nr. total de studenți
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Eșantion de date

De exemplu, doriți să aflați distribuția elevilor din clasa a 6-a care au obținut nota C, în raport cu numărul total de elevi. Pur și simplu împărțiți numărul de elevi din clasa a 6-a care au obținut nota C la numărul total de elevi din toate cele trei clase care au obținut nota C.

Deci, răspunsul va fi 4/19= 0.21

Înmulțind cu o sută, rezultă 21%.

Distribuția unui elev de clasa a 7-a care obține nota C este 7/19= 0.37

Înmulțind cu 100, rezultă 37%.

Iar distribuția unui elev de clasa a 8-a care obține nota C este 8/19= 0,42

Înmulțind cu 100, rezultă 42,1%.

Diferența dintre distribuția condiționată și distribuția marginală

Diferența dintre distribuția condiționată și distribuția marginală

Distribuția marginală este distribuția unei variabile în raport cu eșantionul total, în timp ce distribuția condiționată este distribuția unei variabile în raport cu o altă variabilă.

Distribuția marginală este independentă de rezultatele celeilalte variabile. Cu alte cuvinte, este pur și simplu necondiționată.

De exemplu, dacă o variabilă aleatorie "X" este atribuită sexului copiilor dintr-o tabără de vară și o altă variabilă aleatorie "Y" este atribuită vârstei acestor copii, atunci,

Distribuția marginală a băieților într-o tabără de vară poate fi dată de P(X=băieți), în timp ce proporția de băieți sub 8 ani este dată de distribuția condiționată ca P(X=băieți).

Gânduri finale

Distribuția marginală arată probabilitățile diferitelor valori ale variabilelor fără a indica celelalte variabile.

Cu toate acestea, distribuția condiționată reprezintă probabilitatea unei variabile care este calculată în raport cu o altă variabilă.

Ambele teorii ale probabilității sunt corecte, iar aplicarea lor diferă în funcție de probleme, cazuri și scenarii.

Articole conexe

    Mary Davis

    Mary Davis este scriitoare, creatoare de conținut și cercetătoare pasionată specializată în analiza comparativă pe diverse subiecte. Cu o diplomă în jurnalism și peste cinci ani de experiență în domeniu, Mary are o pasiune pentru a oferi cititorilor săi informații imparțiale și directe. Dragostea ei pentru scris a început când era tânără și a fost o forță motrice în spatele carierei sale de succes în scris. Capacitatea lui Mary de a cerceta și de a prezenta descoperirile într-un format ușor de înțeles și captivant a făcut-o îndrăgită de cititorii din întreaga lume. Când nu scrie, Mary îi place să călătorească, să citească și să petreacă timp cu familia și prietenii.