Rozdiel medzi podmieneným a marginálnym rozdelením (vysvetlené) - všetky rozdiely

 Rozdiel medzi podmieneným a marginálnym rozdelením (vysvetlené) - všetky rozdiely

Mary Davis

Pravdepodobnosť je odvetvie matematiky, ktoré kvantifikuje predpoveď výskytu určitej udalosti pre daný súbor údajov. Poskytuje matematickú interpretáciu pravdepodobnosti dosiahnutia požadovaného výsledku.

Pravdepodobnosť výskytu akejkoľvek udalosti sa pohybuje v rozmedzí od 0 do 1. Nula znamená, že neexistuje žiadna šanca alebo pravdepodobnosť výskytu danej udalosti, a jedna znamená, že pravdepodobnosť výskytu danej udalosti je 100 %.

Štúdium pravdepodobnosti nám umožňuje predpovedať alebo posúdiť šance na úspech alebo neúspech akejkoľvek želanej udalosti a prijať opatrenia na jej zlepšenie.

Pozri tiež: Vypínanie spojky VS ND v automobile: porovnanie - všetky rozdiely

Napríklad pri testovaní nového výrobku znamená vysoká pravdepodobnosť neúspechu nízku kvalitu výrobku. Kvantifikácia šancí na neúspech alebo úspech môže výrobcom pomôcť zlepšiť kvalitu a skúsenosti s výrobkami.

V dátovej analytike sa na zistenie pravdepodobnosti v dvojrozmerných údajoch používajú marginálne a podmienené rozdelenia. Ale skôr, ako sa na to vrhneme, prejdime si niekoľko základných informácií.

Základy pravdepodobnosti

Často používaným pojmom v pravdepodobnosti je "náhodná premenná". Náhodná premenná sa používa na kvantifikáciu výsledkov náhodnej udalosti, ktorá nastane.

Napríklad, škola uskutočňuje výskum s cieľom predpovedať výsledky svojich žiakov v matematike v nadchádzajúcich skúškach na základe ich predchádzajúcich výsledkov. Výskum je obmedzený na celkový počet 110 žiakov od 6. do 8. ročníka. Ak je náhodná premenná "X" definovaná ako získané známky. Nasledujúca tabuľka zobrazuje získané údaje:

Triedy Počet študentov
A+ 14
A- 29
B 35
C 19
D 8
E 5
Celkový počet študentov: 110

Vzorka údajov

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Z toho vyplýva, že približne 12,7 % žiakov môže v nadchádzajúcich skúškach získať až A+.

Čo ak chcú školy analyzovať aj známky žiakov vzhľadom na ich ročníky. Koľko z 12,7 % žiakov, ktorí získali známku A+, teda patrí do 8. ročníka?

Práca s jednou náhodnou premennou je pomerne jednoduchá, ale ak sú vaše údaje rozdelené vzhľadom na dve náhodné premenné, výpočty môžu byť trochu zložitejšie.

Dva najjednoduchšie spôsoby získavania relevantných informácií z dvojrozmerných údajov sú marginálne a podmienené rozdelenie.

Na názorné vysvetlenie základov pravdepodobnosti slúži video od Math Antics:

Matematické vylomeniny - Základná pravdepodobnosť

Čo znamená marginálne rozdelenie?

Marginálne rozdelenie alebo marginálna pravdepodobnosť je rozdelenie premennej nezávislé od inej premennej. Závisí len od toho, či nastane jedna z dvoch udalostí, pričom subsumuje všetky možnosti druhej udalosti.

Je jednoduchšie pochopiť pojem marginálne rozdelenie, keď sú údaje reprezentované v tabuľkovej forme. Pojem marginálne označuje, že zahŕňa rozdelenie pozdĺž okrajov.

Pozri tiež: Aký je rozdiel medzi gangom a mafiou? - Všetky rozdiely

V nasledujúcich tabuľkách sú uvedené známky 110 žiakov zo 6. - 8. ročníka. Tieto informácie môžeme použiť na predpovedanie známky na ich nadchádzajúcu skúšku z matematiky,

Triedy 6. štandard 7. štandard 8. štandard Celkový počet študentov
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Vzorka údajov

Pomocou tejto tabuľky alebo výberových údajov môžeme vypočítať marginálne rozdelenie známok vzhľadom na celkový počet žiakov alebo marginálne rozdelenie žiakov v určitej norme.

Pri výpočte marginálneho rozdelenia neberieme do úvahy výskyt druhej udalosti.

Napríklad pri výpočte marginálneho rozdelenia žiakov, ktorí získali trojku, vzhľadom na celkový počet žiakov, jednoducho spočítame počet žiakov pre každú triedu v celom riadku a túto hodnotu spojíme s celkovým počtom žiakov.

Celkový počet študentov, ktorí získali trojku zo všetkých štandardov spolu, je 19.

Vydelenie celkovým počtom žiakov v 6.-8. ročníku: 19/110=0,1727

Vynásobením tejto hodnoty číslom 100 dostaneme 17,27 %.

17,27 % z celkového počtu študentov dosiahlo známku C.

Túto tabuľku môžeme použiť aj na určenie marginálneho rozdelenia žiakov v jednotlivých štandardoch. Napríklad marginálne rozdelenie žiakov v 6. štandarde je 29/110, čo dáva 0,2636. Vynásobením tejto hodnoty 100 dostaneme 26,36 %.

Podobne je to aj s marginálnym rozdelením žiakov v 7. a 8. ročníku, ktoré predstavuje 40 %, resp. 33,6 %.

Čo znamenajú podmienené rozdelenia?

Podmienené rozdelenie, ako sa interpretuje podľa názvu, je založené na vopred existujúcej podmienke. Je to pravdepodobnosť jednej premennej, kým druhá premenná je nastavená na danú podmienku.

Podmienené rozdelenia umožňujú analyzovať vzorku týkajúcu sa dvoch premenných. V dátovej analytike je často pravdepodobnosť výskytu udalosti ovplyvnená iným faktorom.

Podmienená pravdepodobnosť využíva tabuľkovú reprezentáciu údajov. Tým sa zlepšuje vizualizácia a analýza údajov vzorky.

Ak napríklad zisťujete priemernú dĺžku života populácie, dve premenné, ktoré treba zohľadniť, môžu byť ich priemerný denný príjem kalórií a frekvencia fyzickej aktivity. Podmienená pravdepodobnosť vám pomôže zistiť vplyv fyzickej aktivity na priemernú dĺžku života populácie, ak je ich denný príjem kalórií vyšší ako 2500 kcal alebo naopak.

Keďže sme stanovili denný kalorický príjem <2500 kcal, dali sme podmienku. Na základe tejto podmienky možno určiť vplyv pohybových aktivít na priemernú dĺžku života.

Alebo pri pozorovaní odchýlky predaja dvoch prevládajúcich značiek energetických nápojov sú dve premenné, ktoré ovplyvňujú predaj týchto energetických nápojov, a to ich prítomnosť a cena. Na určenie vplyvu ceny a prítomnosti dvoch energetických nápojov na úmysel zákazníkov nakúpiť môžeme použiť podmienenú pravdepodobnosť.

Aby sme to lepšie pochopili, pozrime sa na ten istý príklad, ktorý sa používa v marginálnom rozdelení:

Triedy 6. štandard 7. štandard 8. štandard Celkový počet študentov
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Vzorka údajov

Napríklad chcete zistiť rozdelenie žiakov 6. ročníka, ktorí získali trojku, vzhľadom na celkový počet žiakov. Jednoducho vydelíte počet žiakov 6. ročníka, ktorí získali trojku, celkovým počtom žiakov všetkých troch ročníkov, ktorí získali trojku.

Takže odpoveď bude b 4/19= 0,21

Ak ho vynásobíme stovkou, dostaneme 21 %.

Distribúcia bodov žiaka 7. ročníka je 7/19 = 0,37

Vynásobením 100 dostaneme 37 %.

A rozdelenie počtu bodov žiaka 8. ročníka je 8/19 = 0,42

Vynásobením 100 dostaneme 42,1 %.

Rozdiel medzi podmieneným a marginálnym rozdelením

Rozdiel medzi podmieneným a marginálnym rozdelením

Okrajové rozdelenie je rozdelenie premennej vzhľadom na celú vzorku, zatiaľ čo podmienené rozdelenie je rozdelenie premennej vzhľadom na inú premennú.

Marginálne rozdelenie je nezávislé od výsledkov druhej premennej. Inými slovami, je jednoducho nepodmienené.

Napríklad, ak je náhodná premenná "X" priradená pohlaviu detí v letnom tábore a ďalšia náhodná premenná "Y" je priradená veku týchto detí, potom,

Okrajové rozdelenie chlapcov v letnom tábore možno vyjadriť ako P(X=chlapci), zatiaľ čo podiel chlapcov mladších ako 8 rokov je daný podmieneným rozdelením ako P(X=chlapci

Záverečné myšlienky

Okrajové rozdelenie ukazuje pravdepodobnosti rôznych hodnôt premenných bez poukázania na iné premenné.

Podmienené rozdelenie je však pravdepodobnosť premennej, ktorá sa počíta vzhľadom na inú premennú.

Obe tieto teórie pravdepodobnosti sú správne a ich použitie sa líši v rôznych problémoch, prípadoch a scenároch.

Súvisiace články

    Mary Davis

    Mary Davis je spisovateľka, tvorkyňa obsahu a zanietená výskumníčka, ktorá sa špecializuje na porovnávaciu analýzu rôznych tém. S titulom žurnalistiky a viac ako päťročnými skúsenosťami v tejto oblasti má Mary vášeň pre poskytovanie nezaujatých a priamočiarych informácií svojim čitateľom. Jej láska k písaniu začala, keď bola mladá a bola hybnou silou jej úspešnej kariéry v písaní. Maryina schopnosť skúmať a prezentovať zistenia v ľahko pochopiteľnom a pútavom formáte si ju obľúbili čitatelia na celom svete. Keď Mary nepíše, rada cestuje, číta a trávi čas s rodinou a priateľmi.