Rozdíl mezi podmíněným a mezním rozdělením (vysvětlení) - Všechny rozdíly

 Rozdíl mezi podmíněným a mezním rozdělením (vysvětlení) - Všechny rozdíly

Mary Davis

Pravděpodobnost je odvětví matematiky, které kvantifikuje předpověď výskytu určité události pro daný soubor dat. Podává matematickou interpretaci pravděpodobnosti dosažení požadovaného výsledku.

Pravděpodobnost, že nastane nějaká událost, se pohybuje mezi nulou a jedničkou. Nula znamená, že neexistuje žádná šance nebo pravděpodobnost, že daná událost nastane, a jednička znamená, že pravděpodobnost výskytu určité události je 100 %.

Studium pravděpodobnosti nám umožňuje předvídat nebo odhadovat šance na úspěch či neúspěch jakékoli požadované události a přijímat opatření k jejímu zlepšení.

Například při testování nového výrobku znamená vysoká pravděpodobnost selhání nekvalitní výrobek. Kvantifikace šancí na selhání nebo úspěch může výrobcům pomoci zlepšit kvalitu a zkušenosti s výrobkem.

V datové analytice se ke zjištění pravděpodobnosti v dvourozměrných datech používají marginální a podmíněná rozdělení. Než se však na to vrhneme, projdeme si několik základních informací.

Základy pravděpodobnosti

Často používaným pojmem v pravděpodobnosti je "náhodná veličina". Náhodná veličina se používá pro kvantifikaci výsledků náhodné události.

Například škola provádí výzkum s cílem předpovědět výsledky svých žáků v matematice v nadcházejících zkouškách na základě jejich předchozích výsledků. Výzkum je omezen na celkový počet 110 žáků 6. až 8. ročníku. Pokud je náhodná proměnná "X" definována jako získané známky. Následující tabulka ukazuje shromážděná data:

Viz_také: Předprodej vstupenek VS Normální vstupenky: Který je levnější? - Všechny rozdíly
Třídy Počet studentů
A+ 14
A- 29
B 35
C 19
D 8
E 5
Celkový počet studentů: 110

Vzorek dat

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Z toho vyplývá, že přibližně 12,7 % studentů může v nadcházejících zkouškách získat až A+.

Co když školy chtějí analyzovat i známky žáků s ohledem na jejich třídy. Kolik z 12,7 % žáků, kteří získali jedničku s hvězdičkou, tedy patří do 8. ročníku?

Práce s jednou náhodnou proměnnou je poměrně jednoduchá, ale pokud jsou data rozdělena s ohledem na dvě náhodné proměnné, mohou být výpočty poněkud složitější.

Dva nejjednodušší způsoby, jak získat relevantní informace z dvourozměrných dat, jsou marginální a podmíněné rozdělení.

Pro názorné vysvětlení základů pravděpodobnosti je zde video od Math Antics:

Math Antics - Základy pravděpodobnosti

Co znamená mezní rozdělení?

Mezní rozdělení neboli mezní pravděpodobnost je rozdělení proměnné nezávislé na jiné proměnné. Závisí pouze na tom, zda nastane jedna ze dvou událostí, přičemž supluje všechny možnosti druhé události.

Je snazší pochopit pojem marginálního rozdělení, když jsou data znázorněna v tabulkové formě. Termín marginální označuje, že zahrnuje rozdělení podél okrajů.

V následujících tabulkách jsou uvedeny známky 110 žáků 6.-8. ročníku. Tyto informace můžeme použít k předpovědi známky pro jejich nadcházející zkoušku z matematiky,

Třídy 6. standard 7. standard 8. standard Celkový počet studentů
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Vzorek dat

Na základě této tabulky nebo výběrových údajů můžeme vypočítat mezní rozdělení známek vzhledem k celkovému počtu žáků nebo mezní rozdělení žáků v určité normě.

Při výpočtu mezního rozdělení nebereme v úvahu výskyt druhé události.

Například při výpočtu mezního rozdělení studentů, kteří získali trojku, vzhledem k celkovému počtu studentů jednoduše sečteme počet studentů pro každou třídu v řádku a tuto hodnotu vynásobíme celkovým počtem studentů.

Celkový počet studentů, kteří získali trojku ze všech standardů dohromady, je 19.

Děleno celkovým počtem žáků v 6.-8. ročníku: 19/110=0,1727.

Vynásobením této hodnoty číslem 100 získáme 17,27 %.

17,27 % z celkového počtu studentů dosáhlo trojky.

Pomocí této tabulky můžeme také určit mezní rozdělení žáků v jednotlivých standardech. Například mezní rozdělení žáků v 6. standardu je 29/110, což dává 0,2636. Vynásobením této hodnoty 100 získáme 26,36 %.

Podobně je tomu i u okrajového rozložení žáků v 7. a 8. ročníku, které činí 40 %, resp. 33,6 %.

Co znamená podmíněné rozdělení?

Podmíněné rozdělení, jak se vykládá podle názvu, je založeno na předem dané podmínce. Je to pravděpodobnost jedné proměnné, zatímco druhá proměnná je nastavena na danou podmínku.

Podmíněná rozdělení umožňují analyzovat vzorek týkající se dvou proměnných. V datové analytice je pravděpodobnost výskytu události často ovlivněna jiným faktorem.

Podmíněná pravděpodobnost využívá tabulkovou reprezentaci dat. To zlepšuje vizualizaci a analýzu výběrových dat.

Pokud například zjišťujete průměrnou délku života populace, můžete vzít v úvahu dvě proměnné: průměrný denní příjem kalorií a četnost fyzické aktivity. Podmíněná pravděpodobnost vám pomůže zjistit, jaký vliv má fyzická aktivita na průměrnou délku života populace, pokud je její denní příjem kalorií vyšší než 2500 kcal, nebo naopak.

Vzhledem k tomu, že jsme stanovili denní příjem kalorií <2500kcal, položili jsme podmínku. Na základě této podmínky lze určit vliv pohybových aktivit na průměrnou délku života.

Nebo při sledování odchylek prodeje dvou převládajících značek energetických nápojů jsou dvě proměnné, které ovlivňují prodej těchto energetických nápojů, jejich přítomnost a cena. Pomocí podmíněné pravděpodobnosti můžeme určit vliv ceny a přítomnosti dvou energetických nápojů na záměr zákazníků nakupovat.

Pro lepší pochopení se podívejme na stejný příklad, který se používá v okrajovém rozdělení:

Viz_také: Rozdíl mezi vzácností zbraní ve Fortnite (vysvětlení!) - všechny rozdíly
Třídy 6. standard 7. standard 8. standard Celkový počet studentů
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Vzorek dat

Například chcete zjistit rozložení žáků 6. standardu, kteří získali trojku, vzhledem k celkovému počtu žáků. Jednoduše vydělíte počet žáků 6. standardu, kteří získali trojku, celkovým počtem žáků všech tří standardů, kteří získali trojku.

Takže odpověď bude b 4/19= 0,21

Vynásobením stovkou získáme 21 %.

Rozdělení žáka 7. ročníku, který získá trojku, je 7/19 = 0,37.

Vynásobením 100 získáme 37 %.

A rozložení počtu bodů žáka 8. ročníku je 8/19 = 0,42.

Vynásobením 100 získáme 42,1 %.

Rozdíl mezi podmíněným a mezním rozdělením

Rozdíl mezi podmíněným a mezním rozdělením

Okrajové rozdělení je rozdělení proměnné vzhledem k celkovému vzorku, zatímco podmíněné rozdělení je rozdělení proměnné vzhledem k jiné proměnné.

Mezní rozdělení je nezávislé na výsledcích druhé proměnné. Jinými slovy, je jednoduše nepodmíněné.

Pokud je například náhodná proměnná "X" přiřazena pohlaví dětí na letním táboře a další náhodná proměnná "Y" je přiřazena věku těchto dětí, pak,

Okrajové rozdělení chlapců na letním táboře může být dáno vztahem P(X=chlapci), zatímco podíl chlapců mladších 8 let je dán podmíněným rozdělením jako P(X=chlapci).

Závěrečné myšlenky

Okrajové rozdělení ukazuje pravděpodobnosti různých hodnot proměnných, aniž by poukazovalo na jiné proměnné.

Podmíněné rozdělení je však pravděpodobnost proměnné, která se počítá s ohledem na jinou proměnnou.

Obě tyto teorie pravděpodobnosti jsou správné a jejich použití se liší v různých problémech, případech a scénářích.

Související články

    Mary Davis

    Mary Davis je spisovatelka, tvůrkyně obsahu a zanícená výzkumnice specializující se na srovnávací analýzy různých témat. S titulem v oboru žurnalistiky a více než pětiletými zkušenostmi v oboru má Mary vášeň pro poskytování nezaujatých a přímých informací svým čtenářům. Její láska ke psaní začala, když byla mladá a byla hnacím motorem její úspěšné spisovatelské kariéry. Maryina schopnost zkoumat a prezentovat poznatky ve snadno srozumitelném a poutavém formátu si ji oblíbili čtenáři po celém světě. Když Mary nepíše, ráda cestuje, čte a tráví čas s rodinou a přáteli.