Forskellen mellem betinget og marginal fordeling (forklaret) - Alle forskelle

 Forskellen mellem betinget og marginal fordeling (forklaret) - Alle forskelle

Mary Davis

Sandsynlighed er en gren af matematikken, der kvantificerer forudsigelsen af en bestemt begivenhed for et givet datasæt. Den giver en matematisk fortolkning af sandsynligheden for at opnå det ønskede resultat.

Sandsynligheden for, at en begivenhed indtræffer, ligger mellem nul og et. Nul betyder, at der ikke er nogen chance eller sandsynlighed for, at den pågældende begivenhed indtræffer, og et betyder, at sandsynligheden for, at en bestemt begivenhed indtræffer, er 100 %.

Studiet af sandsynlighed gør det muligt for os at forudsige eller bedømme chancerne for succes eller fiasko for en ønsket begivenhed og træffe foranstaltninger til at forbedre den.

Når man f.eks. tester et nyt produkt, er en høj sandsynlighed for fejl et tegn på et produkt af lav kvalitet. Ved at kvantificere chancerne for fejl eller succes kan man hjælpe producenterne med at forbedre deres produktkvalitet og erfaring.

Se også: Chidori VS Raikiri: Forskellen mellem dem - alle forskellene

I dataanalyser bruges marginal- og betingede fordelinger til at finde sandsynligheden i bivariate data. Men før vi går i gang med det, skal vi gennemgå nogle grundlæggende ting.

Grundlæggende om sandsynlighed

Et ofte anvendt begreb inden for sandsynlighed er "tilfældig variabel". En tilfældig variabel bruges til at kvantificere resultatet af en tilfældig begivenhed.

En skole gennemfører f.eks. en undersøgelse for at forudsige elevernes præstationer i matematik til de kommende eksamener på grundlag af deres tidligere præstationer. Undersøgelsen er begrænset til et samlet antal på 110 elever fra 6. til 8. klasse. Hvis en tilfældig variabel "X" defineres som de opnåede karakterer, viser følgende tabel de indsamlede data:

Klasserne Antal studerende
A+ 14
A- 29
B 35
C 19
D 8
E 5
Antal studerende i alt: 110

Dataprøve

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Det viser, at ca. 12,7 % af eleverne kan opnå op til A+ i deres kommende eksamener.

Hvad nu hvis skolerne også ønsker at analysere elevernes karakterer i forhold til deres klasser? Hvor mange af de 12,7 % af de elever, der opnår et A+, tilhører 8. klasse?

Det er ret enkelt at håndtere en enkelt tilfældig variabel, men når dine data er fordelt på to tilfældige variabler, kan beregningerne være lidt komplekse.

De to mest forenklede måder at udtrække relevant information fra bivariate data på er marginalfordeling og betinget fordeling.

Her er en video fra Math Antics, som visuelt forklarer det grundlæggende i sandsynlighed:

Math Antics - Grundlæggende sandsynlighed

Hvad forstås ved marginalfordeling?

Marginalfordeling eller marginal sandsynlighed er fordelingen af en variabel uafhængigt af den anden variabel. Den afhænger kun af, at en af de to hændelser indtræffer, mens alle mulighederne for den anden hændelse medregnes.

Det er lettere at forstå begrebet marginalfordeling, når dataene er repræsenteret i tabelform. Udtrykket marginal angiver, at det omfatter fordelingen langs marginalerne.

De følgende tabeller viser karaktererne for 110 elever fra 6-8. Vi kan bruge disse oplysninger til at forudsige en karakter for deres kommende matematikeksamen,

Klasserne 6. standard 7. standard 8. standard Antal studerende i alt
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Dataprøve

Ved hjælp af denne tabel eller stikprøvedata kan vi beregne den marginale fordeling af karaktererne i forhold til det samlede antal elever eller den marginale fordeling af eleverne i en bestemt standard.

Vi ser bort fra forekomsten af en anden begivenhed, når vi beregner den marginale fordeling.

Når vi f.eks. beregner den marginale fordeling af de studerende, der har fået et C i forhold til det samlede antal studerende, summerer vi simpelthen antallet af studerende for hver klasse på tværs af rækken og terninger værdien med det samlede antal studerende.

Det samlede antal elever, der opnåede et C i alle standarderne tilsammen, er 19.

Divideret med det samlede antal elever i 6.-8. klasse: 19/110=0,1727

Ved at gange værdien med 100 får man 17,27 %.

17,27% af alle elever opnåede et C.

Vi kan også bruge denne tabel til at bestemme den marginale fordeling af eleverne på de enkelte standarder. F.eks. er den marginale fordeling af eleverne på sjette standard 29/110, hvilket giver 0,2636. Ved at gange denne værdi med 100 får man 26,36 %.

På samme måde er den marginale fordeling af eleverne i 7. og 8. klasse henholdsvis 40 % og 33,6 %.

Hvad menes der med betingede fordelinger?

Betinget fordeling, som navnet antyder, er baseret på en eksisterende tilstand. Det er sandsynligheden for en variabel, mens den anden variabel er sat på en given tilstand.

Med betingede fordelinger kan du analysere din stikprøve med hensyn til to variabler. I dataanalyser er sandsynligheden for, at en begivenhed indtræffer, ofte påvirket af en anden faktor.

Betinget sandsynlighed anvender en tabelformet repræsentation af data, hvilket forbedrer visualiseringen og analysen af stikprøvedataene.

Hvis du f.eks. undersøger befolkningens gennemsnitlige levetid, kan to variabler, der skal tages i betragtning, være deres daglige gennemsnitlige kalorieindtag og hyppigheden af fysisk aktivitet. Betinget sandsynlighed kan hjælpe dig med at finde ud af, hvilken indvirkning fysisk aktivitet har på befolkningens gennemsnitlige levetid, hvis deres daglige kalorieindtag er over 2.500 kcal eller omvendt.

Da vi har fastsat det daglige kalorieindtag <2500kcal, har vi sat en betingelse. På grundlag af denne betingelse kan man bestemme den fysiske aktivitets indvirkning på den gennemsnitlige levetid.

Eller, når vi observerer salgsafvigelsen for to fremherskende mærker af energidrikke, er to variabler, der påvirker salget af disse energidrikke, deres tilstedeværelse og pris. Vi kan bruge betinget sandsynlighed til at bestemme indflydelsen af prisen og tilstedeværelsen af to energidrikke på kundernes købsintention.

For at forstå det bedre, skal vi se på det samme eksempel, som bruges i marginalfordelingen:

Klasserne 6. standard 7. standard 8. standard Antal studerende i alt
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Dataprøve

Hvis du f.eks. ønsker at finde fordelingen af elever på 6. standard, der har scoret et C, i forhold til det samlede antal elever, skal du blot dividere antallet af elever på 6. standard, der har scoret et C, med det samlede antal elever på alle tre standarder, der har scoret et C.

Svaret bliver altså 4/19= 0,21

Multiplikation med hundrede giver 21%.

Fordelingen af en elev på 7. klassetrin med et C er 7/19= 0,37

Ved at gange det med 100 får man 37 %.

Og fordelingen af en 8. klasses elev, der scorer et C, er 8/19= 0,42

Multiplikation med 100 giver 42,1 %.

Forskellen mellem betinget og marginal fordeling

Forskellen mellem betinget og marginalfordeling

Marginalfordelingen er fordelingen af en variabel i forhold til den samlede stikprøve, mens den betingede fordeling er fordelingen af en variabel i forhold til en anden variabel.

Marginalfordelingen er uafhængig af resultaterne af den anden variabel, dvs. den er simpelthen ubetinget.

Hvis en tilfældig variabel "X" f.eks. tildeles kønnet på børn i en sommerlejr, og en anden tilfældig variabel "Y" tildeles disse børns alder, så,

Se også: Hvor mærkbar er en højdeforskel på 3 tommer mellem to personer? - Alle forskelle

Den marginale fordeling af drenge i en sommerlejr kan gives ved P(X=drenge), mens andelen af drenge under 8 år er givet ved betinget fordeling som P(X=drenge

Sidste tanker

Marginalfordelingen viser sandsynlighederne for forskellige værdier af variablerne uden at pege på de andre variabler.

Betinget fordeling er imidlertid sandsynligheden for en variabel, som beregnes i forhold til en anden variabel.

Begge disse teorier om sandsynlighed er korrekte, men deres anvendelse varierer i forskellige problemer, tilfælde og scenarier.

Relaterede artikler

    Mary Davis

    Mary Davis er en forfatter, indholdsskaber og ivrig forsker med speciale i sammenligningsanalyse om forskellige emner. Med en grad i journalistik og over fem års erfaring på området, har Mary en passion for at levere upartisk og ligetil information til sine læsere. Hendes kærlighed til at skrive begyndte, da hun var ung og har været en drivkraft bag hendes succesfulde karriere som forfatter. Marys evne til at researche og præsentere resultater i et letforståeligt og engagerende format har gjort hende elsket af læsere over hele verden. Når hun ikke skriver, nyder Mary at rejse, læse og tilbringe tid med familie og venner.