Skillnaden mellan villkorlig och marginell fördelning (förklarad) - Alla skillnader

 Skillnaden mellan villkorlig och marginell fördelning (förklarad) - Alla skillnader

Mary Davis

Sannolikhet är en gren av matematiken som kvantifierar förutsägelsen av att en viss händelse inträffar för en given uppsättning data. Den ger en matematisk tolkning av sannolikheten för att uppnå det önskade resultatet.

Sannolikheten för att en händelse ska inträffa ligger mellan noll och ett. Noll innebär att det inte finns någon chans eller sannolikhet för att händelsen ska inträffa, och ett innebär att sannolikheten för att en viss händelse ska inträffa är 100 %.

Genom att studera sannolikhet kan vi förutsäga eller bedöma chanserna för att en önskad händelse ska lyckas eller misslyckas och vidta åtgärder för att förbättra den.

När man t.ex. testar en ny produkt innebär en hög sannolikhet för misslyckande att produkten är av låg kvalitet. Genom att kvantifiera chanserna för misslyckande eller framgång kan tillverkarna hjälpa dem att förbättra sin produktkvalitet och sina erfarenheter.

Inom dataanalys används marginal- och konditionsfördelningar för att hitta sannolikheten i bivariata data. Men innan vi går in på det ska vi gå igenom några grundläggande saker.

Grunderna i sannolikhet

En ofta använd term inom sannolikhetsområdet är "slumpvariabel". En slumpvariabel används för att kvantifiera utfallet av en slumpmässig händelse som inträffar.

Exempel: En skola genomför en undersökning för att förutsäga elevernas resultat i matematik i kommande prov, baserat på deras tidigare resultat. Undersökningen omfattar totalt 110 elever från sjätte till åttonde klass. Om en slumpmässig variabel "X" definieras som de erhållna betygen. Följande tabell visar de insamlade uppgifterna:

Årskurserna Antal studenter
A+ 14
A- 29
B 35
C 19
D 8
E 5
Antal studenter: 110

Dataexempel

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Detta visar att cirka 12,7 % av eleverna kan få upp till A+ i sina kommande prov.

Tänk om skolorna också vill analysera elevernas betyg i förhållande till deras klasser. Hur många av de 12,7 % av eleverna som får A+ tillhör då åttonde klass?

Det är ganska enkelt att hantera en enda slumpvariabel, men när dina data är fördelade med avseende på två slumpvariabler kan beräkningarna bli lite komplicerade.

De två mest förenklade sätten att utvinna relevant information ur bivariata data är marginal- och villkorlig fördelning.

Här är en video från Math Antics som visuellt förklarar grunderna i sannolikhet:

Math Antics - Grundläggande sannolikhet

Vad menas med marginalfördelning?

Marginalfördelning eller marginalsannolikhet är fördelningen av en variabel som är oberoende av den andra variabeln och som endast beror på att en av de två händelserna inträffar, samtidigt som den andra händelsen är helt utesluten.

Det är lättare att förstå begreppet marginalfördelning när data representeras i tabellform. Termen marginal anger att den omfattar fördelningen längs marginalerna.

Följande tabeller visar betygen för 110 elever från sjätte till åttonde klass. Vi kan använda denna information för att förutsäga deras betyg för det kommande matematikprovet,

Årskurserna 6:e standard 7:e standard 8:e standard Totalt antal studenter
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUMMA 29 44 37 110

Dataexempel

Med hjälp av denna tabell eller provdata kan vi beräkna marginalfördelningen av betygen i förhållande till det totala antalet elever eller marginalfördelningen av elever i en viss standard.

Vi bortser från en andra händelse när vi beräknar marginalfördelningen.

Se även: "Till" VS "Cc" i Gmail (jämförelse och kontrast) - alla skillnader

När vi till exempel beräknar marginalfördelningen av elever som fick C i förhållande till det totala antalet elever summerar vi helt enkelt antalet elever för varje klass över raden och slår ihop värdet med det totala antalet elever.

Det totala antalet elever som fick C i alla standarder tillsammans är 19.

Dividerat med det totala antalet elever i sjätte-8:e klass: 19/110=0,1727.

Genom att multiplicera värdet med 100 får man 17,27 %.

17,27 % av alla studenter fick C.

Vi kan också använda denna tabell för att fastställa den marginella fördelningen av eleverna i varje standard. Exempelvis är den marginella fördelningen av eleverna i den sjätte standarden 29/110, vilket ger 0,2636. Multiplicerar man detta värde med 100 får man 26,36 %.

På samma sätt är marginalfördelningen för eleverna i sjunde och åttonde klass 40 % respektive 33,6 %.

Vad menas med villkorlig fördelning?

Villkorlig fördelning, som namnet antyder, bygger på ett befintligt tillstånd. Det är sannolikheten för en variabel medan den andra variabeln är inställd på ett givet tillstånd.

Med hjälp av villkorliga fördelningar kan du analysera ditt urval med avseende på två variabler. I dataanalyser påverkas ofta sannolikheten för att en händelse ska inträffa av en annan faktor.

Villkorlig sannolikhet använder sig av tabeller för data, vilket förbättrar visualiseringen och analysen av provdata.

Om du till exempel undersöker befolkningens genomsnittliga livslängd kan två variabler att ta hänsyn till vara deras dagliga genomsnittliga kaloriintag och frekvensen av fysisk aktivitet. Konditionell sannolikhet kan hjälpa dig att räkna ut hur fysisk aktivitet påverkar befolkningens genomsnittliga livslängd om deras dagliga kaloriintag är över 2 500 kcal eller vice versa.

När vi fastställer det dagliga kaloriintaget <2500kcal, ställer vi ett villkor. Med utgångspunkt i detta villkor kan man fastställa vilken inverkan fysisk aktivitet har på den genomsnittliga livslängden.

Eller, när vi observerar försäljningsavvikelsen för två vanliga märken av energidrycker, är två variabler som påverkar försäljningen av dessa energidrycker deras närvaro och pris. Vi kan använda oss av villkorlig sannolikhet för att fastställa hur priset och närvaron av två energidrycker påverkar kundernas avsikt att köpa.

För att förstå bättre kan vi titta på samma exempel som används i marginalfördelningen:

Årskurserna 6:e standard 7:e standard 8:e standard Totalt antal studenter
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUMMA 29 44 37 110

Dataexempel

Om du t.ex. vill ta reda på hur många elever i sjätte standard som fått C i förhållande till det totala antalet elever delar du helt enkelt antalet elever i sjätte standard som fått C med det totala antalet elever i de tre standarderna som fått C.

Svaret blir alltså b 4/19= 0,21

Genom att multiplicera det med hundra får man 21 %.

Fördelningen av en elev med 7:e standard som får C är 7/19= 0,37.

Multiplicering med 100 ger 37 %.

Se även: Hur märkbar är en höjdskillnad på 3 tum mellan två personer? - All The Differences

Och fördelningen av en elev i åttonde klass som får ett C är 8/19= 0,42.

Multiplicering med 100 ger 42,1 %.

Skillnaden mellan villkorlig och marginell fördelning

Skillnaden mellan villkorlig och marginell fördelning

Marginalfördelning är fördelningen av en variabel med avseende på det totala urvalet, medan villkorlig fördelning är fördelningen av en variabel med avseende på en annan variabel.

Marginalfördelningen är oberoende av utfallet av den andra variabeln, dvs. den är helt enkelt ovillkorlig.

Om till exempel en slumpmässig variabel "X" tilldelas könet på barnen på ett sommarläger och en annan slumpmässig variabel "Y" tilldelas åldern på dessa barn,

Den marginella fördelningen av pojkar på ett sommarläger kan ges genom P(X=pojkar), medan andelen pojkar under 8 år ges genom en villkorlig fördelning som P(X=pojkar).

Avslutande tankar

Marginalfördelningen visar sannolikheten för olika värden på variablerna utan att peka på andra variabler.

Villkorlig fördelning är dock sannolikheten för en variabel som beräknas med hänsyn till en annan variabel.

Båda dessa teorier om sannolikhet är korrekta, men deras tillämpning skiljer sig åt i olika problem, fall och scenarier.

Relaterade artiklar

    Mary Davis

    Mary Davis är en författare, innehållsskapare och ivrig forskare som specialiserat sig på jämförelseanalyser i olika ämnen. Med en examen i journalistik och över fem års erfarenhet inom området har Mary en passion för att leverera opartisk och okomplicerad information till sina läsare. Hennes kärlek till att skriva började när hon var ung och har varit en drivande kraft bakom hennes framgångsrika karriär inom skrivandet. Marys förmåga att undersöka och presentera rön i ett lättförståeligt och engagerande format har gjort henne kär hos läsare över hela världen. När hon inte skriver tycker Mary om att resa, läsa och umgås med familj och vänner.