Unterschied zwischen bedingter und marginaler Verteilung (erklärt) - Alle Unterschiede

 Unterschied zwischen bedingter und marginaler Verteilung (erklärt) - Alle Unterschiede

Mary Davis

Die Wahrscheinlichkeit ist ein Teilgebiet der Mathematik, das die Vorhersage des Eintretens eines bestimmten Ereignisses für einen gegebenen Datensatz quantifiziert und die Wahrscheinlichkeit des Erreichens des gewünschten Ergebnisses mathematisch interpretiert.

Die Wahrscheinlichkeit, dass ein Ereignis eintritt, liegt zwischen null und eins. null bedeutet, dass es keine Chance oder Wahrscheinlichkeit gibt, dass dieses Ereignis eintritt, und eins bedeutet, dass die Wahrscheinlichkeit, dass ein bestimmtes Ereignis eintritt, 100% beträgt.

Siehe auch: Was ist der Unterschied zwischen Ischias und Meralgia Paresthetica? (erklärt) - Alle Unterschiede

Die Wahrscheinlichkeitsrechnung ermöglicht es uns, die Erfolgs- oder Misserfolgschancen eines gewünschten Ereignisses vorherzusagen oder zu beurteilen und Maßnahmen zu seiner Verbesserung zu ergreifen.

Bei der Erprobung eines neuen Produkts bedeutet beispielsweise eine hohe Ausfallwahrscheinlichkeit ein minderwertiges Produkt. Die Quantifizierung der Erfolgs- oder Misserfolgswahrscheinlichkeit kann den Herstellern helfen, ihre Produktqualität und -erfahrung zu verbessern.

In der Datenanalyse werden marginale und bedingte Verteilungen verwendet, um die Wahrscheinlichkeit in bivariaten Daten zu ermitteln. Doch bevor wir uns damit befassen, sollten wir einige Grundlagen erläutern.

Grundlagen der Wahrscheinlichkeitsrechnung

Ein häufig verwendeter Begriff in der Wahrscheinlichkeitsrechnung ist "Zufallsvariable". Eine Zufallsvariable wird verwendet, um die Ergebnisse eines zufällig eintretenden Ereignisses zu quantifizieren.

Ein Beispiel: Eine Schule führt eine Untersuchung durch, um die Leistungen ihrer Schüler in Mathematik in den bevorstehenden Prüfungen auf der Grundlage ihrer früheren Leistungen vorherzusagen. Die Untersuchung beschränkt sich auf eine Gesamtzahl von 110 Schülern der Klassen 6 bis 8. Wenn eine Zufallsvariable "X" als die erzielten Noten definiert wird, zeigt die folgende Tabelle die erhobenen Daten:

Klassen Anzahl der Studenten
A+ 14
A- 29
B 35
C 19
D 8
E 5
Studenten insgesamt: 110

Datenbeispiel

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Dies zeigt, dass etwa 12,7 % der Schülerinnen und Schüler in ihren bevorstehenden Prüfungen bis zu einer Eins plus erreichen können.

Was ist, wenn die Schulen auch die Noten der Schüler in Bezug auf ihre Klassen analysieren wollen? Wie viele der 12,7 % der Schüler, die eine Eins + erhalten haben, gehören dann zur 8.

Der Umgang mit einer einzelnen Zufallsvariablen ist recht einfach, aber wenn Ihre Daten in Bezug auf zwei Zufallsvariablen verteilt sind, können die Berechnungen etwas komplexer sein.

Die beiden einfachsten Möglichkeiten, relevante Informationen aus bivariaten Daten zu extrahieren, sind die marginale und die bedingte Verteilung.

Um die Grundlagen der Wahrscheinlichkeit visuell zu erklären, gibt es ein Video von Math Antics:

Math Antics - Grundlegende Wahrscheinlichkeitsrechnung

Was versteht man unter marginaler Verteilung?

Die Randverteilung oder Randwahrscheinlichkeit ist die Verteilung einer Variablen unabhängig von der anderen Variablen, d. h. sie hängt nur vom Eintreten eines der beiden Ereignisse ab, wobei alle Möglichkeiten des anderen Ereignisses berücksichtigt werden.

Das Konzept der Randverteilung ist leichter zu verstehen, wenn die Daten in tabellarischer Form dargestellt werden. Der Begriff "marginal" bedeutet, dass sie die Verteilung entlang der Ränder umfasst.

Die folgenden Tabellen zeigen die Noten von 110 Schülerinnen und Schülern der 6. bis 8. Klasse. Anhand dieser Informationen können wir die Note für die bevorstehende Mathematikprüfung vorhersagen,

Klassen 6. Klasse 7. Standard 8. Standard Gesamtzahl der Studenten
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUMME 29 44 37 110

Datenbeispiel

Anhand dieser Tabelle oder der Stichprobendaten können wir die Randverteilung der Noten in Bezug auf die Gesamtzahl der Schüler oder die Randverteilung der Schüler in einem bestimmten Standard berechnen.

Das Eintreten eines zweiten Ereignisses wird bei der Berechnung der Randverteilung nicht berücksichtigt.

Bei der Berechnung der marginalen Verteilung der Schüler, die eine Drei erhalten haben, in Bezug auf die Gesamtzahl der Schüler summieren wir beispielsweise einfach die Anzahl der Schüler für jede Klasse über die Zeile und würfeln den Wert mit der Gesamtzahl der Schüler.

Die Gesamtzahl der Schülerinnen und Schüler, die in allen Standards zusammen eine C erreicht haben, beträgt 19.

Dividiert durch die Gesamtzahl der Schüler in der 6-8. Klasse: 19/110=0,1727

Multipliziert man den Wert mit 100, erhält man 17,27 %.

17,27 % aller Schüler erreichten ein C.

Wir können diese Tabelle auch verwenden, um die Randverteilung der Schüler in jeder Norm zu bestimmen. Die Randverteilung der Schüler in der 6. Norm ist beispielsweise 29/110, was 0,2636 ergibt. Multipliziert man diesen Wert mit 100, erhält man 26,36 %.

In ähnlicher Weise liegt die marginale Verteilung der Schüler in der 7. und 8. Klasse bei 40 % bzw. 33,6 %.

Was ist mit bedingten Verteilungen gemeint?

Die bedingte Verteilung basiert, wie der Name schon sagt, auf einer vorgegebenen Bedingung, d. h. sie gibt die Wahrscheinlichkeit einer Variablen an, während die andere Variable auf eine bestimmte Bedingung eingestellt ist.

Mit Hilfe von bedingten Verteilungen können Sie Ihre Stichprobe in Bezug auf zwei Variablen analysieren. In der Datenanalyse wird die Wahrscheinlichkeit des Eintretens eines Ereignisses häufig durch einen anderen Faktor beeinflusst.

Die bedingte Wahrscheinlichkeit verwendet eine tabellarische Darstellung der Daten, was die Visualisierung und Analyse der Stichprobendaten verbessert.

Wenn Sie z. B. die durchschnittliche Lebensdauer der Bevölkerung untersuchen, können zwei Variablen berücksichtigt werden: die durchschnittliche tägliche Kalorienzufuhr und die Häufigkeit der körperlichen Betätigung. Mit Hilfe der bedingten Wahrscheinlichkeit können Sie herausfinden, wie sich die körperliche Betätigung auf die durchschnittliche Lebensdauer der Bevölkerung auswirkt, wenn die tägliche Kalorienzufuhr über 2500 kcal liegt oder umgekehrt.

Da wir die tägliche Kalorienzufuhr auf <2500kcal festgelegt haben, haben wir eine Bedingung gestellt, anhand derer die Auswirkungen körperlicher Aktivitäten auf die durchschnittliche Lebensspanne bestimmt werden können.

Siehe auch: Der Unterschied zwischen einem Italiener und einem Römer - Alle Unterschiede

Oder, wenn man die Verkaufsabweichung zweier gängiger Marken von Energydrinks betrachtet, sind zwei Variablen, die den Verkauf dieser Energydrinks beeinflussen, ihre Präsenz und ihr Preis. Wir können die bedingte Wahrscheinlichkeit verwenden, um den Einfluss des Preises und der Präsenz zweier Energydrinks auf die Kaufabsicht der Kunden zu bestimmen.

Zum besseren Verständnis betrachten wir das gleiche Beispiel, das in der Grenzverteilung verwendet wird:

Klassen 6. Klasse 7. Standard 8. Standard Gesamtzahl der Studenten
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUMME 29 44 37 110

Datenbeispiel

Wenn Sie z. B. die Verteilung der Schüler der 6. Klasse mit der Note C in Bezug auf die Gesamtzahl der Schüler ermitteln möchten, teilen Sie einfach die Anzahl der Schüler der 6.

Die Antwort lautet also 4/19= 0,21

Die Multiplikation mit hundert ergibt 21 %.

Die Verteilung eines Schülers der 7. Klasse, der ein C erreicht, ist 7/19= 0,37

Multipliziert mit 100 ergibt dies 37%.

Und die Verteilung eines Schülers der 8. Klasse, der ein C erreicht, ist 8/19= 0,42

Die Multiplikation mit 100 ergibt 42,1%.

Unterschied zwischen bedingter und marginaler Verteilung

Unterschied zwischen bedingter und marginaler Verteilung

Die Randverteilung ist die Verteilung einer Variablen in Bezug auf die gesamte Stichprobe, während die bedingte Verteilung die Verteilung einer Variablen in Bezug auf eine andere Variable ist.

Die marginale Verteilung ist unabhängig von den Ergebnissen der anderen Variablen, d. h. sie ist einfach unkonditional.

Wenn zum Beispiel eine Zufallsvariable "X" dem Geschlecht der Kinder in einem Ferienlager und eine andere Zufallsvariable "Y" dem Alter dieser Kinder zugeordnet ist, dann,

Die Randverteilung der Jungen in einem Ferienlager kann durch P(X=Jungen) angegeben werden, während der Anteil der Jungen unter 8 Jahren durch die bedingte Verteilung als P(X=Jungen) gegeben ist

Abschließende Überlegungen

Die Randverteilung zeigt die Wahrscheinlichkeiten verschiedener Werte der Variablen, ohne auf die anderen Variablen hinzuweisen.

Die bedingte Verteilung ist jedoch die Wahrscheinlichkeit einer Variablen, die in Bezug auf eine andere Variable berechnet wird.

Beide Wahrscheinlichkeitstheorien sind richtig, ihre Anwendung unterscheidet sich jedoch bei verschiedenen Problemen, Fällen und Szenarien.

Verwandte Artikel

    Mary Davis

    Mary Davis ist Autorin, Content-Erstellerin und begeisterte Forscherin, die sich auf Vergleichsanalysen zu verschiedenen Themen spezialisiert hat. Mit einem Abschluss in Journalismus und über fünf Jahren Erfahrung in diesem Bereich hat Mary eine Leidenschaft dafür, ihren Lesern unvoreingenommene und unkomplizierte Informationen zu liefern. Ihre Liebe zum Schreiben begann bereits in jungen Jahren und war eine treibende Kraft hinter ihrer erfolgreichen Karriere als Schriftstellerin. Marys Fähigkeit, zu recherchieren und Ergebnisse in einem leicht verständlichen und ansprechenden Format zu präsentieren, hat sie bei Lesern auf der ganzen Welt beliebt gemacht. Wenn sie nicht gerade schreibt, reist Mary gerne, liest und verbringt Zeit mit Familie und Freunden.