Différence entre distribution conditionnelle et distribution marginale (expliquée) - Toutes les différences

 Différence entre distribution conditionnelle et distribution marginale (expliquée) - Toutes les différences

Mary Davis

La probabilité est une branche des mathématiques qui quantifie la prédiction d'un certain événement pour un ensemble de données donné. Elle donne une interprétation mathématique à la probabilité d'obtenir le résultat souhaité.

La probabilité qu'un événement se produise est comprise entre zéro et un. zéro signifie qu'il n'y a aucune chance ou probabilité que cet événement se produise, et un signifie que la probabilité qu'un certain événement se produise est de 100 %.

L'étude des probabilités nous permet de prédire ou d'évaluer les chances de succès ou d'échec d'un événement souhaité et de prendre des mesures pour l'améliorer.

Par exemple, lors de l'essai d'un nouveau produit, une forte probabilité d'échec signifie que le produit est de mauvaise qualité. La quantification des chances d'échec ou de réussite peut aider les fabricants à améliorer la qualité et l'expérience de leurs produits.

Dans le domaine de l'analyse des données, les distributions marginales et conditionnelles sont utilisées pour déterminer la probabilité des données bivariées. Mais avant d'aborder ce sujet, passons en revue quelques notions de base.

Les bases de la probabilité

Un terme fréquemment utilisé en probabilité est celui de "variable aléatoire", qui sert à quantifier les résultats d'un événement aléatoire.

Par exemple, une école mène une recherche pour prédire les performances de ses élèves en mathématiques lors des prochains examens, sur la base de leurs performances antérieures. La recherche est limitée à un nombre total de 110 élèves de la 6e à la 8e année. Si une variable aléatoire "X" est définie comme les notes obtenues, le tableau suivant montre les données collectées :

Notes Nombre d'étudiants
A+ 14
A- 29
B 35
C 19
D 8
E 5
Nombre total d'étudiants : 110

Échantillon de données

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Cela montre qu'environ 12,7 % des étudiants peuvent obtenir jusqu'à A+ lors de leurs prochains examens.

Et si les écoles voulaient aussi analyser les notes des élèves par rapport à leurs classes, combien des 12,7 % d'élèves ayant obtenu un A+ appartiennent à la 8e classe ?

Traiter une seule variable aléatoire est assez simple, mais lorsque vos données sont distribuées en fonction de deux variables aléatoires, les calculs peuvent s'avérer un peu plus complexes.

Les deux façons les plus simples d'extraire des informations pertinentes à partir de données à deux variables sont la distribution marginale et la distribution conditionnelle.

Pour expliquer visuellement les bases de la probabilité, voici une vidéo de Math Antics :

Math Antics - Probabilités de base

Qu'entend-on par distribution marginale ?

La distribution marginale ou probabilité marginale est la distribution d'une variable indépendante de l'autre variable. Elle ne dépend que de l'occurrence de l'un des deux événements tout en subsumant toutes les possibilités de l'autre événement.

Il est plus facile de comprendre le concept de distribution marginale lorsque les données sont représentées sous forme de tableau. Le terme marginal indique qu'il inclut la distribution le long des marges.

Les tableaux suivants montrent les notes de 110 élèves de la 6e à la 8e année. Nous pouvons utiliser ces informations pour prédire la note qu'ils obtiendront lors de leur prochain examen de mathématiques,

Notes 6ème niveau 7ème niveau 8ème niveau Nombre total d'étudiants
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SOMME 29 44 37 110

Échantillon de données

En utilisant ce tableau ou les données de l'échantillon, nous pouvons calculer la distribution marginale des notes par rapport au nombre total d'étudiants ou la distribution marginale des étudiants dans une norme spécifique.

Nous ne tenons pas compte de l'occurrence d'un deuxième événement lors du calcul de la distribution marginale.

Par exemple, en calculant la distribution marginale des étudiants ayant obtenu un C par rapport au nombre total d'étudiants, nous additionnons simplement le nombre d'étudiants pour chaque classe sur toute la ligne et nous dédoublons la valeur avec le nombre total d'étudiants.

Voir également: Ymail.com vs. Yahoo.com (Quelle est la différence ?) - Toutes les différences

Le nombre total d'étudiants ayant obtenu un C dans toutes les normes combinées est de 19.

En le divisant par le nombre total d'élèves dans la classe 6-8 : 19/110=0,1727

En multipliant la valeur par 100, on obtient 17,27 %.

17,27% des étudiants ont obtenu un C.

Nous pouvons également utiliser ce tableau pour déterminer la distribution marginale des élèves dans chaque norme. Par exemple, la distribution marginale des élèves dans la 6e norme est de 29/110, ce qui donne 0,2636. En multipliant cette valeur par 100, on obtient 26,36 %.

De même, la distribution marginale des étudiants en 7e et 8e année est respectivement de 40 % et 33,6 %.

Qu'entend-on par distributions conditionnelles ?

La distribution conditionnelle, comme son nom l'indique, est basée sur une condition préexistante. Il s'agit de la probabilité d'une variable lorsque l'autre variable est fixée à une condition donnée.

Les distributions conditionnelles vous permettent d'analyser votre échantillon en fonction de deux variables. Dans l'analyse des données, la probabilité qu'un événement se produise est souvent influencée par un autre facteur.

La probabilité conditionnelle utilise la représentation tabulaire des données, ce qui améliore la visualisation et l'analyse des données de l'échantillon.

Par exemple, si vous étudiez la durée de vie moyenne d'une population, deux variables peuvent être prises en compte : l'apport calorique moyen quotidien et la fréquence de l'activité physique. La probabilité conditionnelle peut vous aider à déterminer l'impact de l'activité physique sur la durée de vie moyenne de la population si l'apport calorique quotidien est supérieur à 2 500 kcal ou vice versa.

En fixant l'apport calorique journalier à 2500 kcal, nous avons posé une condition qui permet de déterminer l'impact de l'activité physique sur la durée de vie moyenne.

Par exemple, en observant la déviation des ventes de deux marques dominantes de boissons énergisantes, deux variables qui influencent les ventes de ces boissons énergisantes sont leur présence et leur prix. Nous pouvons utiliser les probabilités conditionnelles pour déterminer l'influence du prix et de la présence de deux boissons énergisantes sur l'intention d'achat des clients.

Pour mieux comprendre, prenons le même exemple que celui utilisé dans la distribution marginale :

Notes 6ème niveau 7ème niveau 8ème niveau Nombre total d'étudiants
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SOMME 29 44 37 110

Échantillon de données

Par exemple, si l'on veut connaître la répartition des élèves de 6e année ayant obtenu un C, par rapport au nombre total d'élèves, il suffit de diviser le nombre d'élèves de 6e année ayant obtenu un C par le nombre total d'élèves ayant obtenu un C dans les trois niveaux.

La réponse sera donc 4/19= 0,21

En le multipliant par cent, on obtient 21 %.

La distribution d'un élève de 7e année ayant obtenu un C est de 7/19 = 0,37.

En le multipliant par 100, on obtient 37 %

Et la distribution d'un élève de 8e année ayant obtenu un C est de 8/19 = 0,42.

Voir également: Quelle est la différence entre la fréquence et la fréquence angulaire (en profondeur) - Toutes les différences

En le multipliant par 100, on obtient 42,1 %.

Différence entre distribution conditionnelle et distribution marginale

Différence entre distribution conditionnelle et distribution marginale

La distribution marginale est la distribution d'une variable par rapport à l'échantillon total, tandis que la distribution conditionnelle est la distribution d'une variable par rapport à une autre variable.

La distribution marginale est indépendante des résultats de l'autre variable. En d'autres termes, elle est tout simplement inconditionnelle.

Par exemple, si une variable aléatoire "X" est attribuée au sexe des enfants d'une colonie de vacances et qu'une autre variable aléatoire "Y" est attribuée à l'âge de ces enfants, alors..,

La distribution marginale des garçons dans un camp d'été peut être donnée par P(X=garçons), tandis que la proportion de garçons de moins de 8 ans est donnée par la distribution conditionnelle P(X=garçons).

Dernières réflexions

La distribution marginale indique les probabilités des différentes valeurs des variables sans indiquer les autres variables.

En revanche, la distribution conditionnelle est la probabilité d'une variable calculée en fonction d'une autre variable.

Ces deux théories de la probabilité sont correctes et leur application diffère selon les problèmes, les cas et les scénarios.

Articles connexes

    Mary Davis

    Mary Davis est une écrivaine, une créatrice de contenu et une chercheuse passionnée spécialisée dans l'analyse comparative sur divers sujets. Avec un diplôme en journalisme et plus de cinq ans d'expérience dans le domaine, Mary a la passion de fournir des informations impartiales et directes à ses lecteurs. Son amour pour l'écriture a commencé quand elle était jeune et a été une force motrice derrière sa carrière réussie dans l'écriture. La capacité de Mary à rechercher et à présenter les résultats dans un format facile à comprendre et engageant l'a fait aimer des lecteurs du monde entier. Lorsqu'elle n'écrit pas, Mary aime voyager, lire et passer du temps avec sa famille et ses amis.