Diferencia entre distribución condicional y marginal (Explicación) - Todas las diferencias

 Diferencia entre distribución condicional y marginal (Explicación) - Todas las diferencias

Mary Davis

La probabilidad es una rama de las matemáticas que cuantifica la predicción de que ocurra un determinado suceso para un conjunto dado de datos. Da una interpretación matemática a la probabilidad de obtener el resultado deseado.

La probabilidad de que ocurra cualquier suceso está comprendida entre cero y uno. Cero significa que no hay ninguna posibilidad o probabilidad de que ocurra ese suceso, y uno representa que la probabilidad de que ocurra un determinado suceso es del 100%.

El estudio de la probabilidad nos permite predecir o juzgar las posibilidades de éxito o fracaso de cualquier acontecimiento deseado y tomar medidas para mejorarlo.

Por ejemplo, al probar un nuevo producto, una alta probabilidad de fracaso significa un producto de baja calidad. Cuantificar las probabilidades de fracaso o éxito puede ayudar a los fabricantes a mejorar la calidad y experiencia de sus productos.

En el análisis de datos, las distribuciones marginales y condicionales se utilizan para hallar la probabilidad en datos bivariantes. Pero antes de entrar en materia, repasemos algunos conceptos básicos.

Conceptos básicos de probabilidad

Un término de uso frecuente en probabilidad es "variable aleatoria". Una variable aleatoria se utiliza para cuantificar los resultados de un suceso aleatorio.

Por ejemplo, una escuela lleva a cabo una investigación para predecir el rendimiento de sus alumnos en Matemáticas en los próximos exámenes, basándose en su rendimiento anterior. La investigación se limita a un número total de 110 alumnos de 6º a 8º curso. Si se define una variable aleatoria "X" como las calificaciones obtenidas, la siguiente tabla muestra los datos recogidos:

Ver también: Saciado vs. Saciado (diferencia detallada) - Todas las diferencias
Grados Número de alumnos
A+ 14
A- 29
B 35
C 19
D 8
E 5
Total de estudiantes: 110

Muestra de datos

Ver también: Hickey vs. hematoma (¿hay alguna diferencia?) - Todas las diferencias

P(X=A+) = 14/110 = 0,1273

0.1273 *100=12.7%

Esto demuestra que alrededor del 12,7% de los estudiantes pueden obtener hasta un sobresaliente en sus próximos exámenes.

Entonces, ¿cuántos del 12,7% de los alumnos que obtienen un sobresaliente pertenecen al 8º curso?

Tratar con una sola variable aleatoria es bastante sencillo, pero cuando los datos se distribuyen con respecto a dos variables aleatorias, los cálculos pueden ser un poco complejos.

Las dos formas más simplificadas de extraer información relevante de datos bivariantes son la distribución marginal y la condicional.

Para explicar visualmente los fundamentos de la probabilidad, aquí tienes un vídeo de Math Antics:

Antics Matemáticas - Probabilidad básica

¿Qué se entiende por distribución marginal?

La distribución marginal o probabilidad marginal es la distribución de una variable independiente de la otra variable. Sólo depende de que ocurra uno de los dos sucesos, mientras que subsume todas las posibilidades del otro suceso.

Es más fácil entender el concepto de distribución marginal cuando los datos se representan en forma tabular. El término marginal denota que incluye la distribución a lo largo de los márgenes.

Las siguientes tablas muestran las calificaciones de 110 alumnos de 6º a 8º curso. Podemos utilizar esta información para predecir una calificación para su próximo examen de matemáticas,

Grados 6º curso 7º curso 8º curso Nº total de estudiantes
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Muestra de datos

Utilizando esta tabla o los datos de la muestra, podemos calcular la distribución marginal de las calificaciones con respecto al número total de alumnos o la distribución marginal de los alumnos en una norma específica.

No tenemos en cuenta la aparición de un segundo suceso al calcular la distribución marginal.

Por ejemplo, al calcular la distribución marginal de los alumnos que obtuvieron una C con respecto al número total de alumnos, simplemente sumamos el número de alumnos de cada clase en toda la fila y dividimos el valor por el número total de alumnos.

El número total de alumnos que obtuvieron una C en todos los estándares combinados es de 19.

Dividiéndolo por el número total de alumnos del 6º al 8º curso: 19/110=0,1727

Multiplicando el valor por 100 se obtiene el 17,27%.

El 17,27% del total de estudiantes obtuvo una C.

También podemos utilizar esta tabla para determinar la distribución marginal de los alumnos en cada nivel. Por ejemplo, la distribución marginal de los alumnos en 6º nivel es 29/110, lo que da 0,2636. Multiplicando este valor por 100 se obtiene el 26,36%.

Del mismo modo, la distribución marginal de los alumnos de 7º y 8º es del 40% y el 33,6%, respectivamente.

¿Qué se entiende por distribuciones condicionales?

La distribución condicional, como su nombre indica, se basa en una condición preexistente. Es la probabilidad de una variable mientras la otra variable se encuentra en una condición determinada.

Las distribuciones condicionales permiten analizar la muestra en relación con dos variables. En el análisis de datos, a menudo la probabilidad de que se produzca un suceso está influida por otro factor.

La probabilidad condicional utiliza la representación tabular de los datos, lo que mejora la visualización y el análisis de los datos de la muestra.

Por ejemplo, si está estudiando la esperanza media de vida de la población, dos variables a tener en cuenta pueden ser la ingesta media diaria de calorías y la frecuencia de la actividad física. La probabilidad condicional puede ayudarle a averiguar el impacto de la actividad física en la esperanza media de vida de la población si su ingesta diaria de calorías es superior a 2500 kcal o viceversa.

Al establecer la ingesta diaria de calorías <2500kcal, colocamos una condición. En función de esta condición, se puede determinar el impacto de las actividades físicas en la duración media de la vida.

O, al observar la desviación de las ventas de dos marcas predominantes de bebidas energéticas, dos variables que influyen en las ventas de estas bebidas energéticas son su presencia y su precio. Podemos utilizar la probabilidad condicional para determinar la influencia del precio y la presencia de dos bebidas energéticas en la intención de compra de los clientes.

Para entenderlo mejor, veamos el mismo ejemplo utilizado en la distribución marginal:

Grados 6º curso 7º curso 8º curso Nº total de estudiantes
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Muestra de datos

Por ejemplo, si desea hallar la distribución de los alumnos de 6º curso que han obtenido una C con respecto al número total de alumnos, sólo tiene que dividir el número de alumnos de 6º curso que han obtenido una C entre el número total de alumnos de los tres cursos que han obtenido una C.

Así que la respuesta será 4/19= 0.21

Multiplicándolo por cien da 21%.

La distribución de un alumno de 7º curso que obtiene una C es 7/19= 0,37

Multiplicado por 100 da 37%.

Y la distribución de un alumno de 8º curso que obtiene una C es 8/19= 0,42

Multiplicado por 100 da 42,1%.

Diferencia entre distribución condicional y marginal

Diferencia entre distribución condicional y marginal

La distribución marginal es la distribución de una variable con respecto a la muestra total, mientras que la distribución condicional es la distribución de una variable con respecto a otra variable.

La distribución marginal es independiente de los resultados de la otra variable, es decir, es simplemente incondicional.

Por ejemplo, si se asigna una variable aleatoria "X" al sexo de los niños de un campamento de verano y otra variable aleatoria "Y" a la edad de estos niños, entonces,

La distribución marginal de chicos en un campamento de verano puede darse por P(X=chicos), mientras que la proporción de chicos menores de 8 años viene dada por la distribución condicional como P(X=chicos

Reflexiones finales

La distribución marginal muestra las probabilidades de distintos valores de las variables sin señalar las demás variables.

Sin embargo, la distribución condicional es la probabilidad de una variable que se calcula con referencia a otra variable.

Ambas teorías de la probabilidad son correctas y su aplicación difiere en distintos problemas, casos y escenarios.

Artículos relacionados

    Mary Davis

    Mary Davis es escritora, creadora de contenido y ávida investigadora especializada en análisis comparativos sobre diversos temas. Con un título en periodismo y más de cinco años de experiencia en el campo, a Mary le apasiona brindar información imparcial y directa a sus lectores. Su amor por la escritura comenzó cuando era joven y ha sido la fuerza impulsora detrás de su exitosa carrera como escritora. La capacidad de Mary para investigar y presentar hallazgos en un formato atractivo y fácil de entender la ha granjeado el cariño de lectores de todo el mundo. Cuando no está escribiendo, a Mary le gusta viajar, leer y pasar tiempo con su familia y amigos.