Pagkakaiba sa pagitan ng Conditional at Marginal Distribution (Explained) – Lahat ng Mga Pagkakaiba

 Pagkakaiba sa pagitan ng Conditional at Marginal Distribution (Explained) – Lahat ng Mga Pagkakaiba

Mary Davis

Ang probabilidad ay isang sangay ng matematika na sumusukat sa hula ng isang partikular na kaganapang nagaganap para sa isang ibinigay na hanay ng data. Nagbibigay ito ng mathematical na interpretasyon sa posibilidad na makuha ang ninanais na resulta.

Ang posibilidad ng anumang kaganapang naganap ay nasa pagitan ng zero at isa. Ang Zero ay nagsasaad na walang mga pagkakataon o posibilidad na mangyari ang kaganapang iyon, at ang isa ay kumakatawan na ang posibilidad ng isang partikular na kaganapan ay maganap ay 100%.

Ang pag-aaral ng probabilidad ay nagbibigay-daan sa atin na mahulaan o hatulan ang mga pagkakataon. ng tagumpay o kabiguan ng anumang nais na kaganapan at gumawa ng mga hakbang upang mapabuti ito.

Halimbawa, kapag sinusubukan ang isang bagong produkto, ang mataas na posibilidad ng pagkabigo ay nangangahulugan ng isang mababang kalidad na produkto. Ang pagbibilang ng mga pagkakataon ng pagkabigo o tagumpay ay makakatulong sa mga tagagawa na mapabuti ang kanilang kalidad at karanasan ng produkto.

Sa data analytics, ginagamit ang marginal at conditional distribution upang mahanap ang probabilidad sa bivariate na data. Ngunit bago tayo tumalon doon, dumaan tayo sa ilang pangunahing kaalaman.

Mga Pangunahing Kaalaman sa Probability

Ang isang madalas na ginagamit na termino sa posibilidad ay 'random variable'. Ang isang random na variable ay ginagamit upang i-quantify ang mga resulta ng isang random na kaganapan na nagaganap.

Halimbawa, ang isang paaralan ay nagsasagawa ng pananaliksik upang hulaan ang pagganap ng kanilang mga mag-aaral sa Matematika sa paparating na mga pagsusulit, batay sa kanilang nakaraang pagganap. Ang pananaliksik ay nakakulong sa kabuuang bilang na 110mga mag-aaral mula 6 hanggang 8 na pamantayan. Kung ang isang random na variable na "X" ay tinukoy bilang ang mga marka na nakuha. Ipinapakita ng sumusunod na talahanayan ang nakolektang data:

Mga Marka Bilang ng mga mag-aaral
A+ 14
A- 29
B 35
C 19
D 8
E 5
Kabuuang mga mag-aaral: 110

Sample ng Data

P (X=A+) = 14/110 = 0.1273

0.1273 *100=12.7%

Ito ay nagpapakita na humigit-kumulang 12.7% ng mga mag-aaral ang maaaring makakuha ng puntos sa isang A+ sa kanilang paparating na pagsusulit.

Paano kung gusto din ng mga paaralan na suriin ang mga grado ng mga mag-aaral na may kinalaman sa kanilang mga klase. Kaya ilan sa 12.7% ng mga mag-aaral na nakakuha ng A + ang nabibilang sa ika-8 pamantayan?

Ang pagharap sa isang random na variable ay medyo simple, ngunit kapag ang iyong data ay ipinamahagi nang may kinalaman sa dalawang random na variable , maaaring medyo kumplikado ang mga kalkulasyon.

Ang dalawang pinakapinasimpleng paraan ng pagkuha ng may-katuturang impormasyon mula sa bivariate na data ay marginal at conditional distribution.

Upang biswal na ipaliwanag ang mga pangunahing kaalaman ng probabilidad, narito ang isang video mula sa Math Antics:

Math Antics – Basic Probability

Ano ang Ibig Sabihin ng Marginal Distribution?

Ang marginal distribution o marginal na probability ay ang distribusyon ng isang variable na independyente sa iba pang variable. Depende lang sa isa sa dalawamga kaganapang nagaganap habang isinasaalang-alang ang lahat ng mga posibilidad ng iba pang kaganapan.

Mas madaling maunawaan ang konsepto ng marginal distribution kapag ang data ay kinakatawan sa isang tabular na anyo. Ang terminong marginal ay nagsasaad na kasama nito ang pamamahagi kasama ang mga margin.

Ipinapakita ng mga sumusunod na talahanayan ang mga marka ng 110 mag-aaral mula sa ika-6-8 na pamantayan. Magagamit namin ang impormasyong ito para mahulaan ang isang marka para sa kanilang paparating na pagsusulit sa matematika,

Mga Grado ika-6 na pamantayan ika-7 na pamantayan ika-8 na pamantayan Kabuuang blg. ng mga mag-aaral
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Sample ng Data

Gamit ang talahanayan o sample na data na ito, maaari naming kalkulahin ang marginal distribution ng mga marka na may kinalaman sa kabuuang bilang ng mga mag-aaral o marginal distribution ng mga mag-aaral sa isang partikular na pamantayan.

Hindi namin pinapansin ang paglitaw ng pangalawang kaganapan habang kinakalkula ang marginal distribution.

Halimbawa, habang kinakalkula ang marginal distribution ng mga mag-aaral na nakakuha ng C na may kinalaman sa kabuuang bilang ngmga mag-aaral, isasama lang namin ang bilang ng mga mag-aaral para sa bawat klase sa kabuuan ng hilera at i-dice ang halaga sa kabuuang bilang ng mga mag-aaral.

Ang kabuuang bilang ng mga mag-aaral na nakakuha ng C sa lahat ng pinagsama-samang pamantayan ay 19.

Ang paghahati nito sa kabuuang bilang ng mga mag-aaral sa ika-6-8 na pamantayan: 19/110=0.1727

Ang pag-multiply ng value na may 100 ay nagbibigay ng 17.27%.

17.27 % ng kabuuang mga mag-aaral na nakamit ang isang C.

Maaari rin nating gamitin ang talahanayang ito upang matukoy ang marginal distribution ng mga mag-aaral sa bawat pamantayan. Halimbawa, ang marginal distribution ng mga mag-aaral sa ika-6 na pamantayan ay 29/110, na nagbibigay ng 0.2636. Ang pagpaparami ng halagang ito sa 100 ay nagbibigay ng 26.36%.

Katulad nito, ang marginal distribution ng mga mag-aaral sa ika-7 at ika-8 na pamantayan ay 40% at 33.6%, ayon sa pagkakabanggit.

Ano Ang ibig sabihin ay may kondisyon na mga pamamahagi?

Ang kondisyong pamamahagi ayon sa kahulugan ng pangalan, ay batay sa isang umiiral nang kundisyon. Ito ang posibilidad ng isang variable habang ang isa pang variable ay nakatakda sa isang partikular na kundisyon.

Ang mga kondisyong pamamahagi ay nagbibigay-daan sa iyo na suriin ang iyong sample tungkol sa dalawang variable. Sa data analytics, kadalasan ang posibilidad ng isang kaganapan ay naiimpluwensyahan ng isa pang salik.

Ginagamit ng conditional probability ang tabular na representasyon ng data. Pinapabuti nito ang visualization at pagsusuri ng sample na data.

Halimbawa, kung sinusuri mo ang average na buhayspan ng populasyon, dalawang variable na dapat isaalang-alang, ang kanilang pang-araw-araw na average na calorie intake, at ang dalas ng pisikal na aktibidad. Makakatulong sa iyo ang conditional probability na malaman ang epekto ng pisikal na aktibidad sa average na tagal ng buhay ng populasyon kung ang kanilang pang-araw-araw na calorie intake ay higit sa 2500kcal o vice versa.

Tingnan din: Ano ang Pagkakaiba sa Iyo ng 9-Year Edad sa Mag-asawa? (Alamin) – Lahat ng Mga Pagkakaiba

Habang itinakda namin ang pang-araw-araw na calorie intake < 2500kcal, naglagay kami ng kondisyon. Batay sa kundisyong ito, matutukoy ang epekto ng mga pisikal na aktibidad sa average na haba ng buhay.

O, habang inoobserbahan ang paglihis ng benta ng dalawang nangingibabaw na tatak ng mga inuming pang-enerhiya, dalawang variable na nakakaimpluwensya sa mga benta ng ang mga inuming enerhiya na ito ay ang kanilang presensya at presyo. Magagamit natin ang conditional probability para matukoy ang impluwensya ng presyo at pagkakaroon ng dalawang energy drink sa layunin ng pagbili ng mga customer.

Para mas maunawaan, tingnan natin ang parehong halimbawang ginamit sa marginal distribution:

Mga Grado ika-6 na pamantayan ika-7 na pamantayan ika-8 na pamantayan Kabuuang blg. ngmag-aaral
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
C 4 7 8 19
D 1 3 4 8
E 0 3 2 5
SUM 29 44 37 110

Sample ng Data

Halimbawa, gusto mong hanapin ang distribusyon ng ika-6 na pamantayang mag-aaral na nakakuha ng C, tungkol sa kabuuang bilang ng mga mag-aaral. Hatiin mo lang ang bilang ng mga mag-aaral sa ika-6 na pamantayan na nakakuha ng C sa kabuuang bilang ng mga mag-aaral sa lahat ng tatlong pamantayan na nakakuha ng C.

Kaya ang sagot ay b 4/19= 0.21

Ang pagpaparami nito sa isang daan ay nagbibigay ng 21%

Ang distribusyon ng isang ika-7 pamantayang mag-aaral na nakakuha ng C ay 7/19= 0.37

Ang pagpaparami nito sa Ang 100 ay nagbibigay ng 37%

At ang distribusyon ng isang ika-8 pamantayang mag-aaral na nakakuha ng C ay 8/19= 0.42

Ang pag-multiply nito sa 100 ay nagbibigay ng 42.1%

Pagkakaiba sa pagitan ng Conditional at Marginal Distribution

Pagkakaiba sa pagitan ng conditional at marginal distribution

Ang marginal distribution ay ang distribution ng isang variable na may kinalaman sa kabuuang sample, habang ang conditional distribution ay ang distribusyon ng isang variable tungkol sa isa pang variable.

Ang marginal distribution ay independyenteng mga kinalabasan ng iba pang variable. Sa madaling salita, ito ay walang kundisyon.

Halimbawa, kung ang isang random na variable na "X" ay itinalaga sa kasarian ng mga bata sa isang summer camp at isa pang random na variable na "Y" ay itinalaga sa edad ng mga ito mga bata noon,

Ang marginal distribution ng mga lalaki sa isang summer camp ay maaaring ibigay ng P(X=boys), samantalang ang proporsyon ng mga batang lalaki na wala pang 8 taong gulang ay ibinibigay sa pamamagitan ng conditional distribution bilang P( X=mga lalaki

Tingnan din: Ano ang Pagkakaiba sa pagitan ng Chubby At Fat? (Kapaki-pakinabang) - Lahat ng Mga Pagkakaiba

Mary Davis

Si Mary Davis ay isang manunulat, tagalikha ng nilalaman, at masugid na mananaliksik na dalubhasa sa pagsusuri ng paghahambing sa iba't ibang paksa. Sa isang degree sa journalism at higit sa limang taon ng karanasan sa larangan, si Mary ay may hilig sa paghahatid ng walang pinapanigan at tuwirang impormasyon sa kanyang mga mambabasa. Ang kanyang pagmamahal sa pagsusulat ay nagsimula noong siya ay bata pa at naging isang puwersang nagtutulak sa kanyang matagumpay na karera sa pagsusulat. Ang kakayahan ni Mary na magsaliksik at magpakita ng mga natuklasan sa isang madaling maunawaan at nakakaengganyo na format ay nagpamahal sa kanya ng mga mambabasa sa buong mundo. Kapag hindi siya nagsusulat, nasisiyahan si Mary sa paglalakbay, pagbabasa, at paggugol ng oras kasama ang pamilya at mga kaibigan.