조건부 분포와 한계 분포의 차이점(설명) – 모든 차이점

 조건부 분포와 한계 분포의 차이점(설명) – 모든 차이점

Mary Davis

확률은 주어진 데이터 집합에 대해 발생하는 특정 이벤트의 예측을 정량화하는 수학의 한 분야입니다. 원하는 결과를 얻을 가능성에 대한 수학적 해석을 제공합니다.

어떤 사건이 발생할 확률은 0과 1 사이입니다. 0은 해당 사건이 발생할 가능성 또는 가능성이 없음을 나타내고, 1은 특정 사건이 발생할 가능성이 100%임을 나타냅니다.

확률 연구를 통해 가능성을 예측하거나 판단할 수 있습니다.

예를 들어, 신제품을 테스트할 때 실패 확률이 높으면 품질이 낮은 제품을 의미합니다. 실패 또는 성공의 기회를 정량화하면 제조업체가 제품 품질과 경험을 개선하는 데 도움이 될 수 있습니다.

데이터 분석에서 한계 및 조건부 분포는 이변량 데이터에서 확률을 찾는 데 사용됩니다. 하지만 본격적으로 시작하기 전에 몇 가지 기본 사항을 살펴보겠습니다.

확률의 기본 사항

확률에서 자주 사용되는 용어는 '랜덤 변수'입니다. 임의 변수는 발생하는 임의 이벤트의 결과를 정량화하는 데 사용됩니다.

예를 들어, 학교는 이전 시험을 기반으로 다가오는 시험에서 학생들의 수학 성적을 예측하기 위해 연구를 수행합니다. 성능. 연구는 총 110개로 제한됩니다.6에서 8 표준까지의 학생. 임의의 변수 "X"가 얻은 등급으로 정의되는 경우. 다음 표는 수집된 데이터를 보여줍니다.

성적 학생 수
A+ 14
A- 29
B 35
C 19
D 8
E 5
총 학생 수: 110

데이터 샘플

P (X=A+) = 14/110 = 0.1273

또한보십시오: 이사, SVP, VP 및 조직 책임자의 주요 차이점은 무엇입니까? (설명) – 모든 차이점

0.1273 *100=12.7%

이는 약 12.7%의 학생들이 점수를 올릴 수 있음을 보여줍니다. 다가오는 시험에서 A+를 받을 수 있습니다.

학교에서 수업에 대한 학생들의 성적도 분석하고 싶다면 어떻게 해야 할까요? 그렇다면 A+를 받은 학생의 12.7% 중 8번째 기준에 속하는 학생은 몇 명입니까?

단일 확률 변수를 다루는 것은 매우 간단하지만 데이터가 두 개의 확률 변수에 대해 분포된 경우 , 계산이 약간 복잡할 수 있습니다.

또한보십시오: 개인 VS. 사유 재산 – 차이점은 무엇입니까? (설명) – 모든 차이점

이변량 데이터에서 관련 정보를 추출하는 가장 간단한 두 가지 방법은 한계 분포와 조건부 분포입니다.

확률의 기본을 시각적으로 설명하기 위한 동영상입니다. Math Antics에서:

Math Antics – 기본 확률

한계 분포란 무엇을 의미합니까?

한계 분포 또는 한계 확률은 다른 변수와 독립적인 변수의 분포입니다. 둘 중 하나에만 의존한다.다른 이벤트의 모든 가능성을 포함하면서 발생하는 이벤트.

데이터를 표 형식으로 표시하면 한계 분포의 개념을 이해하기가 더 쉽습니다. 마진이라는 용어는 여백에 따른 분포를 포함한다는 것을 나타냅니다.

다음 표는 6-8학년 학생 110명의 성적을 보여줍니다. 이 정보를 사용하여 다가오는 수학 시험의 성적을 예측할 수 있습니다.

등급 6급 7급 제8규격 총개수 학생 수
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
섭씨 4 7 8 19
D 1 3 4 8
E 0 3 2 5
합계 29 44 37 110

Data Sample

이 표 또는 샘플 데이터를 이용하여 전체 학생 수에 대한 성적의 주변 분포 또는 특정 기준의 학생 주변 분포를 계산할 수 있습니다.

주변분포를 계산할 때 두 번째 사건의 발생은 무시한다.

예를 들어 C학점을 받은 학생의 주변분포를 계산할 때각 학급의 학생 수를 합산하고 총 학생 수로 주사위를 굴립니다.

모든 기준에서 C를 받은 총 학생 수는 19명입니다.

6~8학년 기준 총 학생수로 나누면 19/110=0.1727

이 값에 100을 곱하면 17.27%가 된다.

17.27 전체 학생 중 %가 C를 획득했습니다.

또한 이 표를 사용하여 각 표준에서 학생의 한계 분포를 확인할 수 있습니다. 예를 들어, 6번째 표준에서 학생의 주변 분포는 29/110이며 0.2636을 제공합니다. 이 값에 100을 곱하면 26.36%가 됩니다.

마찬가지로 7학년과 8학년 학생의 한계 분포는 각각 40%와 33.6%입니다.

무엇 조건부 분포를 의미합니까?

이름으로 해석되는 조건부 배포는 기존 조건을 기반으로 합니다. 주어진 조건에서 다른 변수가 설정되는 동안 한 변수의 확률입니다.

조건부 분포를 사용하면 두 변수에 대한 샘플을 분석할 수 있습니다. 데이터 분석에서 이벤트 발생 가능성은 다른 요인의 영향을 받는 경우가 많습니다.

조건 확률은 표 형식의 데이터 표현을 사용합니다. 이렇게 하면 샘플 데이터의 시각화 및 분석이 향상됩니다.

예를 들어 평균 수명을 조사하는 경우인구의 범위에서 고려해야 할 두 가지 변수는 일일 평균 칼로리 섭취량과 신체 활동 빈도입니다. 조건부 확률은 일일 칼로리 섭취량이 2500kcal 이상이거나 그 반대인 경우 신체 활동이 인구의 평균 수명에 미치는 영향을 파악하는 데 도움이 될 수 있습니다.

일일 칼로리 섭취량 < 2500kcal, 조건을 걸었습니다. 이러한 조건을 바탕으로 신체활동이 평균수명에 미치는 영향을 판단할 수 있다.

또는 에너지드링크 두 브랜드의 판매 편차를 관찰하면서, 이러한 에너지 음료는 존재와 가격입니다. 조건부 확률을 사용하여 고객의 구매 의도에 대한 두 가지 에너지 드링크의 가격 및 존재 여부의 영향을 결정할 수 있습니다.

더 나은 이해를 위해 한계 분배에 사용된 동일한 예를 살펴보겠습니다.

등급 6급 7급 8급 총개수 ~의학생
A+ 7 5 2 14
A- 11 8 10 29
B 6 18 11 35
섭씨 4 7 8 19
D 1 3 4 8
E 0 3 2 5
합계 29 44 37 110

Data Sample

예를 들어, 전체 학생 수와 관련하여 C를 받은 6학년 학생의 분포를 찾고자 합니다. 6학년 기준에서 C를 받은 학생 수를 세 기준 모두에서 C를 받은 총 학생 수로 나누면 됩니다.

따라서 답은 b 4/19= 0.21<입니다. 5>

100을 곱하면 21%가 됩니다.

C를 받은 7등급 학생의 분포는 7/19= 0.37

100은 37%를 줍니다

그리고 C를 받은 8등급 학생의 분포는 8/19= 0.42

여기에 100을 곱하면 42.1%가 됩니다

조건부 분포와 주변 분포의 차이

조건부 분포와 주변 분포의 차이

주변 분포는 전체 표본에 대한 변수의 분포이며, 조건부 분포는 다른 변수에 대한 변수의 분포입니다.

주변 분포는 독립적입니다.다른 변수의 결과. 즉, 단순히 무조건적이다.

예를 들어, 여름 캠프에서 아이들의 성별에 임의의 변수 "X"가 지정되고 이들의 연령에 또 다른 임의의 변수 "Y"가 지정되면 그렇다면

여름캠프 남학생의 한계분포는 P(X=boys)로, 8세 미만 남학생의 비율은 P( X=소년

Mary Davis

Mary Davis는 다양한 주제에 대한 비교 분석을 전문으로 하는 작가, 콘텐츠 제작자 및 열렬한 연구원입니다. 저널리즘 학위와 현장에서 5년 이상의 경험을 가진 Mary는 독자들에게 편향되지 않고 솔직한 정보를 전달하는 데 열정을 가지고 있습니다. 그녀의 글쓰기에 대한 사랑은 어렸을 때부터 시작되었으며 성공적인 글쓰기 경력의 원동력이었습니다. 연구 결과를 이해하기 쉽고 매력적인 형식으로 연구하고 제시하는 Mary의 능력은 전 세계 독자들에게 그녀의 사랑을 받았습니다. 글을 쓰지 않을 때 Mary는 여행, 독서, 가족 및 친구들과 시간을 보내는 것을 즐깁니다.