본문 바로가기

통계학

[통계학] 이항분포(Binomial Distribution) (feat. 베르누이 실행)

안녕하세요? 앞줄학생입니다 : )


공장에서 생산품이 생산될 때 양품이 있을 것이고, 또 불량품이 나올텐데요!

우린 이렇게 0과 1로 나눌 수 있는 경우에 이항분포를 사용할 수 있습니다.

이항분포에 대해 자세히 배우기 전에 우리는 베르누이 실행(Bernoulli trial)에 대해서 알아야합니다.


베르누이 실행이란 앞서 말한 상황처럼 0과 1로 경우가 나뉘는 즉, 상호 배반적인 2가지 결과만을 기대할 수 있는 시행을 말합니다.

예를 들어 Yes/No, 남/녀, 양품/불량품 등이 있겠죠?

이를 내용을 기초로 성공을 1로, 실패를 0이라 한다면 


이렇게 공식을 정리할 수 있습니다.

p(x)는 확률을 의미하고, E(x)는 평균, Var(x)는 분산을 의미합니다.


이제 베르누이 실행에 대해 알아봤으니, 이항분포에 대해 알아보도록 해요!

이항분포는 X=n에서 베르누이 실행에서 성공이 발생한 횟수를 뜻합니다.

이때 각 실행은 독립된 사건으로 다음 실행에 있어 결과에 영향을 주지 않습니다. 독립적인 것이죠!

이항분포임을 보여주는 수식이 있는데 다음과 같습니다.


X는 확률변수, B는 이항분포(Binomial Distribution), n은 베르누이 실행에서의 성공횟수, p는 성공확률을 의미합니다.

이때 n과 p는 분포의 모양을 결정하는 파라미터입니다.


다음으로 이항분포의 확률질량함수를 알아봅시다!

참고로 확률질량함수는 이산확률변수와 상반되는 연속확률변수의 확률밀도함수와 대비되는 개념으로

특정 횟수에서의 확률 값을 구할 수 있도록하는 함수입니다.

(연속확률변수는 연속적이기에 특정지점에 대한 값을 구할 수 없습니다.)

그렇다면 확률질량함수는 어떻게 표현이 될까요?

다음과 같이 표현됩니다.


위의 확률질량함수는 n번 시행에서 성공이 x번 나올 때의 확률을 보여줍니다.

p값이 성공에 대한 확률이라면 1-p는 실패의 확률이라는 것도 자연스럽게 알게 됩니다.

우린 이 확률 질량함수를 통해 표본에 대한 확률도 구할 수 있습니다.

만약 n과 x가 괄호로 묶여있는 게 무엇인지 모르겠다면 다음 포스트를 먼저 보고 오셔야해요!


[통계학] - [통계학] 순열(Permutation)과 조합(Combination)


보고 오셨거나, 알고 계신다면 이를 이용한 예시를 보도록 할게요

한 농구팀의 자유투 성공확률이 80%라고 합니다. 이때 그 팀의 선수 5명을 뽑아 실패를 4번할 확률을 구해보시오.

이때 성공확률이 80%이므로 실패확률은 20%입니다. 실패할 확률을 구하는 것이므로 p값을 0.2로 설정합시다.

그리고 5명을 뽑으니 n값은 5가 될 것입니다. 그리고 실패가 4번이니 x값은 4가 됩니다.

이에 확률질량함수를 만들어보면 다음과 같습니다.

이해가 되나요?

이를 계산하게 되면 자유투 성공이 80%인 팀에서 5명을 뽑아 4번 실패할 확률이 가능한 건지 아닌 건지를 알 수 있습니다.


이해가 쉽게 되었나요?

질문있으시면 댓글 남겨주세요!

그럼 고생하셨습니다 : )