[엑셀 데이터 분석] 이항분포(binomial distribution) BINOMDIST
어떤 실험의 결과가 (성공, 실패) 또는 (합격, 불합격)과 같이 두 가지 결과 중 하나로 나타나는 경우의 시행을 베르누이 시행(Bernoulli trial)이라고 하고 두 값 중 하나의 값을 취할 수 있는 확률 변수를 베르누이 확률변수라고 한다.
- 베르누이 시행 :
- 각 시행의 결과는 성공(S) 또는 실패(F) 중의 하나로 나타난다.
- 매 시행에서의 성공확률을 p=P(S)로 나타낸다면 실패확률 q=1-p이다. 따라서 p+q=1이 된다.
- 각 시행은 독립이다. 즉, 한 시행에서의 성공 여부가 다음 시행의 성공확률에 영향을 미치지 않는다.
동일한 성공확률 p를 가진 베르누이 시행을 독립적으로 n회 반복하여 시행할 때 성공의 횟수를 X라 하면 확률변수 X는 이항분포를 따르고 X~B(n, p)로 표현한다.
이항확률변수로 표현할 수 있는 예는 다음과 같다.
1) 앞면이 나타날 확률이 p인 동전을 n회 던졌을 때 나타나는 앞면의 횟수
2) 공정한 주사위를 n회 던졌을 때 1의 눈이 나타나는 횟수
3) 불량률 p인 제품 더미 중에서 n개를 추출하였을 때 그 중에 포함되는 불량품의 개수
위의 예시와 같다. 동일한 확률 p를 가정한다는 것을 확인해야 한다.
그리고 위의 내용은 고등학교 수학의 순열과 조합에 자주 나오는 단골 내용이다.
엑셀에서 이항분포의 확률계산은 BINOMDIST 함수를 이용한다.
- BINOMDIST(number_s, trials, probability_s, cumulative) :
- number_s : 성공 횟수
- trials : 독립 시행횟수
- probability_s : 각 시행에서 성공확률
- cumulative : 함수형태를 결정하는 논리 값 1이면 누적확률질량함수 값을 계산하고, 0 이면 확률질량함수 값을 계산한다.
예제 1
4개의 동전을 던질 때 나타나는 앞면의 수를 확률변수 X라 하면 X~B(4, 0.5)가 되고 나타난 앞면의 수가 x일 때의 확률은 다음과 같다.
엑셀 수식은 "=BINOMDIST(x, 4, 0.5, 0)" 를 입력하면 된다.
예제 2
어느 생산 공정의 불량률이 5%일 때, 이 공정에서 임의로 10개를 추출하였을 때 이 중에서 불량품이 3개 이상 포함될 확률은?
전체 확률 1에서 불량품이 2개 이하일 확률을 빼면 된다. 2개 이하일 확률은 누적확률질량함수(논리 값 1)을 사용해서 구할 수 있다.
= 1 - BINOMDIST(2, 10, 0.5, 1)
참조: 엑셀데이터분석, 한국방송통신대학교 출판문화원, 조신섭 외 3명 공저
'Statictics & Math & Data Science > 엑셀 데이터 분석' 카테고리의 다른 글
[엑셀 데이터 분석] 포아송분포 POISSON (1) | 2018.08.15 |
---|---|
[엑셀 함수] NORMINV와 RAND함수로 정규분포 만들기 (0) | 2017.05.21 |