[엑셀 데이터 분석] 포아송분포 POISSON


포아송분포는 사무실에 한 시간 동안 전화가 걸려 오는 횟수, 고속도로 상에서 하루 동안 발생하는 교통사고의 수와 같이 특정한 사건이 일어날 확률이 아주 작은 경우에 사용하는 확률 모델이다. 단위 시간 당 희귀 현상의 평균 발생 횟수가 m일 때 어떤 특정한 단위 동안 발생한 현상의 수를 확률 변수 X로 정의한다. 그러면 확률변수 X는 0, 1, 2, ...의 값을 취하고, 모수가 m인 포아송분포(poisson distribution)을 따른다. 

모수가 m인 포아송분포의 확률질량함수는 다음과 같다.



모수 m을 갖는 포아송분포의 평균과 분산은 다음과 같다.



엑셀에서 포아송분포의 확률계산은 POISSON 함수를 이용하는데, 구체적인 사용법은 다음과 같다.


  • POISSON(x, mean, cumulative) :
- x : 단위 시간 동안의 발생 횟수
- mean : 단위 시간 동안의 평균 발생 횟수
- cumulative : 함수 형태를 결정하는 논리 값
  1 또는 TRUE이면 누적확률질량함수 값을 계산하고,
  0 또는 FALSE이면 확률질량함수 값을 계산한다.

만약에 사무실에 한 시간 동안 평균 10번의 전화가 걸려올 때, 12번 이상 걸려올 확률을 구하고 싶으면 11번 이하로 걸려올 확률 누적확률질량함수 값을 구해서 1에서 빼면 된다. 1 - POISSON(11, 10, 1) 

7번 걸려올 확률을 구하고 싶으면 POISSON(7, 10, 0)을 쓰면 된다.


 


참조: 엑셀데이터분석, 한국방송통신대학교 출판문화원, 조신섭 외 3명 공저

+ Recent posts