[확률분포] 확률변수, 확률질량함수, 확률밀도함수
확률변수는 크게 이산형 확률변수와 연속형 확률변수로 나눌 수 있다.
이산형은 책의 페이지당 오자의 수, 제품 한 상자에서 나온 불량품의 개수, 주사위를 5번 던질 때 짝수가 나오는 횟수 등과 같이 확률 변수가 취할 수 있는 값이 정수와 같이 유한하거나 셀 수 있는 값을 취하는 경우의 확률 변수이다.
연속형 확률변수는 사람의 키, 제품의 무게와 같이 정확한 값보다는 어떤 구간의 값을 취하는 형태에서 사용한다. 100명의 키를 조사해서 분포로 나타낼 때, 175.34는 몇 명 180.18은 몇 명 이렇게 나타내지 않고 170~175cm 몇 명(n/S)와 같이 구간으로 나타낸다. 여기서 표본 공간에서 조건을 만족하는 원소의 개수를 구하면 확률이다.
동전던지기를 4번 해서 뒷면이 나올 확률은 아래와 같다.
x |
0 |
1 |
2 |
3 | 4 |
P{X = x} |
1/16 |
4/16 |
6/16 |
4/16 | 1/16 |
위의 표에서 p(x) = P{X, x}는 확률변수 X가 취할 수 있는 값에 대해 확률을 대응시킨 관계를 나타내며 확률 분포 또는 분포함수라고 한다.
이산형 확률변수의 분포함수는 이산점의 확률을 나타내므로 도수 분포 그래프로 나타내진다. 그리고 분포함수 p(x)를 확률질량함수라고 부른다.
연속형 확률변수의 확률분포는 확률변수 X가 어떤 구간에 속할 확률을 나타내므로 면적이 확률이 된다. 연속형 분포함수는 흔히 f(x)로 나타내고 확률밀도함수라고 부른다. 확률변수 X가 구간 (a, b)에 속할 확률 P(a< x <=b)는 곡선의 구간 (a, b) 면적이 된다.
특정 조건을 만족하는 이벤트의 확률을 구할 때, 이산형 확률은 더하고, 연속형 확률은 적분한다.
참조: 엑셀데이터분석, 한국방송통신대학교 출판문화원, 조신섭 외 3명 공저
'Statictics & Math & Data Science > 통계&데이터분석' 카테고리의 다른 글
[통계] 차원의 저주와 K-NN(최근접이웃) 알고리즘 (0) | 2019.04.03 |
---|---|
[가중치 규제] L1 & L2 Regularization Method (0) | 2019.01.30 |
[실험계획법] 분산 분석(1) 총변동의 분할 (0) | 2018.08.10 |
[실험계획법] 일원배치법 (0) | 2018.08.10 |
[통계분석] 유의성 검정(2) - 유의확률 & 모평균 검정 (0) | 2017.09.18 |