주머니에 검은색 돌과 흰색 돌이 10개씩 들어 있습니다. 무작위로 10개를 꺼낼 때 검은 색 돌의 개수 분포는 어떻게 될까요?
이항분포
주머니에서 돌을 꺼낼 때 결과는 흰색과 검은색 둘 중 하나가 됩니다. 이처럼 결과가 둘로 나누어지는 시행을 베르누이 시행이라고 합니다. 이 베르누이 시행을 독립적으로 n번 반복했을 때 나타나는 결과 분포를 이항확률분포라고 합니다.
결과를 보면, 10개의 돌을 꺼낼 때 흰색과 검은색이 각각 5개일 확률이 가장 높음을 알 수 있습니다. 확률이 일정하고, 시행의 횟수가 충분히 많다면 이항분포는 정상분포(정규분포)를 닮아갑니다.
정상분포곡선
독일의 가우스(Gauss)는 여러 가지 실험을 할 때, 오차가 얼마나 될까에 관한 연구를 하여 그 결과를 발표하였는데 이를 오차의 법칙이라 부릅니다. 이를 분포 곡선으로 나타낸 것이 정상분포 곡선입니다.
정상분포 곡선(Normal distribution curve)은 통계적 모형으로 사용되는 분포 곡선 중 가장 많이 사용되는 모형입니다.
(표준편차 σ = 1)
자연에서 일어나는 대부분의 현상은 정상분포곡선과 유사합니다. 즉, 교실 내 학생의 키 및 몸무게, IQ 등은 정상분포곡선을 이루는 것으로 알려져 있습니다.
즉, 평균치에 해당되는 학생이 제일 많이 분포되어 있으며, 평균치로부터 멀어질수록 학생의 수는 점점 줄어듭니다.
25 ~ 29세의 남성과 여성 키의 분포(http://sizekorea.kats.go.kr/)
한가지 주의할 점은, 정상분포곡선은 단지 수리적으로 유도된 곡선이라는 것입니다. 단지 그것이 현실적인 자료를 설명하는 데 적합한 경우에 한해 수리적 모형으로 이용됩니다.