저는 처음 품질경영기사를 공부할 때 누구든 그렇겠지만 용어가 너무 헷갈리고 어려웠습니다.

통계를 처음 접하시는 사람들이 가장 어려워 하는 개념 중에 하나가

모집단(population)과 표본(sample), 모수(parameter)와 통계량(statistic)이 아닌가 생각합니다.

모집단은 분석하고자 하는 대상, 즉 통계를 내고자 하는 전체가 대상이 되는 그룹입니다.

표본(표본집단)은 통계를 내고자 하는 관심의 대상이 되는 그룹에 대한 분석을 위해 추출한 샘플 집단입니다.

모수는 모집단을 설명하고 특징짓는 특성을 갖는 값입니다.

통계량은 모집단을 설명하는 샘플 집단(표본)을 설명하는 값입니다.

여기까지만 설명해도 헷갈리는 분들이 있으시리라 생각합니다.

 

예를 들자면 대선 출구조사를 들 수 있습니다.

대선 출구조사라는 주제를 중점으로 보자면 모집단은 투표권을 갖고 있는 대한민국의 전체 인구입니다.

하지만 투표 전에 모집단 전체의 투표 의견을 알아내기는 불가능하기에

모집단 내에서 표본(샘플)을 추출합니다.

이 상황에서 출구조사에 응하게 되는 사람들의 집단을 표본 집단으로 볼 수 있습니다.

그러나 이러한 표본 집단을 선출할 시에 전 국민을 대표할 수 있는 표본을 설정하여야 합니다.

표본 집단 중에서 20대의 중산층 가정이라는 조건의 표본이 전체 표본 중에 점유율이 높으면

특정 집단에 집중된 표본을 고를 시 사전 출구 조사로서의 목적을 잃게 됩니다.

따라서 보다 고른 결과를 예측하기 위하여

사는 지역, 성별, 나이 대, 직업, 소득 수준, 경제 규모 등으로 표본 대상을 나눌 것입니다.

사전 출구조사를 통해 예측하는 데이터를 통계량이라고 본다면

실제 대선 결과를 모수라고 볼 수 있는 것입니다.

즉, 모수는 모집단의 정보를 이용하여 알아낸 값이고 통계량은 표본을 이용하여 알아낸 값이라고 할 수 있습니다.

 

이렇게 표본을 통해 통계량을 찾아내고 통계량을 통해 모집단을 특성을 추측하는 것이 일반적이라고 할 수 있습니다.

하지만 이와 같은 원리를 가지고 있기 때문에 항상 약간의 오차를 가지게 됩니다.

 

다음엔 더 심화 개념인 모평균, 표본평균, 표준오차, 표준편차 등에 대하여 포스팅하겠습니다.

 

제 포스팅이 조금이라도 도움되셨다면 로그인 없이 공감 하트 가능하오니 클릭 부탁드리겠습니다.

+ Recent posts