표본추출과 대표성 - 심화학습 2번째
- 작성일2023/07/12 13:21
- 조회 73
"1000샘플 만으로 국민 여론을 파악할 수 있을까요?"
여론조사에 대한 다양한 오해가 있지만, 정치인이나 공직자, 후보자 등을 대상으로 하는 티브릿지의 강의에서 자주 듣는 질문 중 하나입니다. 한국에는 선거권을 가진 성인이 약 4천 5백만 명이므로 전체 여론을 파악하기에 1,000명은 너무 적지 않을까요? 이런 의문을 제기하는 것입니다.
미국의 인구는 3억 명을 월등히 넘고, 성인 인구만 해도 약 2억 5천만 명에 달합니다. 그렇다면 미국 대통령 선거에서 여론조사의 평균 표본 크기는 어떻게 될까요? 일반적인 표본 크기는 약 1,000명에서 1,500명입니다. 모집단의 크기에 따라 표본 크기가 증가하는 것은 아닌 것일까요? 그렇습니다.
1,000명의 표본을 통해 수천만에서 수억 명에 이르는 전체 여론을 추정하는 것은 통계학과 확률 이론 등의 과학적 근거에 기반합니다. 가능한 한 쉽게 설명하자면, 표본의 특성을 통해 모집단(전체 인구)의 의견을 추론할 수 있는 기준이 1,000명이라는 것입니다.
"공직선거법"에 따라 중앙선거여론조사심의위원회가 정하는 "선거여론조사기준"이라는 법규가 있습니다. 위 표에서 확인할 수 있듯이 최소 표본 크기는 투표 대상 선거 단위에 따라 다릅니다. 해당 선거구 전체의 여론을 파악하기 위해서는 표본 수가 일정 수준 이상이 되어야 한다는 기준이 적용되는 것입니다.
그렇다면 모집단의 의견을 정확하게 추정하기 위해서는 어떻게 표본을 추출해야 할까요? 위의 표는 광주광역시에 거주하는 성인 120만 명을 성별, 연령대, 지역별 인구 비율에 따라 1,000명의 표본으로 추정한 것입니다. 예를 들어 광주광역시에서 티브릿지의 휴대전화 조사를 진행한다면, 서구에 거주하는 30대 남성 15명, 북구에 거주하는 60세 이상 여성 48명과 같은 방식으로 1,000명의 표본을 구성합니다.
위의 표를 '할당표'라고 부릅니다. 할당표를 작성하기 위해 티브릿지는 확률표본추출 방법 중 층화표본추출을 사용합니다. 확률표본추출은 무작위로 표본을 추출하는 방법인데, 모집단의 표집 단위별로 추출될 확률이 정확하게 결정되어 있습니다.
층화표본추출은 모집단을 성별, 연령대, 지역과 같은 여러 계층으로 나누고, 각 계층에서 단순무작위표본추출을 하는 방법입니다. 이 방법은 분류 기준이 모집단의 속성과 일치하기 때문에 표본 수가 적어도 모집단의 대표성을 보장하는 장점이 있습니다. 한정된 기간과 비용으로 정확한 결과를 내는 것을 목표로 하는 티브릿지의 여론조사에서 이러한 과학적 기법이 사용됩니다.
예를 들어 건강검진을 받았을 때, 일반적인 혈액검사에서는 어느 정도의 혈액을 채취하나요? 대략 5~15 ml 정도의 소량의 혈액을 채취합니다. 체중이 50kg인 사람과 90kg인 사람이라도 채혈량은 동일합니다. 이 정도의 채혈량으로 간 기능, 신장 기능, 요산, 갑상선 기능, 전해질, 고지혈증, 당뇨병, 혈액형, 간염, 에이즈, 류마티스 인자, 비타민 D, 간, 대장, 췌장, 담도, 난소의 종양 표지자 등의 기본적인 건강 상태를 확인할 수 있다는 의학적 근거가 있습니다.
1,000명의 응답으로 전 국민의 의견을 파악할 수 있는지에 대한 의문에 충분한 설명이 되었기를 바랍니다.
사람들의 생각을 똑바로 읽고 정확하게 해석하기 위해 노력하는 회사
여론조사 & 데이터 컨설팅 전문기관 <티브릿지>였습니다.