이 글에서는 통계학에서 기본이 되는 모집단과 표본의 정의에 대해 알아보고, 통계학적 기술과 통계학적 추론에 대해 알아본다.
모집단과 표본
모집단(population)은 조사대상 집단의 모든 원소의 집합(분석의 대상이 되는 모든 관찰치의 집합)을 의미한다. 즉, 연구자가 어떤 정보를 얻기 위해서 선택한 집단 전체 또는 특정 연구 결과가 일반화 되어 지는 전체 집단을 의미하게 된다.
모집단의 특성을 나타내는 값을 모수(parameter)라고 하며, 대표적으로 모평균( \( \mu \) ), 모분산( \( \sigma^2 \) ), 모비율( \( p \) )이 있다. 모수는 절대적인 값으로 절대 변할 수 없는 값이다.
표본(sample)은 모집단의 일부분으로, 조사과정을 통하여 실제로 얻어진 관찰치의 집합을 의미한다. 표본은 모집단의 부분집합으로 볼 수 있다. 연구의 관점에서 보면, 실제 연구에서 정의한 모집단 내에서 모집한 피험자들이 표본이 된다.
표본의 특성을 나타내는 값을 통계량(statistic)이라고 하며, 대표적으로 표본평균( \( \overline X \) ), 표본분산( \( s^2 \) ), 표본비율( \( \hat p \) )이 있다. 모수와 달리 통계량은 표본의 구성에 따라 달라질 수 있다.
모집단과 모수, 모집단과 표본, 표본과 통계량의 관계는 아래 그림과 같이 나타낼 수 있다.
통계학은 표본의 정보(통계량)를 이용하여 모집단의 특성(모수)을 추론하고자 하는 목적을 가지고 있다.
통계학적 기술과 추론
통계학적 기술(statistical description)은 그림이나 표 등을 이용하여 수집한 데이터를 효과적으로 요약 및 정리하고, 표현하는 과정을 의미한다. 통계학적 기술을 이용하는 통계학을 기술통계(descriptive statistics) 혹은 기술통계학라고 부르며, 데이터의 평균이나 분산 등의 통계량이나 그래프를 이용하여 데이터의 특징을 파악하는데 중요한 역할을 한다.
통계학적 추론(statistical inference)은 데이터를 이용하여 통계학적 논리(확률)에 근거한 의사결정을 하는 과정을 의미한다. 통계학적 추론은 추정(estimation), 검정(testing) 혹은 분석(analysis)라고 부르는 모든 과정을 포함한다. 통계학적 추론을 이용하는 통계학을 추론통계(inferential statistics) 혹은 추론통계학라고 부르며, 모집단에서 추출한 표본의 데이터를 이용하여 모집단의 특성(모수)을 추론하고자 할 때 사용된다.
기술통계와 추론통계는 서로 보완적인 역할을 한다.
'Data Science > 통계학' 카테고리의 다른 글
통계학 | 이산형 확률 분포와 연속형 확률 분포 간단 정리 (1) | 2024.01.24 |
---|---|
통계학 | 확률과 베이즈 정리(Bayes' rule) (1) | 2024.01.21 |
통계학 | 기술통계량 : 대표값과 산포도 (0) | 2024.01.06 |
통계학 | 통계학적 자료와 변수의 구분 (0) | 2024.01.05 |