Data Science

이 글에서는 통계학적 자료에 대해 알아보고, 통계학적 자료를 구성하는 변수들을 측정 수준에 따라 구분하는 방법에 대해 알아본다. 통계학적 자료 통계학적 자료는 위 이미지와 같이 실험, 설문조사 등 다양한 방법을 통해 모아진 데이터(raw data)를 의미하며, (확률)변수(variable)와 관찰치(observation)로 구성되어 있다. 가장 상단에 열(column)의 이름을 나타내는 항목들을 변수라고 하며, 변수 아래로 위치하고 있는 데이터들을 관찰치라고 한다. 관찰치는 크게 숫자형(numeric)과 문자형(character)으로 구분할 수 있다. 숫자형은 사칙연산이 가능한 데이터를 의미한다. 문자형은 남, 여로 표현하는 성별과 같이 문자로 표현된 데이터를 의미하는데, 문자형 관찰치의 경우 숫자로 코..
이 글에서는 통계학에서 기본이 되는 모집단과 표본의 정의에 대해 알아보고, 통계학적 기술과 통계학적 추론에 대해 알아본다. 모집단과 표본 모집단(population)은 조사대상 집단의 모든 원소의 집합(분석의 대상이 되는 모든 관찰치의 집합)을 의미한다. 즉, 연구자가 어떤 정보를 얻기 위해서 선택한 집단 전체 또는 특정 연구 결과가 일반화 되어 지는 전체 집단을 의미하게 된다. 모집단의 특성을 나타내는 값을 모수(parameter)라고 하며, 대표적으로 모평균( \( \mu \) ), 모분산( \( \sigma^2 \) ), 모비율( \( p \) )이 있다. 모수는 절대적인 값으로 절대 변할 수 없는 값이다. 표본(sample)은 모집단의 일부분으로, 조사과정을 통하여 실제로 얻어진 관찰치의 집합을 ..
청월누리
'Data Science' 카테고리의 글 목록 (5 Page)