Data Science

이 글은 SQLD를 공부하며 SQL 종류와 SQL문의 실행 순서에 대해 정리한 글이다. SQL(Structured Query Language) SQL은 관계형 데이터베이스에 대해서 데이터의 구조를 정의, 데이터 조작, 데이터 제어 등을 할 수 있는 절차형+비절차형 언어 관계형 데이터베이스는 데이터베이스를 연결하고 SQL문을 사용하여 데이터베이스를 누구나 쉽게 사용할 수 있도록 함 SQL은 ANSI/ISO 표준을 준수함 데이터베이스 관리 시스템이 변경되어도 그대로 사용할 수 있음 SQL 표준 ANSI/ISO SQL 표준 INNER, JOIN, NATURAL JOIN, USING 조건, ON 조건절을 사용 ANSI/ISO SQL3 표준 DBMS 벤더별로 차이가 있었던 SQL을 표준화하여 재정 SQL 종류 S..
이 글은 SQLD를 공부하며 관계형 데이터베이스에 대해서 정리한 글이다. 관계형 데이터베이스 관계형 데이터베이스의 등장 1970년대 E.F. Codd 박사의 논문에서 처음 소개된 데이터베이스 (Codd, E. F. (1970). A relational model of data for large shared data banks. Communications of the ACM, 13(6), 377-387.) 릴레이션(Relation)과 릴레이션의 조인(join) 연산을 통해 합집합, 교집합, 차집합 등을 만들 수 있음 현재 기업에서 가장 많이 사용하는 데이터베이스의 한 종류로, Oracle, MS-SQL, MySQL, Sybase 등의 다양한 데이터베이스 관리 시스템이 있음 데이터베이스의 종류 데이터베이스의..
이 글에서는 이산형 확률 분포(이항 분포, 포아송 분포)와 연속형 확률 분포(정규분포, 표준정규분포)에 대해 빠르게 알아보는 글이다. 공식에 대한 유도나 증명 과정은 생략한다. 이산형 확률 분포 이산형 확률 분포(discrete probability distribution)는 이산형 확률 변수(discrete random variable)에 대한 확률 분포를 의미한다. 여기서 이산형(discrete)이란 대소 비교의 의미가 있는, 셀 수 있는 정수 자료형을 의미한다. 예를 들면 자녀 수, 사고 횟수, 제품의 개수 등이 이산형 확률 변수에 속한다. 이산형 변수 \( X \)의 모든 실현 가능한 실현치 \( x_1, x_2, \cdots \)에 대해 확률 질량(확률) \( f(x_1) = P(X = x_1)..
이 글에서는 확률의 기본 내용에 대해 정리하고, 사전 확률을 이용하여 사후 확률을 계산하는 베이즈 정리(Bayes' rule)에 대해 알아본다. 확률 용어 정리 먼저 확률에서 사용되는 용어에 대해 정리한다. 확률 실험 (random experience) 확률 실험은 실행 이전에 그 결과를 정확하게(100%) 예측할 수 없는 실험을 의미한다. 만약 연구자가 하고자 하는 연구가 확률 실험이 아니라면, 통계학을 적용할 수 없다. 확률 실험은 동일한 조건으로 실험을 반복하더라도 그 실험의 결과가 동일하지 않고 임의의 형태로 나타난다는 특징이 있다. 동전 던지기, 주사위 굴리기 등이 확률 실험에 포함된다. 표본 공간 (sample space) 표본 공간은 확률 실험을 통해 얻어지는 가능한 모든 결과들의 집합을 의..
이 글에서는 기술통계에서 사용되는 대표값과 산포도에 대해 알아보고, 기술통계량을 어떻게 제시하는 것이 좋은지 알아본다. 기술통계량 기술통계량은 자료의 특성을 표현하는 값으로, 대표값과 산포도가 있다. 대표값 대표값(measure of central tendency)은 자료를 잘 표현할 수 있는 수, 이름 그대로 전체 자료를 대표할 수 있는 값을 의미한다. 대표값에는 (산술)평균, 중위수, 최빈치 등이 있는데, 이 중에서 (산술)평균이 가장 많이 사용된다. 각 대표값에 대해 각각 살펴보면 다음과 같다. (산술)평균 (arithmetic mean) 모집단으로부터 추출한 표본(sample)의 관찰치( \( X \) )가 \( x_1, x_2, x_3, \cdots , x_n \)일 때, 이 표본의 평균( \(..
청월누리
'Data Science' 카테고리의 글 목록 (4 Page)