본문 바로가기
ADsP

[ADsP] 8. 기초통계

by Point-Nemo 2026. 2. 2.

1. t-검정

(1) 일 표본 t-검정

a. 일 표본 t-검정의 개념

- 하나의 모집단의 평균값을 특정값과 비교하는 경우 사용

 

b. 일 표본 단측 t-검정

- ~보다 크다, ~보다 작다 등 한쪽으로의 방향성을 갖는 경우 수행되는 검정 방법

 

c.일 표본 양측 t-검정

- ~이다 혹은 ~이 아니다와 같이 방향성이 없는 경우 수행되는 검정 방법

 

(2) 이 표본 t- 검정

a. 이 표본 t-검정의 개념

- 서로 독립적인 두 집단에 대하여 모수(모평균)의 값이 같은 값을 갖는지 통계적으로 검정하는 방법

- 등분산성이 만족되어야함

 

b. 이 표본 단측 t-검정

c. 이 표본 양측 t-검정

- 두 집단이 같다/다르다

 

(3) 대응 표본 t-검정

a. 대응 표본 t-검정의 개념

- 동일한 대상에 대해 두 가지 관측치가 있는 경우 차이가 있는지 검정 (전/후 효과)

 

2. 분산분석(ANOVA)

(1) 개요

- 세 개 이상의 모집단이 있을 경우에 여러 집단 사이의 평균을 비교

- 귀무가설은 H0: 모든 집단 간 평균은 같다

- 정규성, 등분산성, 독립성 가정이 필요

- 단점: 귀무가설을 기각할 경우, 어느 집단 간 평균이 같은지, 다른지 알 수가 없음 

- 독립변수는 범주형, 종속변수는 연속형이어야함

- F-Value 사용

- aov(연속형 ~ 범주형) 함수 사용

 

(2) 일원분산분석

- 셋 이상의 집단 간 평균을 비교하는 상황에서, 하나의 집단에 속하는 독립변수와 종속변수 모두 한 개일 때 사용

- ex) 연령별 유튜브 시청 시간 차이

 

(3) 이원분산분석

- 일원분산분석 수행 시 독립변수의 수가 두 개 이상일 때 사용

- ex) 성별 연령별 유튜브 시청 시간 차이

- 독립변수간 교호작용이 있다고 판단될 때는 '반복이 있는' 실험을 하고 그렇지 않을 때 즉, 독립일 땐 반복이 없는 실험 진행

 

 

3. 교차분석

(1) 교차분석

a. 개념

- 범주형 자료 간의 관계를 알아보고자 할 때 사용

- 카이제곱 검정통계량 이용

- 적합도 검정, 독립성 검정, 동질성 검정

 

b. 교차분석표

- 데이터의 빈도를 표 형태로 나타낸 것

 

(2) 적합도 검정

a. 개념

- 관측값이 예상값과 일치하는지 여부를 검정

 

b. 가설

- H0: 실제 분포와 예측 분포 간에는 차이가 없다

 

c. 적합도 검정

- 유의수준 a = 0.05로 설정

 

4. 독립성 검정 및 동질성 검정

a. 독립성 검정

- 모집단이 두 개의 변수에 의해 범주화 됐을 때 그 두 변수들 사이의 관계가 독립적인지 아닌지 검정

- 두 변수 간 관계의 강도를 말해주지는 않음 

 

b. 동질성 검정

- 관측값들이 정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정

- 두 집단의 분포가 동일한 모집단에서 추출된 것인지를 검정 

 

5. 상관분석

(1) 개념

 

(2) 종류

a. 피어슨 상관분석

- 모수적 방법, 두 변수가 모두 정규분포를 따른다는 가정 필요

 

b. 스피어만 상관분석

- 비모수적 방법 

 

(3) 실습

time <- c(8, 6, 7, 3)

score <- c(33, 22, 18, 6)

cor.test(time, score)

-> 학습 시간과 시험 점수 사이에 상관관계가 존재하는지 검정

'ADsP' 카테고리의 다른 글

[ADsP] 10. 다변량 분석  (0) 2026.02.03
[ADsP] 9. 회귀분석  (0) 2026.02.02
[ADsP] 7. 통계의 이해  (0) 2026.02.02
[ADsP] 6. 데이터 마트 & 데이터 탐색  (1) 2026.02.01