1. 다차원 척도법(MDS)
(1) 개요
a. 개념
- 다차원 척도법은 객체 간의 근접성을 시각화하는 통계기법으로, 군집분석과 유사함
- 객체들 사이의 유사성/비유사성을 측정하여 원래의 차원보다 낮은 차원의 공간에 군집분석처럼 점으로 표현
- 데이터를 축소하는 목적, 유클리디안 거리행렬 사용
b. 측도
- 개체의 실제 거리와 모형에 의해 추정된 거리 사이의 적합도를 측정하기 위해 stress 척도를 사용
- stress 값은 0~1 사이의 값을 가지고, 값이 낮을수록 적합도가 높음 (0.05 이내면 적합도가 좋은 편)
(2) 종류
a. 계량적 MDS
- 구간척도, 비율척도
- 유클리디안 거리 행렬
- cmdscale 함수 사용
b. 비계량적 MDS
- 서열척도
- 서열척도를 거리속성값으로 변환하여 사용
- isoMDS 함수 사용
2. 주성분분석(PCA)
(1) 개요
a. 개념
- 여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)를 만들어 기존 변수를 요약 및 축소
- 분산이 가장 큰 축을 첫 번째 주성분으로 함
b. 목적
- 변수를 축소하여 모형의 설명력을 높임
- 다중공선성 문제 해결
- 군집분석 시 모형의 성능을 높임
- 선형변환 후에 주성분 분석을 해야함
c. 방법
- 차원을 축소함에 따라 데이터 손실이 발생할 수밖에 없음
- 가장 손실이 작은 축을 찾아 새로운 변수로 만듦
- 데이터 부족이나 정렬되지 않은 속성을 가진 데이터로 처리 가능
- 평균 고유값 방법: 고유값들의 평균을 구한 뒤 고유값이 평균보다 작은 값을 갖는 주성분을 제거하는 법
- 주성분의 개수는 전체 데이터의 70% 이상을 설명할 수 있도록 선택
d. scree plot
- x축을 성분의 개수, y축을 고윳값으로 하는 그래프로, 주성분의 개수를 선택하는 데 도움을 줌
- 일반적으로 고윳값이 1 근처의 값을 갖는 곳에서 주성분 분석의 수를 결정 (or 그래프가 수평 직전)

e. biplot
- 첫 번째 주성분과 두 번째 주성분을 축으로 하는 그래프
- 데이터가 어떻게 퍼져있는지를 시각화함
- 수평으로 뻗어있는 변수들은 PC1 값에 의해 영향을 받으며
- 수직으로 뻗어있는 변수는 PC2 값에 의해 영향을 받음
- 길이가 짧을수록 PC1, PC2에 의해 받는 영향이 적음

'ADsP' 카테고리의 다른 글
| [ADsP] 12. 데이터마이닝 (0) | 2026.02.04 |
|---|---|
| [ADsP] 11. 시계열 분석 (0) | 2026.02.03 |
| [ADsP] 9. 회귀분석 (0) | 2026.02.02 |
| [ADsP] 8. 기초통계 (0) | 2026.02.02 |