본문 바로가기
ADsP

[ADsP] 10. 다변량 분석

by Point-Nemo 2026. 2. 3.

1. 다차원 척도법(MDS)

(1) 개요

a. 개념

- 다차원 척도법은 객체 간의 근접성을 시각화하는 통계기법으로, 군집분석과 유사함

- 객체들 사이의 유사성/비유사성을 측정하여 원래의 차원보다 낮은 차원의 공간에 군집분석처럼 점으로 표현

- 데이터를 축소하는 목적, 유클리디안 거리행렬 사용

 

b. 측도

- 개체의 실제 거리와 모형에 의해 추정된 거리 사이의 적합도를 측정하기 위해 stress 척도를 사용

- stress 값은 0~1 사이의 값을 가지고, 값이 낮을수록 적합도가 높음 (0.05 이내면 적합도가 좋은 편)

 

(2) 종류

a. 계량적 MDS

- 구간척도, 비율척도

- 유클리디안 거리 행렬

- cmdscale 함수 사용

 

b. 비계량적 MDS

- 서열척도

- 서열척도를 거리속성값으로 변환하여 사용

- isoMDS 함수 사용

 

2. 주성분분석(PCA)

(1) 개요

a. 개념

- 여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)를 만들어 기존 변수를 요약 및 축소

- 분산이 가장 큰 축을 첫 번째 주성분으로 함

 

b. 목적

- 변수를 축소하여 모형의 설명력을 높임 

- 다중공선성 문제 해결

- 군집분석 시 모형의 성능을 높임

- 선형변환 후에 주성분 분석을 해야함

 

c. 방법

- 차원을 축소함에 따라 데이터 손실이 발생할 수밖에 없음

- 가장 손실이 작은 축을 찾아 새로운 변수로 만듦

- 데이터 부족이나 정렬되지 않은 속성을 가진 데이터로 처리 가능

- 평균 고유값 방법: 고유값들의 평균을 구한 뒤 고유값이 평균보다 작은 값을 갖는 주성분을 제거하는 법

- 주성분의 개수는 전체 데이터의 70% 이상을 설명할 수 있도록 선택

 

d. scree plot

- x축을 성분의 개수, y축을 고윳값으로 하는 그래프로, 주성분의 개수를 선택하는 데 도움을 줌

- 일반적으로 고윳값이 1 근처의 값을 갖는 곳에서 주성분 분석의 수를 결정 (or 그래프가 수평 직전)

https://bioturing.medium.com/how-to-read-pca-biplots-and-scree-plots-186246aae063

e. biplot

- 첫 번째 주성분과 두 번째 주성분을 축으로 하는 그래프

- 데이터가 어떻게 퍼져있는지를 시각화함

- 수평으로 뻗어있는 변수들은 PC1 값에 의해 영향을 받으며

- 수직으로 뻗어있는 변수는 PC2 값에 의해 영향을 받음

- 길이가 짧을수록 PC1, PC2에 의해 받는 영향이 적음

https://specialscene.tistory.com/112

 

'ADsP' 카테고리의 다른 글

[ADsP] 12. 데이터마이닝  (0) 2026.02.04
[ADsP] 11. 시계열 분석  (0) 2026.02.03
[ADsP] 9. 회귀분석  (0) 2026.02.02
[ADsP] 8. 기초통계  (0) 2026.02.02