반응형
[ADsp 정리] 3-4-4. 다차원척도,주성분 분석
1. 다차원 척도법(MDS)
1-1 정의
- 다차원 척도법(MDS/Multi Dimensional Scaling) 은 개체들의 유사성을 2차워/3차원으로 표현하는 방법
- 근접성(Proximity)을 시각화하는 방법
1.2 다차원 척도 방법
- 유클리드 거리행렬 활용
1.3 다차원척도법 종류
- 계량적 MDS(Metric MDS)
- 비계량적 MDS(nonmetric MDS)
2. 주성분 분석(PCA)
2-1. 개념
- 상관성이 높은 변수들의 선형 결합으로 상관성이 높은 변수들을 요약, 축소하는 기법
- 상관이 없는 주성분으로 차원 축소
- 다중공선성(multicollinearity)가 존재하면 모형이 잘못 만들어질 수 있으므로, 차원을 축소하여야 함
2-2 주성분 선택 방법
- 누적기여율(Cumulative Proportion)이 85%이면 주성분의 수로 결정
- Screen Plot을 하여 eigen value 값이 수평을 유지하기 전 단계로 주성 분 선택
3. 요인 분석(Factor Analysis)
3-1. 개념
- 등간 척도로 측정한 두 개 이상의 변수들에 있는 공동인자를 찾는 방법
3.2 PCA와 FA의 공통점
- 두개 모두 데이터 축소 및 새로운 변수 생성에 활용 가능
3.3 PCA와 FA의 차이점
- PCA는 보통 3개, FA는 제한이 없다.
- PCA는 제 1주성분, 제 2주성분으로 표현하며, FA는 없다
- PCA는 제 1주성분이 가장 중요하지만, FA는 없다
- PCA는 목표 변수를 고려하여 변수들의 선형 결합으로 이루어지지만, FA는 없다.
반응형
'데이터 분석 전문가(ADP, ADSP) > 데이터 분석 개념' 카테고리의 다른 글
[ADP/ADSP] 4과목 데이터 분석 소개 (0) | 2021.03.02 |
---|---|
[ADsp 정리] 3-4-1. 통계 분석 (0) | 2020.11.30 |
[ADsp 정리] 3-5-5. 군집 분석(Clustering Analysis) (0) | 2020.11.26 |
[ADsp 정리] 3-5-2. 분류 분석(Decision Tree) (0) | 2020.11.22 |
[ADsp 정리] 3-5-1. 정형 데이터 마이닝 (0) | 2020.11.21 |