차원축소 2

[차원축소와 군집분석] NMF : Non-negative Matrix Factorization

NMF Non-negative Matrix Factorization NMF Non-negative Matrix Factorization 하나의 데이터 X를 가중치 W와 점수 H의 곱으로 쪼갬 이때 W와 H는 모두 ≥0 • PCA에 비해 점수의 해석이 좀 더 쉬움. (음수가 나오지 않기 때문에) • 원데이터를 보존하지는 않음 문서 단어 행렬 Document-Term Matrix 문서별 단어의 빈도를 정리한 행렬 에게 만들다 아름다운 한글 Doc1 1 0 1 2 Doc2 0 2 2 2 Doc3 4 0 3 5 Doc4 2 0 2 3 Python : PCA와 NMF로 차원 축소 & 해석하기 data : 심리학 논문 초록 데이터 PCA NMF # 데이터 불러오기 import pandas as pd psyabs =..

Python 2022.10.04

[기초통계] 차원 축소와 군집 분석

차원 축소와 군집 분석 비지도 학습 unsupervised learning 주어진 데이터의 내재적 구조를 분석 지도학습과 달리 데이터 자체에 정답이 없음 • 종류: - 차원 축소 dimensionality reduction (점수만들기) - 군집 분석 clustering (비슷한 것끼리 모으기) 차원 축소 Dimensionality Reduction 데이터에서 차원 = 변수의 수 차원이 크면 ? • 시각화가 어려움 (대부분 시각화는 2차원) • 이해하기 어려움 (사람이 생각할 수 있는 차원에는 한계) • 분석하기 어려움 (차원이 클수록 과적합이 일어나기 쉬움) > 변수가 늘어난다 = 차원이 늘어난다. (수정 R제곱, AIC, BIC는 이런 것을 보정해준다.) • 차원 축소: 차원을 줄이는 다양한 기법들 ..

기초통계 2022.09.15