공부/기타
K-means는 Pearson이나 Spearman 상관관계에서 쓸 수 없다.
Nix.
2022. 2. 11. 16:19
예전에 했던 프로젝트들 되돌아보다가 실수했던게 있어서 기록해둠.
K-means는 타 거리기반 상관관계를 가진 Vector들에 대해 사용해서는 안된다.
K-means는 엄밀히 말하자면 거리기반이 아니라, Least-Square (=유클리드 거리) 의 합을 최소화하는 방향으로 진행된다. 따라서 타 거리기반 상관관계에서는 아무 관련없는 것들끼리 묶인다거나 하는 결과를 초래할 수 있는 것이다.
참고
Use Absolute Pearson Correlation as Distance in K-Means Algorithm (MATLAB)
I need to do some clustering using a correlation distance but instead of using the built-in 'distance' 'correlation' which is defined as d=1-r I need the absolute Pearson distance. In my applicatio...
stackoverflow.com