标签归档:ML

使用 PCA 进行降维处理——基于 sklearn 库

在最初阅读《数据挖掘:概念与技术》的时候,第一次注意到了这个词汇:PCA(Principal component analysis),主成分分析。最初对这部分内容并没有深入的了解,直到最近项目拿到数据开始分析了,才开始认真学习这部分内容。具体的原理,可以继续阅读参考链接中的内容,总结来说,PCA 就是通过寻找高维空间中,数据变化最快(方差最大)的方向,对空间的基进行变换,然后选取重要的空间基来对数据降维,以尽可能的保持数据特征的情况下对数据进行降维。

继续阅读