机器学习之主成分分析(PCA)

主成分分析(principal component analysis,PCA)是一种广泛应用于不用领域的无监督现行数据转换技术,其突出的作用是降维。

降维思想:在信息丢失最少的原则下,研究指标体系的少数几个线性组合,即对高维变量空间降维。

线性组合所构成的综合指标尽可能多地保留了原数据信息。这些综合指标就称为主成分。

数学模型

设X1,X2,…,Xp为某实际问题所涉及的p个随机变量(指标),主成分分析就是把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。

-------------感谢阅读-------------
0%