主成分分析法及其在经济金融中的应用浅析 作者:孙一然 来源:《文理导航·教育研究与实践》 2018年第9期 【摘 要】主成分分析法,是对多变量大样本数据的一种有效的研究方法。本文首先介绍主成分分析法的应用背景、定义和基本步骤,进一步介绍其内在本质,即数学中的降维思想。并通过主成分分析法在经济、金融中的应用,说明数学知识对于各个社会领域的重要的应用意义。 【关键词】主成分分析法;经济金融;应用 一、主成分分析法 在许多领域中,往往涉及多变量大样本的数据,对这些数据进行分析和预测时,不能仅仅考虑单个变量的影响,而需要多个变量协同考虑。然而,多个变量又相互作用,这就给分析和预测带来了一定的难度。对此,需要引入合适的方法,将变量的数目简化,从而用较少的综合指标来反映多个变量中存放的信息。主成分分析就是这样一种方法。 (一)主成分分析法的定义 主成分分析法(principal component analysis,PCA)是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。 (二)主成分分析法的具体步骤 1)将原始数据按行排列组成矩阵X; 2)对X进行数据标准化,也就是使其均值变为零; 3)求X的协方差矩阵C; 4)将特征向量按特征值由大到小排列,取前k个按行组成矩阵P; 5)通过计算Y=PX,得到降维后数据Y; 6)计算每个特征根的贡献率,贡献率的大小一般用该特征根对应的特征值占特征值总和的比重来表示。 (三)主成分分析法所体现的数学思想 运用主成分分析的目标,是希望用较少的变量去解释原来资料中的大部分变量,通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分。由此可见,主成分分析法实际上是一种降维方法。 降维思想,是数学这门科学中,最为重要而基本的思想之一。在高中的学习中,我们已经接触到了二维空间和三维空间,知道可以用N维向量来表示N维空间中的点。事实上,不仅限于空间几何领域,在数学上,任何一组不完全重叠的多维向量,都可以构成一个多维空间。“高维空间”的概念,大大提高了人们用数字这种抽象化手段来描述现实的能力。数学来源于实际而又高于实际,在实际问题中,面对众多的变量,其取值往往构成高维向量,因此,处理它们之间的关系,并加以应用,就需要使用高维空间。而对高维空间最为重要的处理方式,就是简化其维度,化繁为简,提取核心,实现降维。在降维过程中,我们提取了高维数据中有用的信息,而忽视了冗余或重复的信息,从而使得其接下来的数学处理变得简单。例如,在常见的二元一次方程组中,“消元”的过程就是把二维问题转化成一维问题,从而用低维度的思想去解决的一个典型例子。主成分分析中所体现出的降维思想,与这种方法一脉相承。 二、应用 经济和金融领域是典型的自然科学与社会科学相结合的领域,经济金融系统具备典型的“复杂”、“高维”、“相关性强”等特征。当我们想要对其中的某个关键指标进行预测时,该指标往往受到多方面因素的共同作用,而这多方面的因素又存在很强的相关性。这种情况,正适合用主成分分析法来精简数据结构,并做出进一步预测。 (一)经济领域的应用 主成分分析法应用于经济学领域,适用于做多变量的时间序列预测。经济数据中大部分数据为时间序列数据,单一指标时间序列的预测问题已经在理论上得到了深入的研究,并在各类实际问题中得到了广泛的应用。常用的ARMA,GARCH等模型,几乎可以解决大部分的预测问题,对于数据结构也会有清晰的描述。然而实际的经济问题中往往需要对多个经济指标同时预测,且需要考虑这些指标之间的相互关系。此时,单变量的时间序列模型就不再适用。一个自然的想法是将多个指标简化为不相关的少数几个指标,主成分分析法可以适用于这类问题。 (二)金融领域的应用 在金融领域,一个典型的应用主成分分析法的例子是在量化投资领域的多因子选股体系中。在用多因子的方法进行选股时,需要通过财务数据、量价数据、资金数据等多方面的数据(称为因子),来预测下一期股票收益率的走势,从而判断是否将该股票纳入股票池。这就需要准确的寻找出对股票收益率有显著贡献的因子。然而,多个因子间往往存在共线性,也就是相关性较强,起到的作用类似。例如财务因子中的PB和PE,分别代表市盈率和市净率,本质上都是该股票估值的体现。除此之外,过多的因子会使得股票收益率的预测变得更为复杂,从而难以进行股票筛选。因此,一个比较理想的处理方案就是将这些因子降维,重新组合成少数几个相互独立的因子。这样的因子虽然没有明显的经济学意义,但对于选股却有显著的效果。而这个过程,正是进行主成分分析的过程。 三、小结 不难发现,在经济金融领域,由于涉及大量的高维数据需要进行分析和预测,所以非常适用于主成分分析法这种降维分析方法。事实上,主成分分析法在工业领域、环保领域等各个方面,都有广泛的应用。这也进一步说明了数学对其他领域的重要的应用意义。 【参考文献】 [1]范明明.基于主成分分析的多变量混沌时间序列预测研究[D].大连理工大学,2006 [2]刘超.基于主成分分析的多维时间序列预测[J].中央民族大学学报(自然科学版),2016.25(04):27-29+33 本文来源:https://www.wddqw.com/doc/d5ba30edb968a98271fe910ef12d2af90342a87f.html