1. 首页 > 基金期货

如何使用主成分分析法构建黄金期货的量化择时

我们在研究某些问题时,需要处理带有很多变量的数据。变量和数据虽然很多,但可能存在噪音和冗余。然而,主成分分析法可以用少数变量来代表所有的变量,用来解释研究者所要研究的问题,化繁为简,抓住关键,也就是降维思想。本文以黄金期货为例,通过对其基本面数据进行分析,提取了对黄金影响较大的10个基本面变量,使用主成分分析法对数据进行降维处理,并使用降维后的新变量构建黄金期货的量化择时策略。

主成分分析法的核心思想

我们在研究某些问题时,需要处理带有很多变量的数据。比如,研究房价的影响因素,需要考虑的变量有物价水平、土地价格、利率、就业率等。变量和数据很多,但可能存在噪音和冗余,因为这些变量中有些是相关的,那么就可以从相关的变量中选择一个,或者将几个变量综合为一个变量,作为代表。用少数变量来代表所有的变量,用来解释所要研究的问题,就能化繁为简,抓住关键,这也就是降维的思想。

主成分分析法(Principal Component Analysis,PCA)就是一种运用线性代数的知识来进行数据降维的方法。它将多个变量转换出少数几个不相关的变量来,但转换后的变量能比较全面地反映整个数据集。这是因为数据集中的原始变量之间存在一定的相关关系,可用较少的综合变量来表达各原始变量之间的信息。

具体来看,在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大且和第一变量不相关,称为第二主成分。依次类推,i个变量就有i个主成分。其中,Li为p维正交化向量(Li×Li=1),Zi之间互不相关且按方差由大到小排列,则称Zi为X的第i个主成分。设X的协方差矩阵为Σ,则Σ必为半正定对称矩阵,求特征值λi(按从大到小排序)及其特征向量。可以证明,λi所对应的正交化特征向量,即为第i个主成分Zi所对应的系数向量Li,而Zi的方差贡献率定义为λi/Σλj,通常要求提取的主成分的数量K满足Σλk/Σλj>0.85。

本文来源于网友自行发布,不代表本站立场,转载联系作者并注明出处