【策略精选】基于时间序列的协整关系的配对交易

2017 年 12 月 27 日 优矿量化实验室 minghong

本帖主要介绍了协整的基础知识，如何对两个时间序列进行协整关系检验，并实现了一个简单的配对交易策略。这里参考了百度百科和雪球文章《搬砖的理论基础：配对交易 Pair Trading》。

1协整关系的逻辑

统计套利之配对交易是一种基于数学分析交易策略，其盈利模式是通过两只证券的差价（spread）来获取,两者的股价走势虽然在中途会有所偏离，但是最终都会趋于一致。配对交易就是利用这种价格偏离获取收益。具有这种关系的两个股票，在统计上称作协整性（cointegration），即它们之间的差价会围绕某一个均值来回摆动，这是配对交易策略可以盈利的基础。通俗点来讲，如果两个股票或者变量之间具有强协整性，那么不论它们中途怎么走的，它们的目的地总是一样的。

2协整关系的发展

经典回归模型是建立在平稳数据变量的基础之上的，对于非平稳变量，不能使用经典回归模型，否则会出现虚假回归等诸多问题，但是实际应用中大多数时间序列是非平稳的，1987年Engle和Granger提出的协整理论及其方法，为非平稳序列的建模提供了另一种途径。虽然一些经济变量的本身是非平稳序列，但是，它们的线性组合却有可能是平稳序列。这种平稳的线性组合被称为协整方程，且可解释为变量之间的长期稳定的均衡关系。

需要特别注意的是协整性和相关性虽然比较像，但实际是不同的两个东西。两个变量之间可以相关性强，协整性却很弱，比如说两条直线，y＝x和y＝2x，它们之间的相关性是1，但是协整性却比较差；方波信号和白噪声信号，它们之间相关性很弱，但是却有强协整性。

（完整版请点击文末“阅读原文”获取）

3协整关系的运用

这里还有介绍一个关于时间序列的基本概念：平稳性。平稳分为两种：强(严)平稳：给定随机过程X(t),t属于T,其有限维分布组为F(x1,x2,...xn;t1,t2,...,tn),t1,t2,...,tn属于T,对任意n任意的t1,t2,...,tn属于T,任意满足t1+h,t2+h,...,tn+h属于T的h,总有F(x1,x2,...xn;t1,t2,...,tn)=F(x1,x2,...xn;t1+h,t2+h,...,tn+h)；宽(弱)平稳：给定二阶矩过程（二阶矩存在）X(t),t属于T,如果X(t)的均值函数u(t)是常数,相关函数R(t1,t2)=f(t2-t1)即相关函数只与时间间隔有关。我们通常用的都是弱平稳。

单整阶数：当原序列是非平稳的，需要对序列进行差分（后一项减前一项），直到为平稳序列，差分几次就是几阶。

协整关系存在的条件是：只有当两个变量的时间序列{x}和{y}是同阶单整序列即I(d)时，才可能存在协整关系(这一点对多变量协整并不适用)。因此在进行y和x两个变量协整关系检验之前，先用ADF单位根检验对两时间序列{x}和{y}进行平稳性检验。平稳性的常用检验方法是图示法与单位根检验法。

下面举个栗子，我取了601169北京银行，601328交通银行两只股票，看它们在2013年一年的时间序列是否存在协整性。