英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
时间序列因果关系的归一化处理
摘要:近来,一个被用来计算信息流的严格而简洁的公式被推导出来,因而使得时间序列间的因果关系能够被定量地描述。为了评估所得到的因果关系的重要性,需要对其进行归一化处理。归一化是通过将信息流从接收方的边界熵演变方程平衡方程的Lyapunov指数状的一维相空间伸展率和信噪比中分离出来而实现的。其已被自回归模型所验证并应用于一个实际的金融分析问题。该问题展现了早期年代从IBM(International Business Machines Corporation,国际商业机器公司)到GE(General Electric Company,通用电气公司)的一个异常强大的单向因果关系,并向我们揭示了一个关于“七个小矮人”与巨人在大型计算机市场上相较劲的这样一个几乎湮没无闻的古老故事。
- 引言
长期以来,信息流,亦或是其它文献中提及的信息传输,被认为是对动态活动因果关系的逻辑音度量(logically sound measure)[1]。它拥有所需的不对称或定向的因果关系,此外,它还满足例如格兰杰因果检验等的其它统计检验的定量表征[2]。出于这个原因,在过去的十年里对这一领域研究的兴趣激增。信息流的度量提出迄今包括,例如,时间延迟交互信息[3],传送熵[4],瞬时信息传送[6],和因果关系熵[7],其中传送熵已被证明是等同于二维线性系统下格兰杰因果关系的一个因素[5]。
最近,已有证明在动力学框架内,信息流的概念实际上有严格的支撑。从一个组分流向另一个信息的速率可以从第一原理得出,而因果关系的预期属性则是已验证的定理。
在仅给出一对时间序列,而不是一个系统的情况下,原则上其信息流是可以被求出的。特别的,在加法性噪声的线性模型假设下,(4)式中最大似然估计(Maximum Likelihood Estimate,下简称MLE)的信息流证明在形式上是紧支的(very tight),只涉及共同的统计数据,即样本协方差[11]。以两个时间序列和为例,从到的信息流率的最大似然估计被示出为
, (1)
其中,、分别是和、和的协方差,而是使用欧拉前差方案下的差分近似[11]。理想状态下,当时,不是的因,反之亦然。很容易看出,如果,则,但当,并不一定为0。也就是说,对立肯定地(contrapositively),因果意味着相关,但相关并不意味着因果。(在整个文本中“因果”和“因果关系”为同义词。)在这样一个明确而定量的方式下,解决了关于因果与相关这一由来已久的争论。
不同的情况下,信息流的绝对大小可能会有所不同。因而为了能对信息流的重要性进行评估,它就如同协方差那样,需要进行归一化。在不存在因果关系的情形下,虽然理论上对应的信息流速率应该是0,但在现实中,从时间序列的估计一般不是完全为零,则不能通过绝对大小来判断因果关系是否确实存在。
一个简单的例子可能有助于说明问题更好。考虑两个自回归过程产生的序列,
, (2a)
, (2b)
其中误差(随机数) 和是相互独立的。生成一对各有80000个值的序列{1}并进行因果分析。表I是不同情形下信息流速率以及90%的显著性水平的置信区间。(由于是伪随机数产生,不同序列结果可能略有不同。)
表I:各自序列产生的的信息流速率以及90%的显著性水平的置信区间产生的系列。单位:。 |
||||
Case |
|
|
|
|
I |
0.5 |
0 |
14815 |
-25 |
II |
0 |
0 |
-0.1370.219 |
0.1280.219 |
III |
0.01 |
0.01 |
1.6480.692 |
1.1230.639 |
CaseI中,,可以认为是从到的单向因果,并且(从序列的设定上来看)这确实如此。而CaseII中,从数字中并不能看出太多内容。数字虽然小,但他们也仅仅告诉双向信息流的同等重要性。当然,有人可能会说,统计显著性检验表明在90%的水平,这些信息流速率与0并不是显著不同,然而,这些试验只是为了揭示在可得到的数据情况下,(该方法/公式)估计的准确程度;这取决于,例如,由不相关的被估计的参数构成的系列长度。换句话说,如果包涵更多的数据,那么这微不足道的速率估计就有可能会呈现显著。为了更清楚地理解这一点,看看CaseIII。显然,信息流,尽管存在,但对各自的序列只有微小的贡献,耦合系数小了超过1个量级;在经典扰动分析中,它们是在一阶近似中可以被舍弃的。在90%的显著性水平下,所计算的信息流与0相比是不同:一方面,这证明了形式主义的成功。然而,小的数字不能体现其重要性,因为,对于一个缓变序列而言,甚至主要的流量都可能是非常低的。另一方面,如果我们将序列减半,并选前40000个点进行分析,那么结果将是和(单位: NATS/次),即不显著而显著。(同样的,这些小的数字可能会由于伪随机数发生器而有所波动。)难道可以由此得出(CaseIII)是一个单向因果关系的结论?或者可以断言缩短后的序列产生了一个更可靠的估计?当然,这是荒谬的。这里的问题是,我们确实需要一个归一化的信息流来评估信息流相对于其他因素的重要性。在这项研究中,我们提出了一个方法来获得这样一个流,并将其应用到几个现实的金融时间序列分析中。
- 信息流的归一化
信息流的归一化并不像字面上那样简单。就像相关系数暗示的那样,浮现于脑中一个很自然的归一化方法可能是自身转移出来的信息(与自身之比)。然而这就存在一个障碍,就是这个量可能会是0,就像当年在埃农映射(Heacute;non map)中我们以前曾研究过的一个基准问题(见文献[9])。另一个障碍在于作为基于柯西 - 施瓦茨不等式的相关分析,上述的和通常不采用相同的归一化,即两个相同的信息流振幅在其各自序列中可能代表不同的相对重要性。为了声音在逻辑和物理上均达到归一化,我们需要得到一些基/一些基础知识 并分析一个系统中的信息流是如何导出的。考虑一个二维的随机系统,
, (3)
其中是漂移系数(drift coefficients)向量(微分向量场),而是一个随机矩阵,是一个二维的标准维纳过程。令且为的边缘概率密度。已证[10],从到的信息流速率为:
, (4)
其中表示数学期望算子。信息流方法中双方之间的(信息流动是)不对称,极其特别的是,如果过程中对的影响不依赖于,那么从流向的信息为0,即,不是的因。这是因果关系的所谓的特性,这一事实不仅体现在应用上更是经过了严格的验证。
若非0,那么其非正即负。理论上,正的表示使得趋于不确定,而负的则会使得的熵减小。更多细节可参照文献[11]。
X1的边际熵变率[10]:
, (5)
它实际上是两个互斥机制的结果:第一项如同(4)式所示,是信息流的;第二个是补体,即,不考虑下熵的增加速率。后者已经在[10]中证明:
, (6)
等式右边共有3项。第一项是自身地无随机性时的变率。这是一切后续工作的起点,此项工作我们于2005年建立了严格的公式[8]并随后给出证明[9]。因此,经过仔细的分析,在边际熵的变率被分解成三部分,
, (7)
, (8)
和(4)式中的,分别对应着方向的相空间扩张,随机过程和从的信息流。图1给出示意图。注意到,此分解方法中边际熵演化方程(5)并没有直接表现出来,因为这两个随机项相互抵消。
这样一来,归一化就非常简单了。令
, (9)
显然,除非不变化,否则的振幅定然不小于且不为0。我们因此选取作为归一化算子并定义
, (10)
在此情形下,如果,那么的变化100%是由的信息流引起的;如果近似为0,那么并不是的因。因而,可以评估相对于其他过程对影响的重要性。
需要指出的是以上归一化仅仅用于。对于,则是
,
这二者的大小有可能会大相径庭。这,从另一个角度来看,反映了和的不对称性。
- 评价
和文献[11]一样,考虑一个线性的随机微分方程(3),
, (11)
其中是常向量,并且和是常数矩阵。最开始,如果服从正态分布,那么它永远是一个正态分布。令均值和协方差矩阵分别为和。其演化方程为:
, (12)
。 (13)
那么,(7)式和(8)式可以精确地表示为:
, (14)
且
其中和并不依赖于。但,且是紧支的,那么等式右边的第二项就为0。因而,
, (15)
(14)和(15)式以及我们之前已经得到的从到的信息流[8, 11],共同构成了边际熵的演变。
注意到,其中,说明其始终为正。换言之,噪声总是会对的边际熵的增加有正的贡献,这一点是符合常识的。在金融经济学,这反映了股票的波动性。对于一个平稳的序列,(13)式的等号左端项趋于0并且等号右端要达到平衡需要满足。所以这个量也与信噪比有关。
如果我们仅有一对时间序列,那么上述结果需要估算。因为,我们所知的只是一些未知系统的一个实现,而对于这些系统而言,若果已知,可以得到无穷多的实现。那么问题就转化为利用给定的时间序列中的统计信息来推定(14)和(15)式。
我们采用最大似然估计来实现这个目标。如果读者想要了解更多细节,请参阅参考文献[11],整个详细的推导过程,此处不再赘述。假设序列的采样的时间步长恒定,并令为采样数。更进一步假设,(因而)。已证明[11],在最大似然估计下,,,(上划线表示样本平均),其中
, (16)
, (17)
其中,是和的协方差,而则是和的协方差,其中。(通常情况下,为了保持精度,;但在一些确定性混沌中,样板采样处于最高频率上,那么)。 的最大似然估计可以通过计算得到。
另一方面,人口协方差矩阵可相当准确地由样本协方差矩阵估计出来。因而经过一些代数运算,(14)式和(15)式可以表示为:
, (18)
。 (19)
正如参考文献[11]中一样,这里的和(以及接下来的)都应该加一个尖冒号,因为它们都是样本的估算结果。我们依旧用上述三者来分别代表各自的样本估算量,以避免符号过于复杂。有了这些,归一化算子可以写作
, (20)
并因而,我们得到了从X2到X1的相对信息流:
, (21)
同样的,可以通过交换和的各自表达式中的指数获得。
- 回顾自回归模型
我们再回到开头例举的自回归模型。当,,计算出的相对信息流速率为
,。
很明显,相对于它们各自所对应序列的其他过程,它们两者对各自序列熵变率的贡献是微不足道的。而对于的情形下,这些小数据可能会让人难以抉择,而计算相对信息流速率是
,。
同样的,正如我们预期的,两者本质上也是可忽略的。
需要指出的是,相对信息流,仅仅对而言有意义,因为相对信息流仅仅是绝对信息流与自身序列的比较。假设这样一个情形:一个双向因果系统中和大小是相同的,他们在各自序列中的相对重要性可能是很不一样。例如:
,
,
和与(2)式中的含义相同。和的初始值为的随机数,并且迭代80000次(与之前一样)。计算
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[29117],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。