20.9 分形模式、噪声模式以及熵模式
所谓混沌情境是能够引起市场分析师注意的另一个领域,而混沌理论则是描述非线性系统复杂行为的一种方法,其不能以线性的形式描述,所以其也被称为非线性动态情境。在最初,混沌系统看起来是随机的,但其所给出的结果却是“没有任何的形式或方法”。其中一种解释是:小事件显著地影响了看似无关的情境。如果我们考虑连续不断的新闻对资产价格的影响,那么,其对相关价格的影响力在最近一段时间内可能是最明显的,但价格会随着其他消息被一同播报出来而恢复正常。
我们可以应用各种几何形状来测量混沌系统。由此,数学领域中的分形几何概念则因之诞生,这种方法对真实世界中的相关数字的运作过程做了仔细的刻画。 [1] 我们所有人都在学校里学过欧几里得几何定律,它是由直线和平整的边界所组成,而我们可以很容易地测量一条线的长度或矩形的面积。然而,在现实世界中,不存在直线,如果硬要说的话,那么使用一台显微镜进行仔细的观察,如此则可发现:所有的“直线”的边缘都参差不齐,而所有的不平整情境都可以被描述为混沌状态。
20.9.1 分形维数
在分形几何中,我们发现有一种方法可以表示数字的不规则性,同时显现自然界中的结构形态。首先,我们必须接受一个概念,即本质上没有整数,现实世界的对象更有可能被描述为分数,或者具有分形维数性质,其中典型的范例情境就是海岸线测量过程中的代数值,其与“海岸线多长”以及“价格走高多少”的问题非常相似。
上述这两个问题的答案是,相应数值取决于相关物体是如何被衡量的。若扩展本书前面的范例情境,那么,我们就应该考虑使用大的挂图来测量澳大利亚海岸线。如果我们使用一个12英寸的格尺,并将其每一端放在海岸线的一部分,我们则可能会发现海岸线大约是10英尺(根据比例尺,实际距离可能是10000英里)。如果使用一个12英寸的尺子,则要求我们穿过海岸线的水面部分;在其他情况下,我们可能会跨越一个大型港口,以便使尺子的两端接触海岸线。如果我们采取一个稍小的格尺,我们的测量会更加精准,也许,已经发现的海岸线是15000英里,而一个更小的尺子会更好地跟随轮廓,并发现20000英里的海岸线。随着尺子的规模越来越小,海岸线则越来越长。如果我们有一个无限小的尺子,海岸将无限长。而对于“海岸线有多长”这个问题而言,真的没有正确的答案,这个问题的答案取决于格尺的长度。
分形维数是一个结构或系统的粗糙度或不规则度。在许多混沌系统中有一个恒定的分形维数,也就是说,用于测量的区间将以正态分布的近似方式对所得到的数值进行预测。因此,如果我们用一个12英寸的标尺来获得10000英里的海岸线,那么,我们就可以预见到海岸线与格尺长度的相关性,即,
·24英寸的标尺 5000英里海岸线
·12英寸的标尺 10000英里海岸线
·6英寸的标尺 20000英里海岸线
这里需要注意的是:24英寸的大型标尺所导出的数值实际上小于正常的情况。这是因为:当你在地图上把一个长的尺子从一个海岸点移到另一个海岸点时,它必定会穿过一块陆地。
20.9.2 分形效率的应用模式
在第1章和第17章中,我们讨论了考夫曼的效率比,这个比率的计算过程是:以n日周期内的价格变化的绝对值除以所有的变动值之和,其数值为正数——如果比值接近于1,则行情是平稳的(不混乱);如果比率接近于0,那么市场行情就存在噪声很大的随机变化因子,这种度量方式被称为分形效率。在第17章中,当相应比率接近1或0时,考夫曼认为:市场存在趋势形态和非趋势形态。虽然每个市场都有其独特的噪声水平,但分形效率的测量应当在所有市场上保持一致。即使这些混沌因子所生成的方式在技术上是相同的,但是,市场行情可能会有不同的波动率,因此,从理论上讲:通过匹配分形效率和波动率,我们则可以将一个市场的特征与其他市场的进行比较。在现实中,由于市场的参与者和相关的流动性具有多变的属性,所以,分形效率的差异是很小的。然而,一旦我们考虑到这些差异,那么,对待价格行情的方式则趋于同质。
另外,以分形效率为噪声的解析模式为相关交易制定了一些规则,例如,一个噪声较小的市场应该使用顺势交易系统快速植入订单,如果当前市场被认为存在高倍的噪声因子,那么我们最好等待更合适的交易价格。实际上,一个复杂的市场会伴随着不断变化的行情,而一个有效的市场则是平稳的。从长远来看,市场的噪声水平应该决定每个市场所适用的交易策略,而这些特征在选择交易规则,且将理论模型转化为可盈利的交易系统方面是很重要的。
20.9.3 混沌模式和市场行为
价格上的混沌模式是很容易想象的,但却很难去衡量。如果每个参与者对相同的事件都以同样的方式做出反应,那么,预测价格变动的方向就没有问题了,这就像一颗行星能够绕着一个太阳平稳地运行一样。在现实世界中,没有什么比这更简单的了。现在,我们考虑一种模式,价格a、b的运行模式类似于绕月球运行的两个同质量行星P1、P2。因为行星比月亮大,所以我们称之为引力因子,每当月亮穿过一个引力因子相较于另一个引力因子而更强的中点时,我们将得到一个摆荡模式,如图20-15a中的直线所示。点a处的月亮受较近引力因子P1的影响最大,但是,随着循环模式的演进,它可能越来越接近P2,并尝试在该行星周围形成轨道。它可能形成一个8字图形,且在P1和P2之间切换,最终到达P2的远端的位置b。此类分析的潜在模式过于复杂,而且,其要根据P1和P2之间的距离,以及P2与P1的规模而变化。如果引力因子P2较P1大得多(见图20-15b),那么,在直线位置P2处周围的轨道将变得简单,其不是将轨道从一个行星切换到另一个行星。
图 20-15
尽管上述这些模式可能会比较复杂,但其与现实相比已经相当简单了。实际上,每天都有不同程度的重要事件作为引力因子进入市场;每个引力因子都有一个初始的重要性,同时每个引力因子都会随着时间的推移而失去其初始价值的重要性。更糟的是,我们无法预测何时会出现新的引力因子或新闻事件。我们虽然能够预测时间性事件,比如经济报告,但是,我们却无法预测其影响度,这使得混沌模式与落在池塘上的雨滴非常类似:每一个新的雨滴都相当于一个新的事件,且伴随着大小规模不断变化的情境,最后落在一个不可预测的时间和地点,并形成圆形的波纹,这些波纹会随着接触点的远离而消散,这与事件的重要性随着时间推移而消失的情况是一样的。还有,雨滴类比的有趣之处在于:虽然我们无法预测下一个雨滴的着落点,但是,一旦它着陆,我们就能完全确定它的影响,直到下一次的雨滴落下为止。前述这个类比与市场行情非常相似,因为价格冲击的频率和大小就像雨滴一样,在较短时间内,市场上偶尔也会出现一个较大的事件淹没较小事件的行情噪声模式。
20.9.4 熵模式——相似情况下的预测
通过寻找相似的组合因素、类似的情况以及过去发生的事件来预测未来的方式一直是基本面分析师所使用的技术。我们有必要将主要经济指标的状态与可量化的政府政策相匹配,然后,看看价格如何对这些类似的设定情境做出反应。 [2] 整体的制图区域(传统上称为技术分析)是基于一个特定图表模式下的可预测结果。这些模式可以是非常简单的,也可以是非常复杂的,其存在于一个单一的时间框架或者是多个时间的复合框架中。
有一种数学方法最接近于识别价格模式中的相似性:熵模式可以度量两种行情相似的概率。熵模式值越高,以往模式的效应则越有可能预测当前模式的效应, [3] 这与自相关有形似之处,它可以衡量过去数据预测未来数据的能力。
1.熵值的相关问题简析
熵是期望值的度量方法的更高级的形式。如果一个系统的输出项是已知的,且没有不确定性,那么熵值为零。当熵值较低时,则系统的状态很容易预测。当系统输出的结果存在不确定时,则熵值趋向1,并且行情存在较多的混沌状态。现在我们设熵为H,其被定义为价格x的函数,相应公式为:
其中x可以有n个不同的值,而pi (x)是结果为x的第i个值的概率,当系统只有一个可能的结果时,n=1,然后H(x)=0。如果所有可能的结果都有相等的概率,那么不确定性的数值最大,其中H(x)=log(n)。因此,如果有16个可能的结果,最大熵是4。通过最大值log(n)来将各项的值规范化是很方便的。
例如,我们现在考虑一个特定图表模式的价格变动情境,在每日交易区间顶部10%的范围内,股票高于200日移动平均线。第二日行情运行的频率假设情境则如表20-4所示。其中各列的计算遵循公式H(x),并显示结果H(pattern)=2.20。6组变量的最大熵值为log2 (6)=2.58,因此,应用这种模式对未来1天进行预测时,其间存在着很大的不确定性。
表20-4 已知行情模式下的价格变动频率,同时附带熵的计算模式
2.条件熵
条件熵将给出基于当前价格模式的运行情境与之前价格模式的测试结果相似的概率。我们首先需要建立一个频率分布表来构建相应计算模型的基础。表20-5给出了在当前价格高于200日移动平均线的情况下,一个完整的图表模式所生成的价格变动的次数;左侧刻度值为1,其表明该模式已完成;如果数值为6,那么,此时对模式的识别度最小。其间,顶格位置显示了第二天的价格变化情境所占的百分比值。这些频率显示,当图表模式接近完成但尚未完全结束之时,价格变化1%和2%的情境是最常见的。
表20-5 在价格超过200日移动平均线时,给定完备的图形模式后价格变动的频率。1表示已完成的模式,5表示相关模式的初始情境
条件概率可以从表20-5的频率分布方式当中计算出来,如表20-6所示。为了计算状态j条件下变量Y(因变量)的条件概率,我们则可以根据状态i的条件下给定变量X(自变量,过去模式)来计算相应的概率,输入P(Y=j|X=i)。然后,我们可以将两个状态nij 的出现频率除以状态i的总频率,在ni 既定的条件下,X条件下Y的概率Pj/i 为:
表20-6 给定完备的模式下的条件概率,相应数值对应于表20-5
在上述这个假设的范例情境中,当图表模式完成时,相关概率是最高的,同时价格波动也是最大的。在用真实数据进行的测试中,我们可能会预期在+1和+2列项下的第二行会显示最大的概率,而右下角的值很高,但其仅以1个值为基础,因此它们是不可靠的。另外,条件概率可以被输入到条件熵的最终公式中。
条件熵是基于在X(第一个事件或模式的完全性)条件下Y(第二次事件或价格变化)的条件概率H的熵的平均值而构建的,相应公式为:
上式中,H值越高,预测值越大。
[1] 关于这个话题的很好的讨论模式被埃德加·彼得斯(Edgar Peters)发现,相关著作为:Chaos and Order in the Capital Markets(New York:John Wiley & Sons,1991)中可以找到。海岸线的例子最初归功于本华·曼德博(Benoit Mandelbrot)。我们在互联网上搜索“金融市场混乱理论”可以找到其他相关书籍。
[2] 有一个数据服务器(LIM,逻辑信息处理器),提供了广泛的基本面分析和价格的数据,同时其可用于比较过去事件及其效应。
[3] 关于有条件熵的数学,有一个完美的范例情境,我们可以参考网站http://tecfa.unige.ch,其由菲利普·勒梅(Phillippe Lemay)所撰写,本部分内容就是根据他的作品改编的。