23.15 预期收益与实际收益的比较方法
在经济模型或交易系统的发展过程中,最终的选择方式以及在此过程中所做出的选择模式都是基于一种方法与另一种方法相比较的结果。通常的结果是根据信息比率、利润/损失比率、年化收益百分比值、预期的可靠性和下降比率而给出的。尽管这些统计数据很常见,但是我们有时还不清楚它们的预测能力是否准确。在某种情境之下,这些结果是由一个太小的样本所产生的,通常它们不是实际性能的结果,而是一种具有历史意义的测试。这并不意味着模型将会失败,但是成功的模式可能与期望值相差很大。在实际交易中,每个人都经历了一系列的损失,其远远超出了所期望的最高水平,这时你最好知道,这种情况是否会发生在系统的结构范围之内或者系统是否已经失效了。
例如,移动平均系统预计将有大约33%的盈利交易,平均利润为4∶1,但这一体系的前10个交易都是亏损,那么,交易应该停止吗? [1]
23.15.1 二项概率
我们现在考虑将一个随机数字序列应用于交易模型——当损失的概率是p时,于n次交易中,l次损失的概率是多少?这个概率范围内的大部分工作都要归功于伯努利,他的随机漫步被称为伯努利过程:其由帕斯卡的三角形(见图23-16)显示了一个随机漫步的清晰情境,每个格子代表了一个特定时期内前向随机游走的特定头寸所相关的概率,这个过程的测试结果被称为二项式分布。
图23-16 帕斯卡三角形态
前向随机游走模式与价格的运行模式有相似之处,而帕斯卡三角形的边缘则显示出连续随机序列项下连续获利和亏损所相关的概率。其相关序列1/2,1/4,1/8,…,(1/2)n 与轮盘运行的理论模式是一样的。连续损失的概率可以被计算为轮盘运行步长区间所相关的或然率,即(1/2)n+2 。
二项式分布是有用的,其可以考虑于任何顺序所生成的交易序列项下的损失总额,这是一个特定概率点,其于帕斯卡三角形的底部显示左偏(损失)的概率高于右偏的概率(盈利),而二项概率的公式是:
式中 l——损失的数量;
n——总次数;
p——损失情境相关的概率;
!——阶乘(例如5!=5×4×3×2×1)。
我们考虑相关交易系统的前5笔交易,其成功概率是1/3。那么,预期相关的损失数量是多大呢?要回答这个问题,我们必须应用不同的解析模式,即在这种情况下,前5笔交易中有4笔会出现损失的概率是多少呢?令l=4,根据正态分布函数求出所有可能的二项概率B,即
在前5笔交易中出现4笔损失的二项概率约为33%。
表23-14显示了相关交易系统的前5、10和15笔交易的损失概率,该系统具有预测的可靠性。测试结果显示每一个序列相关的最高亏损概率是2/3(平均点),但是标准差相对于均值方差所给出的范围是5笔交易中有2.3~4.4笔是亏损的,10笔交易中有5.2~8.2笔是亏损的,15笔交易中有8.2~11.8笔是亏损的。
表23-14 一种特殊的损失的可能性
注:m=均值,sd=标准差。
这里需要注意的是:在5笔交易的范例情境之中,没有损失的概率只有1%,所有损失的概率都是13%。为了评估,我们会更容易地看到最大的损失情境,而不是最小的损失。对于15笔交易而言,有8%的概率会发生13次或更多次的损失;如果该系统于相关时期产生了12次以上的损失,那么相应的交易方法可能存在问题。
泊松方程和各种偏态分布函数将更适合于交易表现,它们是通常意义的帕斯卡分布之替代形式。众所周知,价格的变化和相关收益有一个倾斜的分布形态且附带一个厚尾区间。
23.15.2 χ2 ——卡方测试
一旦某个系统进行交易并且有足够的数据来提供系统结果,那么我们就可以使用卡方测试来发现实际结果与预期结果之间的简单相关性。样本的错漏项表示为1/N,其会告诉你系统的数据是否充足。
我们假设实际交易结果显示了20%的可靠性(5笔交易中有1笔是盈利的),其要与预期的35%的可靠性相比。如此,所得到的预期结果相关的概率是多少呢?卡方检验如下:
式中 O——观察到的结果或实际结果;
E——期望值或理论结果。
从而:
上式表明实际盈利交易的百分比值要与预期的盈利交易相比较,实际损失的百分比值要与预期的损失交易相比较,相关答案可在表23-15的第一行中找到,它给出了卡方分布χ2 。
表23-15 卡方分布
在表23-15中,概率分布并不均匀,因为如果概率很小,测试结果则是有意义的,其所显示的情境相关的或然率则更小。对于这个简单的二元测试而言,结果P被划分为:
答案χ2 =9.89居于0.1%~1.0%,这是很重要的。对于一个大的样本数据而言,实际的可靠性不应该是20%,而是35%的期望值。
卡方测试可以用来比较实际的价格变动情境和随机模式,查看其是否有明显的变化。基于第22章中第22.3节“博弈技巧——轮盘赌理论”中所探讨的运行次数的预期模式,表23-16显示了随机序列的预期运行模式与价格序列的实际运行状况之间的差异情境。
表23-16 行情运行的分析结果
①最后一组的合成模式是为了在小样本数据的基础上,不对相应的测试结果产生干扰。
接下来,我们根据表23-16的测试结果将其中1~8轮的实际数据与随机分布数据进行比较,进而得出:
根据表23-16,我们在第七行发现8种案例情境相关的概率为55%。
上述这些结果并不重要,轮盘运行理论表明所有的范例情境给出了与概率运行模式相同的情境。我们可以对单独运行或2~3种相邻情境的运行模式进行检查,观察其是否失真。在前述这两种情况下,测试结果都是比较正常的,但其在数学上没有意义,这两种情况的最大差值所相关的时间步长是4~5天,如此则表明相关事件发生的概率是11%。
在扩展运行的行情当中,我们可以发现非常重要的价格运行模式,例如在顺势交易的系统当中,你偶尔会发现20日的计算周期。通过观察价格变动的不对称性,我们可以发现:如果某一日行情反向运行的情境被忽略不计,那么此类运行的意义将会显著地增加。实际上,价格变动不是一个简单的随机过程,也不是一个等额的押注模式。
23.15.3 耶茨校正模式
弗兰克·耶茨(Frank Yates)是一位英国统计学家,他认为卡方测试经常高估少量数据的重要性(低于5个数据点),而此种情境可以通过从每个观测值和期望值之间的差值当中减去0.5的方式来修正,即
这里应该注意的是,应用少量数据点的方式是不可靠的。
[1] 另一种技术是“跌幅所相关的概率”,其在第21章的第21.12.2节中被讨论过。