6.3 线性回归模式

    当大多数人谈论回归问题时,他们通常会考虑通过一段周期价格行情的中心点位来刻画一条直线,就像图6-1所示的那样。在本章的结尾处,通过对相应趋势系统的讨论和比较,我们将应用一个单一的价格系列,并使用线性回归的斜率来创建一个顺势交易的方法。但是,对于解析两个价格系列的相关性而言,回归模式则是一个简单且强大的分析工具。在计量经济学中,分析师常常使用多元回归的方法来寻找诸如供应、需求、通货膨胀以及价格等各种因素之间的相关性。

    在本章之中,回归分析模式具有以下用途:

    ·对单一市场而言,回归模式本身就是一个交易工具;

    ·回归模式可以发现两个市场和两列数据之间的相关性;

    ·可对各类金融工具进行排名。

    回归分析的数据输入模式必须是频率相同的两个时间序列,通常为日间、周际或月际的数据。在交易时,我们将使用每日数据,但是,对于经济关系的分析而言,使用月际数据会更好。我们从两个价格系列之间的线性关系开始,设其为X和Y,而线性关系方程将试图找到Y值(因变量)以及每个X值(自变量),其设定一条直线,并使用公式Y=a+bX来获取相关的数值,其中,a是直线Y值的截距项,即当X值为0时,相应直线函数与Y轴相交的点位,而b是斜率项。线性回归模式也被称为直线拟合,或者仅仅是最佳拟合,它选择距离大量数据点最近的直线位基准。现在让我们举例说明,比如在X系列中,如果发生1个美元的行情移动,那么我们就可能在Y系列中预期一个1.50美元的行情波幅,或者我们也可以预期相关的通货膨胀率会于每日提高大约0.000029%的玉米价格。我们将使用两个范例来应用线性回归模式:第一个是基于大豆价格来解释玉米的价格波动,第二个是根据实物黄金的价格来解析巴里克黄金公司的股价(ABX)。

    6.3.1 回归分析是解析模式而不是预测模式

    你可能已经注意到我们谈及了相对于巴里克黄金公司股票价格而言的黄金金块价格,这并不代表我们可以预测价格。同时,我们发现了前述两个价格系列之间的于以往时刻所具有的相关性,而你可以决定的是:无论何时,如果两个价格系列彼此之间走得太远,这种存于两个市场之间的相关性可以在交易之中被使用——你可以基于另外一个市场的价格,应用回归分析的方法,构建一个可视的、具有公允价值的市场。另外,为了预估一个价格,你所要进行预测之日的条件要与被计算的回归周期大致相同;同时,你还必须考虑精度的缺失或相关的信心度,从而将相应的预测模式融入未来的趋势当中。

    6.3.2 计算最佳直线拟合度

    最简单的线性回归的范例被称为最小二乘法,其是交易者最常使用的一种方法。还有一个如图6-1所示,通过一个被筛选的价格运行期间来计算最佳直线拟合度,这种做法与发现两个价格系列间的相关性的做法所采用的是相同的方式,只是相对于第二价格系列而言,其将序列1,2,3,4,…进行了替代,由于周末和假期会打破价格系列的连续性,因此,我们不以日期为因变量。

    我们按10日滚算原则选择了沃尔玛公司股票价格于2002年3月的行情走势,为了找到最好的直线拟合度,我们以一个直线方程作为开端,即

    在上式当中,Y是因变量,因为它是自变量X的值的函数。斜率b是X轴相对于Y轴的变化值,因此如果b=0.20且X是连续的期限,那么在之后的每一天,价格(Y)就会上涨0.20美元;至于Y轴的截距项a,其是一个将X轴和Y轴相对齐的价格水平调整值,即当X=0时,其是相应直线与Y轴的交叉点。

    最小二乘法

    所谓最小二乘法就是要发现一条最接近所有价格点位的直线,为此,我们要计算所有价格和直线所对应价值间的差值的平方和,并且选择一条总标准差最小的直线,其数学表达式为:

    式中 S——在直线之上的沃尔玛公司股票价格的10个点位所对应的各方差之和(1个点对应一个价格,指定为i=1,2,3,…);

    yi ——沃尔玛公司股票在第i天的价格;

    ——直线之上相应价格的估计值;

    yi -——第i天的实际价格yi 与预期价格的差值。

    图6-2显示了上述方程所相关的图形化、个体标准差或误差项的问题,图中每个实际数据点是(1,y1 ),(2,y2 ),(3,y3 ),…,而回归线相对应的点位是(1,),(2,),(3,),…,相应的方差之和S为:

    图6-2 最小二乘法方差的计算模式

    对于上述这些数据点而言,能够导致S的可能值为最小的数据将是最好的,而yi -的平方总是正值,因此回归线之上或之下的价格点位被看作是相等的。

    我们用最小二乘法来解求沃尔玛股票相关时间和价格的相关性,即寻找直线方程Y=a+bX的解,相应公式为:

    式中 N——各数据点的数量(在沃尔玛的范例中,N值为10);

    ∑——对N点求和。

    为了解析上述这些方程,我们使用了电子表格,并在第二列中输入了沃尔玛公司股票的价格(见表6-1),为此,我们构建一个表格,将表中两个公式相关的所有单个表达式的值计算出来。 [1] 现在,我们可以把合计行的价值代入到上述两个方程之中,即

    如此,则最小二乘法方程的近似值为:

    表6-1 以沃尔玛公司股票为范例计算的最小二乘法拟合度

    我们选择X的值同时计算Y值,并将结果列于表6-1的右列之中,如此则代表了直线的拟合度。图6-3所显示的是沃尔玛公司的原始股票价格,其中,直线的近似值每天增加0.707美分,且近似回归线从45.54美元处开始,此时,X=0。

    图6-3 应用线性回归法则匹配的玉米-大豆相关性的散点图

    6.3.3 Excel回归

    虽然运用上面所给出的公式可以进行直接的编程,但是如果我们使用Excel程序,那相应的计算就会变得容易一些,在Excel程序中,我们可以下拉菜单Data/Data Analysis(即“数据/数据分析”栏,如果没有下载的话,这里可以作为一个“插件”来使用),如此可以找到回归函数“Regression”。接下来,我们选择序列值X、价格数值Y,然后,将相应数据输出至右侧的单元格中,这样,Excel会产生如表6-2所示的分析模式:在表的左下方,可以找到y轴的截距和斜率。另外,我们所感兴趣的相关性被标注在顶部,即R=0.92,其显示了一个较好的拟合度(很好!)。

    表6-2 Excel回归方程的输出模式

    6.3.4 用大豆价格来解析玉米行情的变化

    如果我们发现了玉米价格和大豆价格之间的相关性,那就可以给农民提供一种预期,即使其能够确定种植哪一种农作物会取得更好的商业效果。对此,我们使用相同的技术工具,但是这一次,我们使用玉米和大豆的价格系列而不是一个简单的整数序列。表6-3给出了相应的现金价格和中间演算过程,相应斜率=0.282,且y轴的截距=0.336,如此,相应的回归方程式为:

    表6-3 大豆-玉米回归分析的中间演算过程

    资料来源:Illinois Statistical Service;1966-1982,Commodity Research Bureau Commodity Yearbook.

    在表6-4中,其显示了相关性R=0.91——此为Excel模式的解决方案。而图6-3是反映玉米-大豆相关性的散点图,于该图中,我们看到如果玉米以2.00美元/蒲式耳的价格出售,那么我们就可以预期大豆可能会以5.00美元/蒲式耳的价格出售。

    表6-4 玉米-大豆回归分析的Excel解

    上述方式正是我们对农业收入问题的一个预期,因为在美国的大部分地区,每英亩玉米的产量是大豆产量的2.5倍以上,其比率为1∶2.5,所以,当玉米价格为2美元时,大豆的价格是5美元。

    6.3.5 黄金价格与巴里克黄金公司股票价格的回归分析

    这里经常被提及的问题是:“如果黄金上涨1美元,黄金开采企业的股价要上升多少?”这个问题对大众来说是一个敏感的问题,矿业公司不应该多元化经营,而应当把精力集中在黄金产量上。我们一直试图找到巴里克黄金(ABX)公司的股票价格是如何被实物黄金的价格所解析,但是我们只能看到2001年9月11日发生悲剧之后6个月的情境。如果你已经探讨了用于解决玉米和大豆之间相关性的方法,那么你就会明白如何解析电子表格所输出的结果。首先,我们需要准备用于Excel解决方案的数据。我们将ABX公司股票价格和黄金价格输入到一个工作表中,并与相应日期对齐,同时,将任何遗漏日期所相关的数据填充完整。接下来,每个价格系列的指数都从100开始,虽然这一步对这个相应的解不是那么至关重要的,但是如果为了排名而比较各类金融交易工具(本章中的后半部分将有所提及),同时用百分比来显示结果,那确定指数基期数值就很有必要了。在本节中,我们将解决原始数据与指数数据的相关性问题,每个指数值都以It =It-1 ×来表示,其中Pt 是今天的价格(见第2章),同时,这两个指数系列使用相同的比例符号,如表6-5所示。

    表6-5 回归分析而生成的电子表格

    另外,我们将Excel回归函数应用于原始价格,且斜率为0.060,而y轴的截距值为-0.418,这意味着黄金每增加1美元,ABX公司的股价将增加6美分(¢)。如果使用指数值,则斜率是1.012,且y轴的截距值为-2.586,那么黄金每增加1%,ABX公司的股价就增加1.012%,如此则表明黄金和ABX公司股价本质上是一个1∶1的关系(就本范例而言)。为了从指数结果中计算对将来的预估值,我们这里提供了一个公式,即ABXt =1.012×Goldt -2.586。ABX公司股价的估计价值,在图6-4a和图6-4b中,其既显示了实际价格,也显示了其指数价格。在前述这两种情况下,ABX公司的股价预估值可以密切地跟踪黄金价格,然而,当它们各行其是之时,黄金和ABX公司股价之间就会有一个套利的机会,对此,我们将在第13章中进行讨论。

    相应编程语言与电子表格工具

    除了在Excel数据分析的回归函数以外,这里还有一个可以生成相同结果的简单函数,即当你进入Y和X的列表之时,斜率函数Slope(y,x)将归于(return)斜率值b,而当你进入Y和X的列表时,截距函数Intercept(y,x)将归于Y轴的截距项a,一旦你知道所要寻找的目标项,那相关程序就会变得非常简单。

    在交易策略相关软件的开发过程当中,比如TradeStation平台,其中各类函数所计算的结果大致相同——LinearRegSlope函数、LinearRegAngle函数、LinearRegValue函数或LinRegIntercept函数等都可以根据因变量的值进行预期。而在大多数的情况下,交易者只对用来确定价格方向的斜率感兴趣,他们使用日间的数据,将斜率值添加到最近期的价格之中,从而得出明天的价格,即

    图 6-4

    如果预期n天的价格,则将斜率乘以n,即

    由于价格被提前预估,那就容易产生一个较大的误差,关于这一点,我们会在下节进行探讨。

    [1] 在英航网站(www.wiley.com/go/tradingsystems5e)中有计算此类电子表格的格式,其也可以用于其他类型的计算。