6.8 多变量近似值求解

    在复杂的经济模型中,如果要找到两个或者更多独立变量的组合,从而进行最好的解析或者得到最好的价格预测模式,那么,回归分析法就是最常用的一种模式。从大豆的年度生产和分配的一个简单的应用程序之中,我们就可以看到在决定大豆价格的问题上,相关因素是不是非常重要的,因为对大豆及其副产品的需求因素是非常复杂的,所以我们不应指望只使用两个独立的变量就能得到一个非常精确的模型。然而,当你加入其他因子时,相应的求解方法则是相同的。下面的第一个范例将使用一个如表6-8中所示之小的数据样本;同时,在本节的收尾处,我们将使用更长的时间数据相对小麦而应用相同的方法进行分析。

    表6-8 多元变量的汇总值

    首先,我们应用最小二乘法进行简单的线性回归计算,且两个独立变量的方程是:

    式中 y——在相应情境之下大豆的最终的价格;

    x1 ——总产量(供给侧);

    x2 ——总分布(需求侧);

    a0 、a1 、a2 ——被计算出来的常数或加权因子。

    由于在线性近似公式之中,此问题的解将通过每一点误差的平方和(S)的最小值而被发现,而在这里,我们设为第i个数据项的近似值,设yi 为实际价格,则

    现在,我们用之前的方程对近似值进行迭代,则

    两个独立变量x1 和x2 所构成的多变量模式的求解方法需要以下三个最小二乘法的方程联立计算,即

    求解上述三个方程的步骤与系数消除法的曲线回归模式相同,相应加总值可在表6-8中被计算出来,然后,将相关数值代入以上的三个方程之中,则相应结果是:

    同时,通过矩阵消元法,我们得到如下的系数值,即 [1]

    上述结果显示了:a0 =-1.641,a1 =3.9703,a2 =0.8183,如此,价格的多元回归近似值为:

    其中,x1 是以10亿蒲式耳计的大豆产量;x2 是以10亿蒲式耳计的大豆需求量。

    由于供应系数远远大于需求系数,因此在确定价格时,供应系数是主要因素。如果x1 或者x2 的系数较小,那它就失去了意义。那么,当确定价格的要素并不总是显而易见,且可能得出部分较小系数的时候,我们应该选择使用哪些数据?在上述这个范例之中,我们选择供需数据来确定价格,但是,供应和通货膨胀率或需求和通货膨胀率也许会是更好的选择。此外,上述模式总能给出一个答案,即使所选择的数据是错误的也不例外。如果想发现哪组数据是最好的,那每组数据都必须经过检测,并且,你要将预期值的方差与实际价格相比较。如果你已经使用了合理的输入方法,那么,最适合的、最好的选择应该是方差最小的那一组数据。

    与完全可编程的电子平台一样,附带最小二乘法和多项式求解程序的用户软件是可以被利用的,这可以将相应的求解方法提供给每一个人。而如果要观察一组较长期的小麦数据,我们可以从《美国大宗商品研究年鉴》(Commodity Research Bureau Yearbook)(由John & Wiley Sons出版社每年出版)中获取。同时,我们可以通过世界产量来计算供应值,再从产量中减去期末库存,从而计算出需求值以供我们使用。最后,芝加哥市场的现货价格可以作为一个被预测的数值而选择。另外,1971~2000年的数据可被采用。但是,在表6-9中,其只显示了初始几年的数据,关于小麦供给和需求的完整电子表格和预测结果,你可在英航网站上的Wheat supply and demand程序中发现。

    表6-9 初始数年的小麦数据所相关的多变量求解模式及相应的预期价格

    上述现货价格的求解方程为:

    如此,我们可以求出:a0 =0.290926,a1 =-0.01399,a2 =0.028385。

    图6-12显示了价格预期值与实际值的比较结果,其中预测值相当合理地接近相关的现货价格,它们在大多数的年份当中都是朝着同一个方向运行;但是,相应的波动率很低。或许,相较于最终只依赖美国股市的数据而言,根据全球的需求量则可以做出一个更准确、更好的预期。那么,依据供给和需求的相应估值则会对价格做出一个合理的、较好的预期。

    图6-12 小麦价格相关的多变量求解路径

    最近,神经网络和基因演算方法被应用于供给和需求复杂问题的求解过程当中,此两种模式在非线性的求解模式上均具有优势。也就是说,与大豆问题相关的多变量求解模式显示供给效应比需求效应大4倍。但是,当供给受恶劣天气影响时,神经网络的求解模式可能有资格得到答案,即赋予天气恶劣年份中的供给量以较大的权重,基因演算方法和神经网络这两种方法都会在第20章中进行探讨。

    6.8.1 标准普尔指数建模所选择的数据

    股票行情由一个健康的经济环境和较低的利率所引导,而良好的经济环境意味着相关经济体有较高就业率和积极的消费群体,消费者可支配收入可以用于购买房屋、耐用消费品、各类服务以及无聊的项目。同时,低利率政策可以通过减少债务的方式增加企业的盈利能力,并且以较低的成本向房主提供抵押贷款。总之,每个国家的中央银行都要进行细致的策划来促进经济的增长以及控制通货膨胀,在美国,这样的机构就是美联储。

    为了创建一个稳固的标准普尔指数模型,我们需要用经济数据来解析标准普尔价格的变化,而且,我们有必要选择那些最有意义的数据,以下的建议是由林肯提出的, [2] 其用于预测6个月的标准普尔指数价格: [3]

    (1)标准普尔价格是指标准普尔500指数的现货价格;

    (2)公司债券或国债的标准值等于BAA公司债券收益率除以30年期国债收益率,再减去历史均值;

    (3)美元的年度变化值等于美元的12个月变化值减去1,这可能是基于纽约期货交易所的美元指数(在第2章中讨论过的)或主要货币的权重;

    (4)联邦储备基金利率的年度变化值等于联邦基金利率12个月的变化值减去1;

    (5)联邦基金利率或贴现率的标准化数值等于联邦基金利率除以贴现率,再减去历史均值;

    (6)货币供应量是M1货币供应量,其不做季度性的调整;

    (7)年度消费者价格指数等于CPI的12个月变化值减去1;

    (8)通货膨胀指数或反通货膨胀指数的数值等于年化CPI指数一个月的变化值除以12个月的变化值,再减去1;

    (9)领先经济指标是指在领先经济指标中的12个月变化值减去1;

    (10)标准普尔现货指数的1个月震荡指标相对于10个月的震荡指标是指月度均值与大约200日的10个月均值之差;

    (11)通货膨胀调整的商业贷款是指在商业贷款中,经过通货膨胀调整的12个月增长值。

    林肯以20年的月度值提前6个月预测标准普尔指数的价格。其中,某些周数据也可用,并且其可能适应于更短的时间框架。然而,如果想以周数据或月度数据来得出一个精确的天数据,我认为这是不合理的。同时,高频的标准普尔数据与月度统计值是不一致的,其导致更多的噪声,从而使测试结果不值得信赖。

    在上面列出的11项中,所缺少的一个元素是波动率的调整模式。在过去超过20年的时间里,于标准普尔的价格之中,增长幅度已经达到600%的规模,如此则表明标准普尔的波动性非常高。因此,一个简单的百分比相关性可能不会充分地描述前述这种变化,但是,在找到一个更好的方式之前,我们只能使用它了。同时,伴随着价格的上下浮动,相关各项会或多或少地变得不稳定,所以,我们必须使用波动率标准化因子来进行纠正。例如在正常情况下,当标准普尔的相关数据于初始时刻的正常数值100,而如果我们需要考虑最其初始波动率,那么,当指数价格达到1400点时,我们就要将当前波动率除以14而使之标准化。或者,我们也可以应用一些波动率的稳定调整模式来规范,此种调整模式适用于所有项目,而货币供给以及通货膨胀率/反通货膨胀率的指数除外。切记:收益率常用于计算利率而不是价格。

    6.8.2 多变量求解的广义模型

    一般来说,我们将n个自变量之间的相关性表示为:

    上述这个方程的解是相对于两个和三个变量而言的自然展开模式 [4] 。而n+1个变量所对应的n+1个方程是由n+1个解汇总而成,其将2阶方程乘以x1 、3阶方程乘以x2 ,如此等等,即

    对以上方程组进行手动求解是不切合实际的,但是,使用在数学软件库中的单一程序可以很快得到答案,如集合数学与统计函数的链接库IMSL程序、专业统计程序(ProStat)、Matlab程序或者使用Excel的矩阵函数matrix functions(更多详细的范例见附录B)。在回归分析中,有一点经验的交易者应该记得:在数据点范围内的模型是最精确的;当预测值超出样本数据范围以外时,回归公式的预测质量就会随着时间的迁移而降低;最有可能的结果是在几年之前,相对于同等的交易水平而言,相关的利率和粮食价格之间的求解模式会被应用;但是,其对于过去几年中的指数行情与黄金价格的求解方式会生成一些误判的新高点,因此,它是不可靠的。

    许多因变量(xi )可被用于提高生成最好拟合度所相关的概率,这个求解模式的预测质量将取决于自变量的相关性,其最好是始于一个时间序列相关的明显要素,如通货膨胀,然后再加入标准的经济统计数据,包括消费者物价指数、工业品产量以及特定市场所评估的供求信息。而相对于粮食和能源市场而言,累积的库存或储备数量对价格的影响很大;同时,这些因素对预期的季节性变化来说也很重要;另外,其在指数调整方面也具有代表性。此外,使用月度数据意味着你必须有很强的风险承受能力,因为即使是最好的模型,其也没有考虑价格在月际之中的波动率。而对误差项的测量估算模式将帮助你确定是否有必要导入额外的要素。当完成前述工作程序时,你要查看a的数值;你也应该丢弃那些很小的值,被深入的项目越少越好。

    6.8.3 最小二乘法的正弦求解模式

    当你知道有某种价格运行模式具有季节属性或循环属性时,那你可以将三角函数的正弦和余弦模式作为一个多元线性方程的特例,在价格系列之中,我们可以观察周期性的峰值和底点,所得到的启示可能是其中存在一种循环模式。循环分析比较著名的使用方法之一是由赫斯特(Hurst)在《盈利魔法之股票交易的时机选择》(The Profit Magic of Stock Transaction)一书中提出的,其中有一个范例应用了道琼斯工业平均指数相关的傅立叶分析模式,而对循环分析问题的全面探讨以及三角函数的估测模式可以在第11章中被提及。

    所谓周期性价格运行模式的近似方程是:

    而一个广义多元近似值的特例是:

    式中 P——每个周期数据点的总量;

    x1 =t——时间要素的增量值;

    x2 =——一个循环因子;

    x3 =——一个循环因子;

    x4 =——变量因素的振幅;

    x5 =——变量元素的一个振幅。

    如果你使用月度数据来计算季节性,那么数据点的数量P在每个周期都是12;如果你相信这里有一个周期,那么,你就可以发现主要价格峰值之间数据点的平均值a1 t项将虑及序列的线性趋势;2π项指的是一个完整的循环过程,且2πt/P是一个特定周期t的截面值(1/P),其反过来又在同一循环之内,于不同的数据点增加了正弦函数或余弦函数的权重值。

    在其他的表格方式当中,我们可以同时利用与广义多元方程相同的方式导出相应的线性方程,同时将汇总表进行迭代,并且,利用附录B中的技术来求解系数矩阵a0 ,…,a5 的值。

    [1] 矩阵消元法是解决多变量问题的必要的方法,附录B包含了必要的计算机程序以执行其操作。

    [2] Thomas H.Lincoln,“Time Series Forecasting:ARMAX,”Technical Analysis of Stocks & Commodities(September 1991).

    [3] 注意,在数据列表中的“-1”指的是收益率的计算过程,即最终值除以初始值,再减去1。

    [4] 类似于泰勒公式。——译者注