揭开量化投资模型搭建的面纱

艾玛在之前的很多篇文章里都提到,我们投资是一场概率游戏,我们需要选择去做大概率会赢的事情。

通过量化模型做出的选择,并不是说根据这个策略,每次都能赚钱,而是在大量的交易中,大多数交易会赢,因此,长期而言,就能赚钱。

1. 模型假设

一种常见的量化投资模型是:识别市场过激反应,并反向操作。

这种模型的假设是:市场经常对一些消息反应过激,过激之后,回调的可能性较大。那么,就在发现过激的时候,做相应的反向操作即可。

举个例子:如果有一天,某个汇率的价格突然大跌或者大涨,那么,它们返回原地的机会也就比较高。那么,就在大涨的时候,卖出,大跌的时候买入。

复兴技术创始人之一斯特劳斯曾经在2007年对外透露过他们的做法。复兴技术公司,就是由艾玛提过几次的量化投资代表人西蒙斯创立的。

他告诉大家:如果某个期货的价格在开盘时远远高于前一天的收盘价,复兴技术的大奖章基金就会沽空这个期货;如果开盘价远低于上一天的收盘价,大奖章就会买入 。

因为这个策略广为人知,很多人就从事这类交易。做的人多了,套利空间就小了。不仅如此,还容易矫枉过正,使得策略失效。所以,大奖章基金在2007年对外公开的时候,已经放弃了这个模型。

如何同样利用这个策略,却能跑赢大家,继续赚钱呢?这里的关键有三点:(1)判断什么样的反应算是“过激”;(2)在什么时间点进行操作;(3)什么操作?。对这三点的判断不同,就会产生不同的输赢结果。而量化投资,就是依赖电脑来进行大量的计算,找出其中的最优选择项。

 

2. 量化模型搭建的几个步骤

大多数的量化模型的搭建过程分以下几个步骤:

(1)根据以往的投资经验来制订不同规则;

(2)由电脑来用历史数据对规则进行回测,删掉不符合历史数据的规则,选出候选模型;

(3)放入新的市场数据,来检测候选模型的有效性;

(4)如果候选模型在新的真实数据中继续有效,就开始用于真实的投资;如果候选模型无效,则回到最开始,重新调整规则,再来一次。

以上文提到的大奖章基金的投资规则为例:如果开盘价远低于上一天的收盘价,大奖章就会买入 。假设这个“远低于”的比例是8%(8%只是假设,并非大奖章当年的操作指标)。

电脑会用历史市场的数据(一年、三年或五年),对跟这个规则验证,如果验证发现,大几率是正确的。那么,就会放入新的市场数据,进行检测。

还记得上一篇文章,艾玛提到的量化投资方法的优势吗?如果是人手计算,历史数据这么多,能计算得了多少?电脑就不同,可以每秒钟进行几千几万次的计算。数据越多,最后筛选下来的模型,成功几率也就越高。

3. 靠机器学习来自建模型

依赖人工智能技术的发展,电脑的能力越来越强大,也有一个流派,赋予了电脑更多的权力。这也是艾玛最近在尝试的量化投资方法。

有的机构称之为“遗传编程”。艾玛更喜欢用另外一个名称,叫“机器学习”。因为这个名称特别形象,它说的是,电脑可以像人一样学习成长,不再只是一个靠程序命令机械操作的工具。

这种方法和传统的量化模型搭建方法不同的是:在最开始不预设规则,而是由机器自己发现规则。

传统的建模方法是自上而下的,机器学习方法则是自下而上的。

自上而下的方法,由人根据投资理论和自己的经验来预设规则,总是存在局限性。市场上的影响因素千千万,我们能够考虑到的都是有限的。因为个人偏见,可能过分重视了某个因素,或者完全忽略了一些因素。

但是,机器不会。机器会自己对各种信息和数据进行排列组合,生产出来无数模型和规则,经过多轮优胜劣汰,最后剩下一组或者几组最适应环境的模型。

以刚刚大奖章的模型为例,机器不再去验证今天的开盘价与昨天的收盘价之前的互动,而可能是今天的开盘价与前几天的平均价,或者昨天的中午收市价,或者昨天的开盘价来比较。

操作除了验证买入,也可以验证卖出,或者早上买入,中午卖出;又或者早上卖出,中午买入,收市前再卖出。总之,这种组合是无穷无尽的,产生出来的模型也就无穷无尽。

电脑根据统计规则,淘汰掉大批验证失败的模型,剩下效果比较好的模型,再进行新一轮的重组和突变。这样重复下去,直到选出的候选模型趋于稳定,不再变化的时候,就可以进入下一个环节,用新的市场数据进行验证。

候选模型里面可能有很多不同的子模型,因为电脑已经对模型进行了多轮重组,非常复杂,人脑可能根本看不出里面究竟有什么样的逻辑关系。

不过,没关系,不管是黑猫还是白猫,能抓老鼠的就是好猫。还记得之前那篇文章提过:大奖章基金会研究天气与股票市场的关系,江恩会利用占星学来建模吗?只要模型能赚钱,管它背后是什么逻辑关系?

上一篇:
下一篇: