对冲基金利用社交媒体的高频信息交易 电影《决胜二十一点》第一幕就是,哈佛医学院负责招生和奖学金评审的主任对男主角说,今年一共有76位申请者竞争罗宾逊奖学金,最终只有一位幸运儿。他/她的经历光impress(打动)评审委员会还远远不够,必须dazzle(用现在的网络流行语来说就是“亮瞎”)到大家。 在香港大学的七年教学生涯中,我总是在每一门课程开始时,就模仿着对学生说,如果你们将来继续深造,要申请奖学金来找我写推荐信,最起码要让我觉得impressive,如果要让我一辈子都记得,必须dazzling。在这七年里,我教过的本科生、硕士生和博士生至少有1500名,我大致上给40多位本科生写过硕士学位项目申请的推荐信,精心指导过的7位本科生——他们目前在美国和欧洲一流经济和金融系攻读博士学位(过去七年港大经济金融学院毕业生选择攻读博士学位的据我所知不超过20人),我自己的两位博士生毕业后分别在高盛中国策略部和中国人民银行上海总部工作。 不过以最短时间dazzle到我的是一位印度来的硕士生阿斯温•戈亚,他本科专业为计算机,辅修经济金融。2013年春季,我在《对冲基金》课程中简单提到投资者的情绪会对证券价格产生影响,比如大家情绪高涨时更可能推动价格上涨。过去发现的情绪的代理指标各有各的劣势,最新的思路是从Facebook、Twitter或者微博上实时读取短讯(我记得那时候微信还没流行开来),然后通过文本算法程序去判断每条短讯里包含的情绪是正或负,然后加总分析,并以此为依据建立证券组合。实际上我本人的博士论文就是从理论上解释这个发现。我提到2010年有三位计算机专家发现利用tweets里的情绪信息预测道•琼斯指数每天的涨跌有超过85%的准确性。 一家叫做Derwent的对冲基金,按照他们的文本算法程序试运行了一个特别的情绪基金,在第一个月里取得了接近2%的回报。可能实际融资并不容易,Derwent后来将这项技术得出的买入卖出信息卖给有兴趣的投资者。另外一家叫做MarketPsych的公司,则收集证券价格数据、媒体热词、投资者情绪、经济不确定性和政府稳定性等量化指标来进行投资(见图1)。作为对冲基金,他们在2008-2010年的业绩表现超越标准普尔500指数25%,随后转型成为以数据发布、量化研究和咨询业务为主的公司。而全球最大的对冲基金桥水(Bridgewater)也公开他们使用社交媒体的实时信息以掌握全球经济每天的变化。 实际上,金融学近年来大量文献指出,虽然市场价格对于新信息的反应非常迅速(即市场有效说),仍然有一些公开的信息可以对于一段时间后的股价具备预测力。例如“谷歌趋势”上面的搜寻量指标,可以对两周后的股价升跌有显著的预测力。不过这类研究结果发表后常常被投资者大量采用从而失去其效力,而坚持市场有效说的学者认为,这些发现只是为了迎合行为金融的流行潮流而制造出来的统计假象,或者是为了发表而滥用数据挖掘的结果。我倾向于相信一些基于社交媒体大数据的未发表的研究结果对于投资有帮助。
当时我的介绍非常简单,我告诉大家只有到夏季的《行为金融》课程才会把相关的文献集中整理后发给大家。然而一个月后,在学生自选主题的课程项目演示中,戈亚让所有人大吃一惊,他最独特之处在于,想到把tweets包含的情绪信息用于预测二元期权的未来价格。简言之,买入(卖出)和某证券挂钩的二元期权是预期该证券在接下来较短时间(比如数小时)内价格将上涨(下跌),这种短时间到期的特点让低频基本面数据变得没有什么价值,而反映市场情绪的高频数据则对于价格预测帮助颇大。另外,由于二元期权的回报结构特殊,投资者通常需要有55%的准确度才可能盈利。戈亚首先建立了一个包含400条tweets的数据库,然后教会语言处理软件包LingPipe每条包含的情绪为正还是负。接下来,他编写的程序以毫秒的高频速度实时读取和一种证券相关的tweets,此时具备自我学习能力的LingPipe就可以判断这些最新tweets体现的正负情绪,当加总后的正情绪tweets数量超过负情绪总数的55%时,他就买入对应的二元期权(实际上,这个准确度百分比根据买入时间点的价格而随时变化)。他还讨论了三位计算机专家方法的不足,如何利用多重信息来源补充tweets包含的信息,以及如何将同样的思路运用到其他金融工具的交易上。当然,同样的策略可以同时运用到上百上千支二元期权上,成为统计套利的一种。 虽然过去几年有一些高频交易技术被美国监管机构禁止,我相信这段故事可以让大家认识到,并非所有的高频技术都是魔鬼,它往往只是优化现有交易策略的一种手段。戈亚课后告诉我,他想成立一家对冲基金实现自己的创新点子,我鼓励他的同时也深知创业艰难。写作此文时,我特意查询他的近况,非常惊喜地知道他在2014年回到印度创立了一家叫做KeepKaam的人才招聘网站。 事实上,还有几位学生也在他们的课程项目演示中dazzle了我,他们的共同特征是有很强的技术背景,虽然金融方面的知识并不丰富,但一旦抓住一个概念彻底理解后,就能够通过定量技术来极大缩短分析和执行时间以及人力成本。所以每次在我的金融课程结束时刻,我总是强烈建议经济金融系的学生多认识理科工科的学生,先成为朋友,再结合各自的优势去组队创新或创业。
图2从四个角度概括了不同量化交易策略各自的特点。我估计看完前两篇,追踪到此的读者们有一种望梅未止渴的心情。对于不掌握高频交易技术,因子模型或者机器学习的读者,是否仍然有机会从巴菲特的投资哲学和索普的量化思想中学到一招半式?量化交易相对于“买入并持有”的价值投资高得多的交易频率真的有必要吗?本系列第二篇《电影里的量化投资密码》结尾说的普通投资者也可以受益的公式是什么? 什么是“魔法公式”? 我在写作此系列文章的第二篇《电影里的量化投资密码》考虑如何结尾,同时酝酿第三篇的主题时,突然收到了香港财经分析师协会的通知,我在高盛中国策略部工作的学生付思和我合写的一篇论文《魔法公式是否在香港股票市场有效?》,经过了香港的大学教授和明星基金经理组成的评审团的盲审后,获得了该协会“亚洲资本市场研究”2015年最佳论文奖,这对于已经离开学术界的我来说真是一个莫大的鼓励。我当即决定把这个结合了巴菲特的投资哲学和索普的量化思想的简单公式介绍给大家。 索普很早就研究了格拉厄姆和多德的投资圣经《证券分析》,但他发现,很难使用书中提到的对企业未来现金流折现来估算企业现值的方法,因为预测下一年的盈利都是极其困难的事情。而且他还发现许,多被广泛认为低估值的股票在接下来的几年内仍然处于低估值的状态,索普因此放弃了价值投资策略,转而把各种证券视作没有基本面支撑的扑克牌,仅仅根据价格的相对变化来做量化套利。 而巴菲特对数学和计算机在投资中的运用向来没有好感,在他看来,证券的价值体现在企业的基本面上,买证券是买入好的生意和企业并长期持有,当高质量企业被低估值是再好不过的买入机会,巴菲特用相对估值的办法(比如企业股本回报率高于30%,自由现金流名列前30%,净利润率高于行业平均,债务股本比低于行业中位数等等)去解决索普认为的绝对估值困难的麻烦。巴菲特尤其不喜欢业界对于每天新公布的经济数据大做文章的习惯,他认为这类工作绝大多数时间是浪费资源和破话价值的(至于为什么投资者如此看重日常经济数据和预测分析,请看本人拙作《经济学家如何进行经济预测?》),他很幽默地讽刺说:经济学家花费大量时间学习数据分析,如果不把这点本事拿出来显摆下,别人就会忘记了他们的存在,一个手里拿着锤子的人看什么东西都是钉子。 应该说索普和巴菲特只有两个相同点,一是,巴菲特认为投资另外一个最重要的环节是控制自己的情绪,不受市场价格波动的影响。相反,大部分投资者在价格高涨时情绪激动地买入,在价格下跌中恐慌抛售。而索普使用计算机和量化策略恰恰能够在最大程度上减少情绪波动对投资的破坏性作用。二是,两人都不相信芝加哥学派主张的市场“总是”有效无法被战胜的观点。巴菲特(认同市场大部分时间有效)曾经开玩笑说,我们这些价值投资者能赚钱,实在是多亏了大学教授告诉一代代学生证券分析是浪费精力。 我相信许多投资者尝试过,将巴菲特的投资理念“用平常的价钱买一家很棒的公司远远强过用很棒的价钱买一家平常的公司”进行量化,但真正成功却又乐意将其公开的则是凤毛麟角,也许这和巴菲特本人的态度有关,他说过“对于手持公式的怪才要格外小心”。 无论如何,到了本篇的主角乔尔•格林布拉特出场的时刻,这位成功的对冲基金经理和哥伦比亚大学的兼职教授,在2006年出版的名为《一本战胜市场的小书》里,给出了两个简单的公式。第一个公式用来寻找巴菲特所说的“很棒的公司”,可以表述为资本回报率等于扣除利息、税收前的利润(EBIT)除以有形资本(不含现金)。资本回报率越高的公司质量越棒。第二个公式用来衡量“平常的价格”,可以写成收益率等于EBIT除以企业价值。收益率越高的公司价格越划算。 值得一提的有两点:一是,市场上通常用股本回报率或者资产回报率来判断公司价值高低,用市盈率(类似于收益率的倒数,但分别用盈利和企业股票市值取代EBIT和企业价值)来判断价格是否合理;二是,格林布拉特的公式里用到的EBIT和有形资本不同于通常的资本回报率计算时所用的EBITDA(扣除利息、税收、折旧和摊销前的利润)和总资本(包括无形资本和现金)。他在书里详细解释了这样做的原因,简单来说,这样两个经过调整的计算公式可以让公司之间进行苹果对苹果的公平比较,而通常的指标则会因为企业的资本结构(债权与股权比重)不同以及税收差别对待而产生苹果对桔子的不公平比较。 有了这两个公式或者说两因子模型,格林布拉特的选股方法就变得非常简单,他首先计算出美国每家上市公司的资本回报率和收益率,并依次从高到低排名,然后将两个排名简单加总,然后买入总排名最靠前的30家公司并持有一年。一年后再重新排名,交易完成后再持有一年,以此类推。格林布拉特称这个策略在1988-2004年的年化回报为30.8%,同期标普500指数年化回报为12.4%。换言之,初始的100元投资在17年之后会分别增长到大约9600和710元。因为这样优异的表现,这两个公式和选股方法被简称为“魔法公式”。 值得一提的是,本系列第一篇《量化巴菲特》提到的复制方法其实颇为复杂,并非可以轻易模仿。但“魔法公式”则异常简单,普通投资者都可以运用。而且一年内只需要对股票组合再平衡一次,不像高频交易那样需要建立昂贵的交易系统和对手进行速度竞赛,交易费用上的优势也显而易见。如果用本系列第二篇来做类比,和这个价值投资策略最类似的则是电影《点球成金》描述的真人真事:耶鲁大学经济系的一位毕业生利用统计分析量化技术帮助一家陷入困境的小型棒球队挑选被市场严重低估的优秀球员,球队最后创造了史无前例的棒球联盟连胜纪录,此后这一量化方法被各大棒球队采用。
在尝试“魔法公式”前,格林布拉特与合伙人成立的对冲基金Gotham Capital专长于事件驱动投资策略,在1985-1995期间取得了年化40%的回报。他在1999年出版了畅销书《你能成为股市天才》介绍他的事件驱动策略。2006年出版的《一本战胜市场的小书》更受市场欢迎,他们还建立了一家“魔法公式”的网站免费公开总排名靠前的美国公司(见图3),在公开战胜市场的方法这点上,格林布拉特和索普非常相似。到了2010年,格林布拉特与合伙人对外声明不再采取事件驱动策略,而集中使用“魔法公式”,这更从一个侧面体现出该策略的魅力。 “魔法公式”公开后引起重视,对书中使用的1988-2004年美国数据的验证得到相似但略低的回报数据(可能因为会计数据处理的差别)。图4展示的是关于“魔法公式”和标普500指数长达47年(1964-2011年)的比较。可以看出在回撤、夏普、盈利月份比等指标上前者均优于后者(从1964年开始是因为此前的一些会计数据不存在。年化回报率低于前面提到的30.8%主要原因是只投资于高流动性的中大盘股)。两位欧洲投行分析师发现“魔法公式”按相同权重策略年化回报在1993-2005年分别高出美国、欧洲、英国和日本的股票(相同权重)市场指数的3.6%、8.8%、7.3%和10.8%。另外一项研究发现在1998-2008年,在北欧市场运用该策略得到的年化回报为14.7%,同期明晟北欧指数回报为9.3%,标普500指数回报为4.2%。
“魔法公式”是否在香港市场有效? 由于香港的教授极少研究香港和中国证券市场,这个问题之前还没有人尝试回答。付思和我发现,从2000年1月-2014年6月在香港股票市场采用“魔法公式”策略,如果每隔半年(因为香港采取半年报会计制度)买入总排名前30%的股票按市值权重持有则年化回报达到20.3%,远远高出恒生指数同期表现(顺便说一句,我们曾经比较了魔法公式在中国的表现,利用2000-2013年的数据,此策略构造的股票组合的年化回报和沪深300指数表现几乎一样为14.1%,但前者的波动率要略高出后者,原因可能和大多数投资者认为价值投资还没有在中国扎根有关,不过这个结论也只是初步的,还有待更细致的数据处理),随后我们做了一些因子模型回归分析了风险和回报之间的关系,这些都是学术研究的标准步骤。我们知道如果要真正执行,还需要做许多策略优化和精炼化的工作,比如应该把投资空间限于香港股票市场高流动性的股票,避开财务造假或者可能陷入破产的公司(许多低估值的公司恰恰是面临财务困境难以生存的),细化挑选出更高质量、具备竞争优势和价值护城河、以及财务稳定健全的公司等,但是如果把这些步骤都考虑进来就足够我们写成一本书了。 有趣的是,我第一次有机会在公开讲座上分享研究发现是2015年4月中旬。我特意看了一下文章在2014年6月最后选出来的36只股票,发现如果按相同权重一直持有十个月下来的回报达到37.2%,如果我只持有其中市值最高的10只股票则回报高达62.3%。做完这一步后,我才特意看了下排在第一位回报高达481.5%的是哪家公司,结果是汉能。事实上,在那个时候关于汉能的财务报表异常和股市表现已经引起了很多人的怀疑。虽然汉能直到5月20日被停牌,我相信如果我们真正采取“魔法公式”策略,汉能应该无法通过策略优化和精炼的环节。 金融学术界早已经发展出精确度很高的财务报表异常排查和破产风险衡量模型。用到的方法非常类似文章开始提到的戈亚使用LinePipe来判断tweets包含的情绪。学者们通过对过去被查实财务造假或者陷入破产的公司的会计账目进行分析,找到了一个包含多因子的量化衡量公式。在我们用“魔法公式”挑选出的总排名靠前的公司后,将他们的几项财务数据输入这个公式,一旦其数值低于一个经验阈值,就可以将其直接排除出股票组合。显然,排除这些公司虽然在短期内会影响投资组合的回报表现,但长期来讲毫无疑问是值得的。 执行的困难源自认知和行为偏差 “魔法公式”的表现如此之好,加上格林布拉特自己对冲基金的实际表现优异,是否人人能够从中得利?答案是不言自明的,真正能够做到价值投资的人极少。 大的机构投资者往往受限于制度约束,比如价值投资往往很难在一个季度、半年甚至一年中表现优异,而投资经理面对短期业绩评估的压力促使他们放弃价值投资而追逐热门的成长股。个人投资者更是受认知和行为偏差(包括过度自信,羊群效应,高估小概率事件等等),特别是情绪波动的影响经常高买低卖,绝大多数人跑输市场指数。同样,对自己能力过度自信,高估自己成为那极少数跑赢大市的投资者喜欢频繁交易,价值投资强调的买入并长期持有对他们太缺乏吸引力。有一份有名的研究标题为《交易慢的人是不是最先死?》,学者发现一些过去业绩不错的投资者率先接受网络交易,但网络给予的频繁交易机会反而让他们的业绩大幅度下降。而继续使用电话下单的慢速交易者的业绩表现则没有什么变化。这点也可以再次回答前面的疑问:对于长期投资者而言,不掌握高频交易技术实在没有什么损失。 有意思的是,格林布拉特自己在2009年5月-2011年4月邀请一些客户做了一个“魔法公式”的投资测试。他定期公布利用公式挑选出来的总排名高的公司名单,这些客户可以根据名单再自行挑选,买卖和持有时间也没有限制。另外一个参照账户则按照他的《小书》描述的投资步骤严格执行。结果两年下来,前者的平均投资累积净回报为59.4%,非常不错,但依然输给了标普500指数的62.7%,而参照账户的表现则是84.1%。投资者的主要行为偏差表现在既错过买入一些看上去前景糟糕的股票,又急忙卖掉一些买入后表现不如意的股票,然后又去追逐名单里表现好的股票。在客户中表现最佳的一位则在一开始就买入名单上的全部股票后再也没有进行交易。其实这样的结果对于任何一位熟悉现代金融学研究的人来说都不意外。格林布拉特在一次采访中就说,他发现自己也经常输给“魔法公式”策略,他害怕而避开的一些股票往往在接下来表现异常地好。
专家输给量化系统的故事在其他领域同样不胜枚举,因此,我想说量化投资的神奇之处并不在于其创造阿尔法的点子有多么复杂,而在于依靠尽量详细扎实的系统性研究成果,减少人为的干预。我上文已经指出存在比“魔法公式”策略更好的精炼量化策略,在香港市场应该同样有效,等我有时间写出来再去竞争明年香港财经分析师的最佳论文奖吧,至于最终执行的结果,我深信依然会是一场人与机器的博弈(见图5)。
|