中金公司 量化「中金关于动量你所希望了解的那些事」

摘要

4) 截面分域中,动量特征在高机构覆盖、大市值、低波动、高价值的股票池中更明显;而反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池内更为显著。

时序分域中,当市场处于下跌、低波动时期;风格处于大盘占优、成长占优的时期时,动量类因子倾向释放更多的“动量”特征;而当市场与上涨、高波动时期;风格处于小盘占优、价值占优的时期时,动量类因子倾向释放更多的“反转”特征。

动量类因子的开发路径:权重序列是核心变量

动量因子的构建可以拆解为一种历史收益率序列向量与一种权重序列向量的内积。从逻辑推导入手的动量因子挖掘,其核心在于给出一种逻辑猜想,能够利用某些股票特征,判断出在某些时刻或某些场景的股票交易中,其投资者交易占比是更偏向机构还是个人。并把该猜想以权重序列的形式表达出来。而从机器暴力挖掘入手的动量因子开发,其核心在于利用算法不断优化寻找更理想的权重序列。

通过尝试对A股中的动量类因子进行改进与测试,“反转”逻辑因子中我们较为推荐一个月振幅调整动量因子与一个月日内动量因子。而“动量”逻辑因子里更为推荐业绩公告前隔夜动量、业绩公告跳空动量等因子。

动量类型风格观点展望:反转逻辑的因子效果会逐步减弱

长期来看,随着A股市场越来越规范,机构投资者交易占比逐渐提升。A股的动量特征会越来越明显,而反转效果将逐步削弱。

对近期的观点,考虑到当下我们对未来市场涨跌的择时观点尚显悲观,成长/价值风格轮动模型更看好成长风格。我们认为近期“动量”特征会更明显,而“反转”效应会比以往更弱。推荐投资者提高“动量”逻辑因子权重,降低“反转”逻辑因子权重。

正文

Momentum动量因子,确切地说,“截面动量”因子,作为常见的选股因子,因其通俗简单的定义方式与长盛不衰的有效性,广为业界投资者熟知与应用。

传统动量因子的构造方式很简单:只需计算标的在过去某一个时间区间内的收益率,作为因子值即可。其中最广为使用的两个动量类因子,一个是以标的过去一个月收益率计算的“一个月动量”因子,公式为: PT / PT-1 – 1, 我们不妨将其记为MOM_1M;另一个是以标的过去1年排除最近一个月的区间内收益率计算的“一年动量”因子,公式为: PT-1 / PT-12 – 1,我们不妨将其记为MOM_1Y。

截面动量因子的收益来自哪里?

针对这个问题,学界与业界的研究者已经有很多深入研究,给出的解释基本可以分为两个方向:行为金融学解释,与风险补偿解释。

理论上,如果某些收益是由于行为偏差造成的错误定价造成的。那么当越来越多的投资者意识到该行为偏差会产生这样的超额收益,整个市场会从两个方面对该类alpha收益造成损伤:一是投资者自身避免或减少自己的该类非理性投资行为对自己投资造成的损失。这样的行为会导致市场整体的错误定价程度减小;二是会有越来越多的投资者从该类错误定价中捕捉套利机会,从而造成该类alpha收益的衰减越来越快。因此除非有明显的阻止套利行为的机制,对于行为金融学解释中行为偏差造成的alpha收益,我们应该能观察到该类alpha,会随着越来越广为人知与市场制度的成熟,其收益或预测能力逐渐削弱。

而对于风险补偿造成的alpha收益,只要该类风险本身逻辑没有出现本质变化,那么这类alpha并不会像行为偏差类alpha那样,随着市场成熟与广为人知而逐渐弱化。但随着该风险溢价水平的高低波动,其alpha收益也会在不同时期呈现出周期性波动的特征。

► 为什么会有“动量”与“反转”,它们是怎么出现的?

价格,是反映市场(所有投资者)对标的物的价值预期博弈的结果。任何新信息的产生,都会改变投资者对标的物的价值预期,从而在价格改变中得到体现。举一个简单的例子:

“在一个理想的完美市场里,有一个公司的股票价格为100。这时候有关该公司的一个新信息进入市场,这个新信息表明该公司最近由于成功改进生产线,从而提高了盈利与成长水平,该利好信息价值当前价格下10%的股票涨幅。因此市场迅速消化该信息,并将其通过交易反应到股票价格上,该公司的股票价格涨为110。”

这个理想化的例子是“有效市场假说”的一个典型案例。但在现实世界里,上述例子中有太多隐含的强假设无法成立,最重要的两条包括:

1. 市场上的投资者并不会同时得到这个消息并做出反应,甚至可能有些投资者完全不知道该消息,而以其它理由在进行交易;

2. 对该消息的解读与消息价值的判断因人而异,并没有一个上帝视角给出所谓“该消息价值对应当前股票价格10%的涨幅”这样的标准答案。

由于上述两个现实约束的存在,更可能发生的情景是:当一个消息进入市场后,

• 第一个阶段,市场上有大量未接受到该信息的投资者时,标的买卖双方造成的买卖供需关系并不会显著到立即把价格推向其应当达到的位置,故价格不会迅速变化到其应该到达的 纳入信息后合理价格(reasonable priced-in price),也就是产生了所谓的“反应不足”。

• 第二个阶段,市场上越来越多的投资者接触到了该信息并做出反应,价格逐渐被推至合理价格附近。但由于后入市场的投资者中有一部分因为各种各样的原因(后文我们将针对这些原因讨论),错误或过分估计了该信息价值,从而将该股票价格再进一步推离了合理价格,也就是产生了所谓的“反应过度”。

• 第三个阶段,市场的投资者捕捉到第二阶段后半阶段产生的过度反应带来的盈利空间,通过交易获取超额收益的同时,将股票价格再度往合理价格处推动。

图表2:价格发现过程中产生“动量”与“反转”的情景土壤

什么因素决定了因子方向以“动量”呈现,还是“反转”示人?

在之前分析“动量”与“反转”是怎么出现的过程中,我们是站在市场整体的角度,考虑它面临的实际约束与随之而来产生的价格发现过程。但要分析为什么某个动量类型因子的特征是其中一个而不是另一个,则需要我们先站在投资者的视角,去重新再审视这个价格发现的过程。

作为一个投资者,在其视角里,面前的这个过程更为复杂,面对的约束也更多,包括但不限于:

1. 该投资者很难知道或者干脆不知道这个新信息是什么时候首次进入市场的。换句话说,当其获得这个信息时,此时股票价格是100,但他并不知道这个信息是在股价95的时候首次进入市场的,还是当股价还在90的时候就已经进入市场了。

2. 该投资者很难确定或者干脆无法确定其是第几个知道这个信息的。换句话说,当他获得这个信息时,可能只有20%的投资者在这之前了解该信息并进行相应交易,也有可能已经有80%的投资者早就了解该信息并进行相应交易了。

3. 该投资者能不能较好的估计出该信息的实际价值。换句话说,这个信息到底是值50%的涨幅,还是只值5%的涨幅。

4. 该投资者能不能较好的估计市场其它投资者对该信息的价值预期。换句话说,这个信息在整个市场看来可能值多少。

以上4点对于投资者而言是非常关键的投资决策依据,本质上第1个与第2个约束,约束的都是投资者对自身在该信息上“时间定位”的认知;而第3个与第4个约束,约束的都是投资者对自身在该信息上“预期价值定位”的认知。它们可以独自或共同决定投资者眼中的“预期差”的方向与大小。

假设某个投资者可以站在上帝视角,完美地克服上述4个约束。那么他的投资逻辑将非常清晰:

• 在“时间定位”上,如果该投资者知道自己的排序位置靠前,那么他可以判断目前是属于价格发现的第一阶段,从而会选择追动量。而如果该投资者得知自己的排序位置靠中间,那么他可以基于自身风险偏好水平与其它信息决定,是否参与第二阶段过度交易带来的动量交易机会。而如果该投资者发现自己的排序位置已经很靠后,那么他应当选择参与捕捉价格发现过程中第三阶段带来的反转收益。

• 在“预期价格定位”上,即使投资者不考虑“时间定位”的因素,他也可以基于自己对该信息的价值估计,与市场一致预期的价值估计的大小对比来选择投资行为方式。如果该投资者了解到他自己对该信息的估价低于市场一致预期所给出的信息价值,那么则应该选择以“动量”的方式进入市场;反之则应该做“反转”。

回到现实中,没有投资者可以拥有上帝视角,因此所有投资者都必须处理上述约束带来的投资困境。然而不同投资者在应对上述约束时的处理方式与处理能力却是有着巨大的差异。

按照处理方式的维度,我们可以将投资者区分为“理性投资者”与“非理性投资者”。按照处理能力的维度,我们可以将投资者区分为“信息优势投资者”与“信息劣势投资者”。

我们先阐述理性投资者的处理路径,无论这个理性投资者是否具有信息优势,即具有获取大量一手信息并具有扎实的信息处理与解读能力。他都会审慎地考虑自己面临的约束处境。评估自己在“时间定位”与“预期价值定位”上的优劣势与确定性程度。

在此基础上,如果这个理性投资者恰好也具有信息优势,那么他将能更准确地评估他的约束处境与对应的位置,同时有更大概率能在较早的时间点领先市场其它投资者获取新信息并展开相应交易。这些将带来两个明显的投资优势:一个是更高的确定性,一个是更多的投资机会。这两个优势会使得投资者倾向于采用一种更稳健的投资方式:“我仅在我认为相对足够安全的时候才下注”。所以该类投资者往往更多地交易一些在他们视角里,价值很高,确定性很强,且自己能较早入场的信息。这意味着他们交易的股票此时大概率正处于消化该信息的第一阶段,且这个阶段持续时间会比较久。不难看出,机构权益基金经理,尤其是其中的“价值投资”践行者,往往是该类投资者的主要组成部分。

而如果这个理性投资者并不具有信息优势,他不像上述具有信息优势的投资者那样具备高确定性的个股投资机会。那么该类投资者往往会采用提高独立投资次数的方式来弥补确定性低(胜率不够高)的劣势。通过对其它信息的挖掘与解读,尝试捕捉动量或反转机会的特征,从而通过构建因子组合来获取收益。没错,实施因子投资的量化交易者正是该类型投资者的重要成员。而本篇报告也正是从方方面面来对动量与反转特征进行研究。

图表3:不同类型投资者及对应交易行为特征的各类研究方向

在分析完上述不同投资者的行为模式,我们总结不同投资者的投资行为会如何对动量与反转产生影响:

第一类投资者,理性且具有信息优势的投资者群体,他们的交易行为往往创造出适合动量投资的场景。且该交易行为本质是基于投资者对信息的理性判断而做出,那么实际上该动量场景的产生是依赖于该类投资者做出投资判断背后所对应的风险暴露。

第二类投资者,理性但不具有信息优势的投资者群体,他们的交易行为在价格发现的第一阶段与第三阶段均只有加速该阶段的价格发现作用,但并不会额外产生动量或者反转的场景。但在价格发现的第二阶段中,该类投资者会尝试从泡沫扩大的过程中获取动量收益,一定程度上可能会扩大后续反转的场景空间。

第三类投资者,非理性投资者群体,他们的交易行为既会因为“过度自信”与“羊群效应”等行为偏差提供反转投资的场景,也会因为“处置效应”等行为偏差提供动量交易的场景。同时容易看出,该类投资者产生动量类型因子收益空间的原因基本是基于行为金融学上的原因。

综上,我们可以做出如下几个推断:

1. 交易的投资者结构会影响股票的动量类型特征。理性投资者交易占比越高,该股票未来“动量”特征越显著,反之“反转”特征越显著。

“故事”讲到这里,我们需要用实际数据去验证“故事”是否符合实际情况,能否对市场上的一些问题给出合理的解答。

► 同样的因子,为什么在美股是动量,在A股是反转?

海外成熟市场,尤其是美国股票市场,一年动量(MOM_1Y)是一个显著正向的因子,但同样的因子在A股却是以负向的反转呈现出来。我们以2005年到2022年4月的数据测试一年动量因子分别在美股、港股与A股上的效果,其IC均值分别为4.2%,4.0%与-1.6%。实际上,不仅仅是一年动量,一个月动量(MOM_1M)也是在A股市场有更浓重的反转特征,一个月动量因子在美股、港股与A股上的IC均值分别为-1.1%,-1.8%与-6.3%。

图表4:一个月动量(MOM_1M)在不同市场股票上的累计IC对比

图表5:一年动量(MOM_1Y)在不同市场股票上的累计IC对比

图表6:主流动量因子在不同市场股票上的IC统计

会出现这样的差异,一个很重要的原因正是我们在上一节阐述的投资者结构的差异。相比美股与港股,A股市场中代表第一类投资者群体的机构交易者的交易占比更少,而代表第三类投资者群体的个人散户交易者的交易占比更高。在2007年到2017年期间,A股市场中每年都有超过8成的交易金额是由个人散户投资者完成,机构投资者成交额占比不到20%(上交所从2018年起不再公布该数据),而港股在2015年至2020年期间,每年个人散户投资者交易占比不超过3成。

即使在A股内部,如果我们观察每年机构投资者交易占比与当年一年动量因子的IC均值,可以发现他们之间的高度正相关性,以2007年-2017年的数据,一年动量因子的IC年度均值与机构投资者交易占比的相关系数高达0.86。

图表7:A股内不同投资者交易占比

图表8:A股一年动量因子预测能力与市场内机构投资者交易占比高度正相关

► 同样的投资者结构,为什么1年动量方向与1个月动量方向不一样?

从之前不同市场的动量类因子统计特征容易看出,无论是美股、港股、还是A股,一年动量比一个月动量都体现出更偏“动量”的特征,而一个月动量即使在机构交易占比很高的美股与港股,仍然以负向的“反转”为主。因此我们不妨先猜测,一年动量因子有更大一部分收益来自于第一类投资者交易带来的风险补偿,而一个月动量因子更大一部分收益来自行为偏差。要验证这个猜测,我们需要找到一年动量因子对应的风险补偿是什么?以及一个月动量因子所应当带有的行为偏差收益特征。

► 一年动量因子对应的风险补偿是业绩基本面风险

一般我们说动量因子,这里的动量是默认为“价格”动量,即以过去的价格变动程度来体现的动量特征。沿循“过去的数据变化会延续到未来表现”的动量内核,除了用资产价格这个维度来表征动量以外,从基本面维度与分析师维度也可以相应刻画“基本面动量”与发“分析师动量”。我们分别确定两个因子来表征上述两个维度的动量。

一个经典主流的“基本面动量”因子是基于盈余公告后价格漂移效应(PEAD)逻辑的SUE(Standard Unexpected Earning)因子,其构建方式为:

其中,EarningT 表示第T期的实际净利润,E(EarningT) 表示第T期的预期净利润, σ 表示过去8期的盈利预期差标准差。

同样,对于“分析师动量”,我们用经典的一致预期净利润调整因子来表征,其构建方式为:

其中,EarningForecastT表示第T期的分析师一致预期净利润。

同样,我们可以将上述操作在基本面动量与一个月动量之间进行研究。结果显示,一个月动量与基本面动量之间的相关性远远低于一年动量与基本面动量之间的关系。而虽然一年动量与分析师动量的相关性也高于一个月动量与分析师动量的相关性,但它们的显著程度均较低。

因此,我们可以说一年动量中有一部分来自业绩基本面带来的动量收益,这部分动量收益很大概率是源自业绩风险补偿。而一个月动量在这个维度上的动量收益则较少。

图表9:价格动量与其它维度动量的因子截面相关系数均值

图表10:一个月动量(MOM_1M)与其它维度动量的截面因子相关系数

图表11:一年动量(MOM_1Y)与其它维度动量的截面因子相关系数

► 一个月动量因子有明显行为偏差收益特征——“有效性衰减”

港股的一个月动量并未观察到单调的“有效性衰减”特征,但在A股与美股,一个月动量的IC均值体现出明显的“反转”衰减的现象。作为对比,一年动量因子无论在哪个市场里IC均值均没有往某个方向单边变化的趋势。

由此可知,A股市场的一个月动量在历史上具有大量由行为偏差带来的“反转”收益。

图表12:一个月动量(MOM_1M)在不同市场里IC均值的变化趋势

图表13:一年动量(MOM_1Y)在不同市场里IC均值的变化趋势

什么场景看“动量”,什么时候看“反转”?

截面分域视角

按照我们在前面小节的推论:机构投资者交易占比更高的场景“动量”特征更强,散户投资者交易占比更高的时候“反转”特征更强。我们先寻找有哪些股票特征,它们一定程度上与投资者结构有一定相关性。

在A股市场中,可以较简单找到的符合上述条件的股票特征包括:

1. 研究报告覆盖度:覆盖度更高的股票,机构投资者参与交易的占比更高;而对于覆盖度低甚至完全没有覆盖的公司,这些股票的交易者散户交易占比更高。

2. 市值大小:由于资金容量与流动性限制,机构投资者不太会参与很小市值公司的交易。而龙头公司的股票交易往往有更多机构投资者参与。

3. 波动大小:短期剧烈波动的股票往往表明该股票近期有较高的交易热度,同时带有一定程度的低流动性,该类股票往往机构投资者参与程度比较低。

4. 流动性大小:流动性过低的股票,机构投资者往往难以参与,该类股票的交易者大部分由散户交易者构成。

针对上述每一个股票特征,我们将全市场股票按该特征分成高、中、低三个股票池,分别测试动量类因子在其中的有效性。具体的股票池切分方式如下:

• 对于研究报告覆盖度特征,我们根据最近3个月的卖方报告覆盖数量,将完全无覆盖的公司划为一档,记为低覆盖池,在有覆盖的公司中,按照覆盖数量的中位数,将低于中位数的所有公司划为中覆盖池,将高于中位数的所有公司划为高覆盖池。

• 对于市值、波动、流动性、价值特征,均按照最近一期的该特征因子,将所有公司进行分位数排序,将分位数在[0, 30%]范围的股票划为低特征池,分位数在[30%, 70%]范围的股票划为中特征池,分位数在[70%, 100%]范围的股票划为高特征池。

测试结果基本也验证了上述逻辑。除了流动性特征分域下没有显示出很好的单调性以外,其它特征分域下,一个月动量于一年动量都展现出了与逻辑预期相符的预测能力变化。其中一年动量在高覆盖、大市值、低波动、高价值的股票池能均显示出了正向动量预测能力。相对的,一个月动量的反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池能均更为显著。

图表14:不同程度卖方报告覆盖股票池内,动量因子的IC均值表现

图表15:不同程度市值的股票池内,动量因子的IC均值表现对比

图表16:不同程度波动的股票池内,动量因子的IC均值表现对比

图表17:不同程度流动性的股票池内,动量因子的IC均值表现对比

图表18:不同程度价值的股票池内,动量因子的IC均值表现对比

在验证了动量类因子在上述不同特征域下的表现逻辑与效果后,我们可以进一步解答下面这个问题。

► 为什么A股市场里,行业呈现动量现象而股票呈现反转现象?

在A股市场中,同样的动量因子在行业体系里多以正向动量呈现,而在股票体系下以负向反转著称。统计一个月动量因子,其在中信一级行业、中信二级行业、中信三级行业、股票上的IC均值单调地以4.0%、1.8%、-0.6%、-6.3%依次递减。同样,一年动量因子也有类似的方向变化。

造成这个现象的其中一个原因,是行业指数的构建基本上都是按市值加权的方式编制。例如中信行业体系的指数以自由流通市值加权的方式编制。这就造成每个行业指数的价格变动均更多地取决于该行业内的大市值龙头股。某种意义上,可以把中信行业一级行业体系当成30个大股票构成的股票池,因此相比于整个A股股票池,行业间的“动量”特征会更显著。

除了上述原因,其它诸如行业内部更多细分产业链拉长了信息传导长度,更多地股票选择加剧了反应不足的程度等等,都对一定程度上扩大了行业间的动量特征。在这些因素共同影响下,形成了我们现在观察到的行业动量现状。

图表19:一个月动量(MOM_1M)在不同行业级别与股票上的累计IC对比

图表20:一年动量(MOM_1Y)在不同行业级别与股票上的累计IC对比

图表21:一个月动量(MOM_1M)在不同行业级别与股票上的IC统计

图表22:一年动量(MOM_1Y)在不同行业级别与股票上的IC统计

时序分域视角

除了截面维度的分域,站在时序角度我们也关心在什么时候动量特征会更明显一些,而又在什么时候反转特征会更为显著。

对于市场状态,我们尝试以市场牛熊与市场波动两个维度分别尝试进行分域,其中:

• 市场涨跌将按照2005年至2022年4月期间的中证全指指数月度涨跌幅符号,将每个月份划为市场上涨或者市场下跌状态。同时根据当月与上月的市场涨跌状态确定当月属于涨转跌、涨跌不变、还是跌转涨的状态。

• 市场波动将按照2005年至2022年4月期间的中证全指指数每个月内日度涨跌幅计算标准差作为当月波动率大小,并根据所有月份的波动率大小的中位数为界线,将所有月份划分为低波动状态或高波动状态。同时根据当月与上月的市场波动状态确定当月属于波动降级、波动不变、还是波动升级的状态。

对于风格状态,我们尝试以大小盘风格与成长/价值风格两个维度分别尝试进行分域,其中:

• 大小盘风格中,我们以沪深300指数月度收益率作为大盘收益率,以中证1000指数月度收益率作为小盘收益率。通过比较大盘收益与小盘收益的大小,确定每个月份是属于大盘风格还是小盘风格。同时根据当月与上月的大小盘风格状态确定当月属于风格从大盘切向小盘、风格不变、还是风格从小盘切向大盘的状态。

• 成长/价值风格中,我们以成长因子多头组合的月度收益率作为成长风格收益率,以价值因子多头组合的月度收益率作为价值风格收益率。通过比较成长风格收益与价值风格收益的大小,确定每个月份是属于成长风格还是价值风格。同时根据当月与上月的成长/价值风格状态确定当月属于风格从成长切向价值、风格不变、还是风格从价值切向成长的状态。

测试结果显示,市场处于下跌、低波动时期;风格处于大盘占优、成长占优的时期时,动量类因子倾向释放更多的“动量”特征;而当市场与上涨、高波动时期;风格处于小盘占优、价值占优的时期时,动量类因子倾向释放更多的“反转”特征。

同时可以发现一些有趣的现象是,当风格发生切换时,动量类因子往往会表现出明显的“反转”特征,而在风格延续时,动量类因子往往会比平常体现出更多“动量”特征。

因此站在因子择时的角度,我们应该在高波动的牛市,及小盘价值风格的市场下,提高反转逻辑的动量因子权重;而在波动小的熊市,及大盘成长风格的市场下,提高动量逻辑的动量因子权重。

图表23:一个月动量(MOM_1M)在不同时序分域上的IC统计

图表24:一年动量(MOM_1Y)在不同时序分域上的IC统计

动量类因子开发指南

动量类因子计算结构拆解

动量类因子的构建本质上是“尝试从历史上的资产价格变化中,找到具有对资产未来收益预测能力的部分”。因此自然地,大部分我们熟知的动量类因子的计算公式中都能看到各式各样的资产收益率数据。不同的因子公式大部分的差异源自具体使用的是哪部分收益率数据。例如一个月动量使用的是T-20日至T日间的收益率,而一年动量使用的是T-240日至T-20日间的收益率。

我们可以把上述动量类因子算式结构归纳成,某一股票i在某一时点T的动量因子值计算公式为股票i一种历史收益率序列向量与一种权重序列向量的内积(点乘):

其中:

• momentumTi 表示股票i在时刻T的动量因子值;

• return_seriesTi 表示股票i在时刻T可见的历史日度收益率序列;

• weight_mask_seriesTi 表示股票i在时刻T的针对return_seriesTi 的权重序列,长度return_seriesTi 与一致。

即动量类因子的公式可以拆解为两项序列的内积:收益率项return_seriesTi 与权重项weight_mask_seriesTi 。

分别以一个月动量与一年动量举例,

一个月动量(MOM_1M)的收益率项为[ rT-240c, rT-239c, … , rT-21c, rT-20c, … ,rT-1c],这里 rTc表示按收盘价对前收盘价的方式计算的日度收益率;而一个月动量的权重序列为长度为240的序列 [0, 0, … , 0, 1, … , 1],其中前220个元素均为0,后20个元素均为1。

一年动量(MOM_1Y)的收益率项同样为[ rT-240c, rT-239c, … , rT-21c, rT-20c, … ,rT-1c],与一个月动量的收益率项一致;但一年动量的权重序列为长度为240的序列[1, 1, … , 1, 0, … , 0],其中前220个元素均为1,后20个元素均为0。

在将动量类因子算式拆解成两项模块后,对动量因子的开发就转化为对两项模块的挖掘与探索。其中收益率项维度上可供展开的空间不大,一般可供利用的收益率仅有收盘收益率、开盘收益率、均价收益率、日内收益率、隔夜收益率等这几项。因此,动量因子的探索空间主要集中在权重序列上。

图表25:不同收益率项中收益率元素的计算方式

权重序列,进一步可以分为两类:静态权重序列(static mask)与动态权重序列(dynamic mask)。

静态权重序列中所有元素都是事先固定好的确定值。像之前我们举例的一年动量与一个月动量,它们的权重序列中每一个元素的值与时刻T与股票i无关。无论是计算哪个时刻哪个股票的一个月动量因子值,它的权重序列最后20个元素都是确定的1,而其它元素都是确定的0。

静态权重序列中的元素不仅仅可以是0或1,可以是任何固定的实数值。业界投资者们在早年开发的大部分动量类因子都可以归在静态权重序列这一类中。例如:

• 结合一年动量与一个月反转的因子,其权重序列为[1, 1, … , 1, -1, … , -1],其中前220个元素均为1,后20个元素均为-1;

• 使用线性递减赋权方式计算的一个月反转的因子,其权重序列为[0, 0, … , 0, 0.05, … , 0.95, 1] ,前220个元素为0,从倒数第20个元素0.05起,每次递增0.05直到最后一个元素为1;

• 使用指数递减赋权方式计算的一个月反转的因子,其权重序列为[0, 0, … , 0, α19, … , α1, 1],前220个元素为0,最后20个元素则从α19,α18,一直到α1,α0,这里α是小于1的参数,根据投资者自行事先确定。

由于大部分静态序列下的因子效果长期来看相比于主流的一个月动量与一年动量并没有明显的差异或改善。因此近几年业界对动量类因子的挖掘尝试更偏向于构造不同的动态权重序列。

动态权重序列中的个个元素并非一成不变的固定值,而是取决于股票i在时刻T时的其它数据信息。换句话说,动态权重序列是其它数据信息的函数。这里其它数据信息可以是各种跟该股票相关的时间序列。例如:

• 剔除涨跌停收益的一年动量因子,其权重序列为

[mT-239, mT-238, … , mT-20, 0, … , 0],其中 mt 根据股票在t日的涨跌停状态取值,若非涨跌停则取值1,否则取值0。

• 日内波动调整的一个月反转因子,其权重序列为[0, 0, … ,0, mT-19, … , mT],其中,最后20个因素 mt 根据股票在t日的日内波动率大小取值,若t日的股票日内波动率高于 [T-19, T] 区间股票日内波动率样本的80%分位数则取值1,若低于20%分位数则取值-1,其余情况取值0。

可以看出,动态权重序列的构建可以利用一切与股票相关的时间序列信息。挖掘动量类因子的空间大多聚集于此。站在因子开发者的角度,开发动量类因子的路径此时有两类:

► 一是从逻辑推导入手,尝试寻找能区分动量强弱的股票特征。例如,按照我们第一章节所阐述的动量逻辑,机构投资者的交易行为更容易产生动量,散户投资者的交易行为更容易产生反转,那我们需要做的是判断每一天的收益率更多是由机构投资者交易主导造成的,还是散户交易者主导造成的。在无法获取直接的投资者结构数据的情况,进一步我们需要思考可以通过哪些股票特征变相判断出某个交易日的投资者交易占比是更偏向机构还是个人呢?如果认为日内波动率越高,散户投资者交易占比大概率更高,那么就可以用日内波动率这个数据来构建动态权重序列,进而构建相应的动量类因子。如果认为财报披露日前后,机构投资者交易占比会大概率上升,那么我们也可以用财报披露日期这个数据来构建动态权重序列,进而构建相应动量类因子。

► 二是从机器暴力挖掘入手。例如在遗传规划挖掘因子的算法中,主流通用的做法是直接生成完整的因子算式,并直接计算因子的IC均值或ICIR作为算法中的适应度度量,针对动量类因子的挖掘,可以转变为遗传规划挖掘动态权重序列而不是直接挖掘完整的因子算式,形成的动态权重序列通过内积与收益率项形成完整的因子后,再计算因子的IC均值或其它统计项作为算法中的适应度度量。这样就可以将遗传规划算法聚焦在仅挖掘动量类因子信息上。

图表26:逻辑推导方式下的动量类因子开发路径示例

图表27:机器暴力挖掘方式下的动量类因子开发路径示例

动量类因子的构建与测试

拆解动量类因子的开发路径,尤其是从逻辑角度入手的方式里,可以看出动量类因子结构中的核心部件就是反映逻辑核心的权重序列。这一节我们给出一些从逻辑推导得出的动量类因子构造并测试其在A股中的选股效果。

► 普通动量

• 一个月普通动量(mmt_normal_M)

逻辑:最近一个月的收益率更多体现了散户投资者对于近期信息的过度反映。

收益率项:收盘收益率。

权重序列: [0, 0, … , 0, 1, … , 1],其中前220个元素均为0,后20个元素均为1。

• 一年普通动量(mmt_normal_A)

逻辑:最近一年除去最近一个月的收益率一定程度从价格信息体现了公司的业绩能力。

收益率项:收盘收益率。

权重序列:[1, 1, … , 1, 0, … , 0],其中前220个元素均为1,后20个元素均为0。

► 夏普动量

• 一年夏普动量(mmt_sharpe_A)

逻辑:最近一年除去最近一个月的收益率一定程度从价格信息体现了公司的业绩能力。而收益率波动越低的股票,说明该股票交易中散户投资者参与的程度可能越低,动量延续概率越高。

收益率项:收盘收益率。

权重序列:[mi, mi, … , mi, 0, … , 0],其中前220个元素均为 mi,最后20个元素均为0。 mi 表示股票i在前220交易日的波动率的倒数。

► 隔夜动量

• 一个月隔夜动量(mmt_overnight_M)

逻辑:收益率中隔夜涨跌幅可能蕴含与日度收益率不同的信息特征,业界认为A股中隔夜收益率包含日度收益率中的“动量”成份。

收益率项:隔夜收益率。

权重序列:[0, 0, … , 0, 1, … , 1],其中前220个元素均为0,后20个元素均为1。

• 一年隔夜动量(mmt_ overnight _A)

逻辑:收益率中隔夜涨跌幅可能蕴含与日度收益率不同的信息特征,业界认为A股中隔夜收益率包含日度收益率中的“动量”成份。

收益率项:隔夜收益率。

权重序列:[1, 1, … , 1, 0, … , 0],其中前220个元素均为1,后20个元素均为0。

► 日内动量

• 一个月日内动量(mmt_intraday_M)

逻辑:收益率中日内涨跌幅可能蕴含与日度收益率不同的信息特征,业界认为A股中日内收益率包含日度收益率中的“反转”成份。

收益率项:隔夜收益率。

权重序列:[0, 0, … , 0, 1, … , 1],其中前220个元素均为0,后20个元素均为1。

• 一年日内动量(mmt_ intraday_A)

逻辑:收益率中日内涨跌幅可能蕴含与日度收益率不同的信息特征,业界认为A股中日内收益率包含日度收益率中的“反转”成份。

收益率项:隔夜收益率。

权重序列:[1, 1, … , 1, 0, … , 0],其中前220个元素均为1,后20个元素均为0。

► 去涨跌停动量

• 一年去涨跌停动量(mmt_off_limit_A)

收益率项:收盘收益率。

权重序列:[mT-239, mT-238, … , mT-20, 0, … , 0],其中 mt 根据股票在t日的涨跌停状态取值,若非涨跌停则取值1,否则取值0。

► 路径调整动量

• 一年路径调整动量(mmt_route_A)

逻辑:涨跌路径的定义为收益率区间内,每日收益率绝对值的总和。一个股票的涨跌路径长度越大,表明达到该总收益率的波动越大,噪音交易的占比可能越高,该股票的“动量”特征就越弱。因此该逻辑与夏普动量类似,将涨跌路径作为分母对动量因子进行调整时,能加强因子的“动量”预测性。

收益率项:收盘收益率。

权重序列:[mi, mi, … , mi, 0, … , 0],其中前220个元素均为 mi,最后20个元素均为0。 mi 表示股票i在前220交易日中所有日度收益率绝对值的总和的倒数。

► 振幅调整动量

• 一个月振幅调整动量(mmt_range_M)

逻辑:对于每一个股票,振幅较大的交易日相比振幅较小的交易日,个人投资者交易占比可能更高,因此振幅越大的交易日收益率可能更偏“反转”,而振幅越小的交易日收益率可能更偏“动量”。

收益率项:收盘收益率。

权重序列:[0, 0, … ,0, mT-19, … , mT],其中,最后20个因素 mt 根据股票在t日的日度振幅大小取值,若t日的股票日度振幅高于 [T-19, T] 区间股票日度振幅样本的80%分位数则取值1,若低于20%分位数则取值-1,其余情况取值0。

• 一年振幅调整动量(mmt_range_A)

逻辑:对于每一个股票,振幅较大的交易日相比振幅较小的交易日,个人投资者交易占比可能更高,因此振幅越大的交易日收益率可能更偏“反转”,而振幅越小的交易日收益率可能更偏“动量”。

收益率项:收盘收益率。

权重序列:[mT-239, mT-238, … , mT-20, 0, … , 0],其中 mt 根据股票在t日的日度振幅大小取值,若t日的股票日度振幅高于 [T-239, T] 区间股票日度振幅样本的80%分位数则取值-1,若低于20%分位数则取值1,其余情况取值0。

► 业绩公告期动量

• 业绩公告期动量(mmt_report_period)

逻辑:业绩披露日前后,机构投资者交易占比会大概率上升,该段时期的收益率有较强的“动量”特征。

收益率项:收盘超额收益率(股票收盘收益率 – 市场收盘收益率)。

权重序列:[mT-239, mT-238, … , mT-20, mT-19, … , mT],其中,假设t日为 [T-239, T-1 ]区间内股票最近一个业绩报告日,则权重序列中,mt-1, mt, mt 1取值1,其余所有元素取值0。

► 业绩公告前隔夜动量

• 业绩公告期动量(mmt_report_overnight_M)

逻辑:业绩披露前,部分投资者可能事先获知业绩信息,因此在业绩披露前的一段时间,该股票的知情交易占比可能上升。该短时间的收益率中“动量”特征会更显著。

收益率项:隔夜收益率。

权重序列:[mT-239, mT-238, … , mT-20, mT-19, … , mT],其中,假设t日为 [T-220, T ]区间内股票最近一个业绩报告日,则权重序列中,mt-19, mt-18, … , mt 这连续20个元素取值1,其余所有元素取值0。

► 业绩跳开动量

• 业绩公告期动量(mmt_report_jump)

逻辑:业绩披露后的第一个交易日的跳开方向与幅度,体现了该股票的业绩超预期的方向与幅度,该类有效信息有较强的“动量”特征。

收益率项:隔夜超额收益率(股票隔夜收益率 – 市场隔夜收益率)。

权重序列:[mT-239, mT-238, … , mT-20, mT-19, … , mT],其中,假设t日为 [T-239, T-1 ]区间内股票最近一个业绩报告日,则权重序列中 mt 1 取值1,其余所有元素取值0。

图表28:各类动量因子改进尝试及对应因子代码

针对上述动量类因子,我们以2010年1月至2022年4月的股票数据进行因子有效性测试。因子值计算时默认进行市值与行业中性化。

以一个月基础动量(mmt_nomral_M)的预测能力作为反转逻辑因子的表现基准,一年基础动量(mmt_normal_A)的预测能力作为动量逻辑因子的表现基准。测试结果显示,反转逻辑因子中,一个月振幅调整动量与一个月日内动量无论在全市场范围、中证500成分股、还是沪深300成分股范围内,均具有不错且超过一个月基础动量因子的预测能力。一个月振幅调整动量在全市场的IC均值-6.9%,ICIR绝对值高达1.04。在中证500与沪深300内,其ICIR绝对值亦分别达到0.71与0.48。

而动量逻辑因子中,不同股票池内有效因子略有差异。在全市场及中证500内,业绩公告前隔夜动量、业绩公告跳空动量、一年振幅调整动量、一年隔夜动量因子具有不错且远超一年基础动量的预测能力;而在沪深300池内,一年基础动量本身具有一定动量效果,在此基础上仍有更好效果的因子包括一年隔夜动量、去涨跌停动量、路径调整动量因子。

不得不指出,即使上述因子中不少改进方式的确增强了动量或反转因子的整体预测能力,预测能力主要集中在空头部分的现象仍未得到显著改善。以反转较强的一个月振幅调整动量因子与动量效果好的业绩公告前隔夜动量因子为例,它们的多空组合均有不错的收益能力,但多头的超额收益无论是收益水平还是稳定性都不尽人意。

图表29:全市场内不同动量因子的预测能力统计

图表30:中证500内不同动量因子的预测能力统计

图表31:沪深300内不同动量因子的预测能力统计

图表32:一个月振幅调整动量因子多空净值

图表33:一个月振幅调整动量因子多头超额净值

图表34:业绩公告前隔夜动量因子多空净值

图表35:业绩公告前隔夜动量因子多头超额净值

总结与观点展望

主要结论

► 截面分域中,动量特征在高机构覆盖、大市值、低波动、高价值的股票池中更明显;而反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池内更为显著。时序分域中,当市场处于下跌、低波动时期;风格处于大盘占优、成长占优的时期时,动量类因子倾向释放更多的“动量”特征;而当市场与上涨、高波动时期;风格处于小盘占优、价值占优的时期时,动量类因子倾向释放更多的“反转”特征。

► 动量因子的构建可以拆解为一种历史收益率序列向量与一种权重序列向量的内积。从逻辑推导入手的动量因子挖掘,其核心在于给出一种逻辑猜想,通过某些股票特征能判断出何时何地的股票交易中,其投资者交易占比是更偏向机构还是个人。并把该猜想以权重序列的形式表达出来。从机器暴力挖掘的角度入手,其核心在于利用算法不断优化寻找更理想的权重序列。

► 在A股的动量类型因子中,“反转”逻辑较为推荐一个月振幅调整动量与一个月日内动量因子。“动量”逻辑较为推荐业绩公告前隔夜动量、业绩公告跳空动量等因子。

观点展望

长期来看,随着A股市场越来越规范,机构投资者交易占比逐渐提升。A股的动量特征会越来越明显,而反转效果将逐步削弱。

而对近期的观点,考虑到当下我们对未来市场涨跌的择时观点尚显悲观,成长/价值风格轮动模型更看好成长风格。我们认为近期“动量”特征会更明显,而“反转”效应会比以往更弱。

本文摘自:2022年6月4日已经发布的《量化多因子系列(6):关于动量,你所希望了解的那些事》

胡骥聪 SAC 执业证书编号:S0080521010007 SFC CE Ref:BRF083

周萧潇 SAC 执业证书编号:S0080521010006 SFC CE Ref:BRA090

刘均伟 SAC 执业证书编号:S0080520120002 SFC CE Ref:BQR365

王汉锋 SAC 执业证书编号:S0080513080002 SFC CE Ref:AND454

法律声明

特别提示

一般声明

本资料较之中金公司正式发布的报告存在延时转发的情况,并有可能因报告发布日之后的情势或其他因素的变更而不再准确或失效。本资料所载意见、评估及预测仅为报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。证券或金融工具的价格或价值走势可能受各种因素影响,过往的表现不应作为日后表现的预示和担保。在不同时期,中金公司可能会发出与本资料所载意见、评估及预测不一致的研究报告。中金公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本资料意见不一致的市场评论和/或交易观点。

在法律许可的情况下,中金公司可能与本资料中提及公司正在建立或争取建立业务关系或服务关系。因此,订阅者应当考虑到中金公司及/或其相关人员可能存在影响本资料观点客观性的潜在利益冲突。与本资料相关的披露信息请访http://research.cicc.com/disclosure_cn,亦可参见近期已发布的关于相关公司的具体研究报告。

未经允许不得转载:股市行情网 » 中金公司 量化「中金关于动量你所希望了解的那些事」

相关文章

评论 (0)