EN 中文

基于产业节点联动效应的量化交易策略研究

Aug 04,2019



一、数据说明


1.  产品节点标准化处理


数库"SAM"产业链是由不同产品节点通过上下游关系连接起来的网状数据体系。数库以GICS行业分类为标准,通过对上市公司财务报告上的主营业务分项数据的标准化处理,将财报上数以万计的非标准化产品标准化为超过4000个产品节点,并在这些产品节点之间定义了以下关系:


•  A:生产设备:上游生产制造时所需要的工业机械、电气设备等

•  D:销售渠道:购买原材料或者销售成品的环节

•  F:辅助设备:产品后续正常运转所需的辅助设备

•  M:生产原料:上游生产制造时所需要的原材料等

•  P:主体:一般是生产流程产出的成品,或待销售 的产品、服务

•  R:辅助材料:产品后续正常运转所需的辅助材料

•  T:技术服务:生产时所需要的专业技术、商业服务或为相关产品提供的后续服务


如下图所示,为“半导体”上下游的关系图,其中上游有如“生产设备”相关的“半导体设备”及真空镀膜设备,下游有如“技术服务”的“半导体产品安装服务”。


图表1 半导体产品上下游关系图


上市公司在年报及半年报会披露该报告期的主营业务收入的分项数据,通过匹配这些非标准的产品与数库产业链的标准产品节点,我们可以把上市公司根据其主营业务把他们串联在一起。如图2所示,美的集团在17年的年报上披露了其主营业务收入的明细情况,我们通过标准化处理把“暖通空调”标准化为“空调器”、“机器人及自动化系统”标准化为“工业机器人”等。


图表美的集团2017年主营业务收入


当有了每家上市公司的标准化主营业务收入数据后,不同的上市公司自然就可以通过这些标准的产品节点串联在一起,如下图3所示为空调产业链的部分数据,空调器的下游有白色家电销售,而相关的公司有“苏宁易购”;空调器的上游有“铜矿及其精矿”,相关的公司有“华钰矿业”等。


 

图表空调产业链


2. 产品层级与唯一主营业务


正如行业分类有级别之分,数据的产业链数据中产品节点也有层级之分,数库产品的一级科目对应的是数库行业分类的四级行业,产品最深可以到9级(也就是行业的12级),每家上市公司的唯一主营业务定义为在某个产品层级上的收入占其总收入的50%以上,我们就以该产品节点作为这家上市公司该报告期的主营业务。


如下图4所示,在玻璃容器这个4级的产品节点上,相关的上市公司有“山东华鹏”、“德力股份”等6家上市公司,但其中只有前两家上市公司在该产品节点的收入占比超过50%,所以我们就以“玻璃容器”作为“山东华鹏”及“德力股份”的唯一主营业务。


图表产品层级及业务收入占比



二、策略研究


1. 策略逻辑


根据数库的产业链数据,我们可以定义每家A股上市公司的唯一主营业务。当唯一主营业务相同的公司里,大部分公司的股价出现同向涨跌,而剩下的没有出现同向涨跌的公司的股价是否会在后面的交易日里出现联动效应呢?这就是本章我们探讨的基于产业链数据的股价联动的交易策略。


具体的策略逻辑做如下定义:

首先,根据每家公司的唯一主营业务,找出唯一主营业务且公司数量大于等于4家上市公司的产品节点。统计在上一个交易日,这N家上市公司股价的涨跌情况,如果有超过75%的公司的股价同涨(收益率均大于0),则在第二个交易日买入剩余的未上涨的股票。如果有超过75%的公司的股价同跌(收益率均小于0),则在第二个交易日做空剩余的未下跌的股票。


2. 回测研究


回测区间2015年1月份至2019年7月份,由于考虑到主营业务必须要反应同一个财报期的情况,对于财报数据我们没有做Point in Time的处理。而是采用以下对其规则:1-4月份使用上一年度的半年报数据,5-8月份使用上一年度的年报数据,9-12月份使用本年度的半年报数据。


2.1  数据统计


在数库提供产业链数据表中,有一张数据表[fin_secu_primary_product]专门提供每个报告期各上市公司唯一主营业务的数据。该表的相关字段说明如下表:



我们统计了2015-2019每个报告期涉及的唯一主营产品的数量,以及唯一主营产品相同且公司数量超过四家的公司的产品节点覆盖的所有A股上市公司的数量。从下图可以看出,A股上市公司所有主营产品的种类大约在1200-1500之间;同样,唯一主营产品相同且超过四家公司的产品节点总共覆盖的A股上市公司的数量在1000-1600之间。所以该策略在监测同一产品节点股价的联动性时,大概覆盖了全市场一半的股票。


图表各财报期唯一主营业务产品数量


图表各财报期唯一主营业务产品公司数量大于4家的产品节点覆盖的上市公司数量



2.2 回测结果


如下图所示,在2015.01-2019.07月份,该策略大幅跑赢了买入持有策略,其中空头、多头和多空策略的累积收益分别为32%、27%及69%,胜率分别为49%、47%及55%。详细的收益率的统计指标如表格8所示。


图表7 2015-2019收益曲线图

图表策略收益指标


我们还统计了每日交易的股票的数量,如下图所示,其中买入最多的一个交易日是买入了158只股票,平均每天买入的股票为49只;卖出最多的一个交易日也是卖出了158只股票,平均每天卖出的股票为35只。


图表9 2015-2019年每交易日交易股票数量箱型图


以上的回测中,我们监测了所有的产品节点,但并不是所有的产品节点都有明显的联动效应,下图给出了所有产品节点的收益表现的分布图,我们可以看出有相当一部分的产品节点在2015-2019的4年多时间没有产生正收益。


图表10 所有产品节点的收益分布图


既然有大部分产品的联动效应无法获取正收益,势必会降低整个策略的收益。所以我们考虑,在监测产品节点的联动效应到最终交易的过程中,我们可以对产品进行筛选。可以用滚动窗口的形式,每次选取前一段时间联动效应最明显的产品节点进行交易。


所以我们又进行了如下测试,每一周根据前一周的表现(平均收益),选取收益最高的前20个产品进行联动效应的监测并交易,当扣除双边千分之三的交易成本之后,回测效果如下图所示,可以发现该策略的收益优于上述包含所有产品节点的策略。其中红色的线为每个滚动窗口做多上一个窗口中多头策略表现最好的产品节点,同时做空的是上一个窗口中空头策略表现最好的产品节点。而绿色线表示每个滚动窗口选取的是上一个窗口中多空策略表现最好的产品节点,同时做空的也是上一个窗口中多空策略表现最好的产品节点。我们可以发现该策略的主要收益的贡献来源于多头策略,下表给出了具体的收益指标,其中空头、多头和多空策略的累积收益分别为85%、9.4%及119.90%,年化收益分别为15.2%,2.1%及19.8%。


图表11 滚动筛选前20最优产品节点策略收益


图表12 滚动筛选前20最优产品节点策略收益指标


图表13 滚动选取前20个产品节点,每日交易的股票数量


以下是滚动筛选前10个表现最好的产品节点的收益,从下至上其年化收益分别为6.3%,25%,33%及34%:


图表14 滚动筛选前10个表现最好产品节点收益图


图表15 滚动筛选前10最优产品节点策略收益指标


三、 总结


数库产业链数据给我们提供了对于公司主营业务更标准化的视角。本篇报告研究了同一产品节点下股价的联动效应,无论当前处于熊市或牛市,当公司主营业务相同时,其受到的外界对于股价的影响因素也非常相似。回测结果也显示,我们可以对各产品节点进行监测,以捕捉股价联动效应带来的超额收益。后续的研究中,我们会继续关注不同产品上下游之间的价格传导效应。