某金融机构用素镜科技的模型历史数据,模拟量化选股,将素镜财报辨伪评分、企业经营画像评分,作为“横向”选股条件,将符合条件的股票纳入指数成分股,计算一段时间内的指数累计收益。同时,通过指数累计收益,对比不同基准下的选股是否有效。
第一轮:素镜数据自身对照评测
一、概要——素镜模型:
素镜科技每年对企业半年报、三季度报和年报做定期模型自动评估,覆盖全部A股、三板、发债、港股、申请IPO非金融企业。企业一旦发布财报数据,系统将在数秒内完成评估。素镜科技是市场上唯一一家,不依赖监管等舆情信息,以纯量化模型,精准评估企业风险的公司。素镜模型,2018年上线至今,历经七年公开市场打磨验证和回测,模型精准度近95%。
素镜科技两个主要模型:财报辨伪模型——抓取企业财务造假信号,并量化评估爆雷风险;企业行为画像模型——从九大维度,量化评估财务数据背后企业经营风险。
二、模拟步骤(以下为某金融机构评测原文)
1、数据实际生效日:由于财报实际披露时间,较财报统计截止日期有滞后,故在素镜科技各股票报告期数据的基础上,追加报告期对应的发布日期列,实际评测中,以发布日期作为评分变动日。
2、评分数据转为日频数据:通过将财报辨伪评分以及企业行为画像评分数据,从财报发布日期当天向后填充无数据交易日的方法,将报告期节点数据转为日频数据。
3、设置财务造假对照组以及企业行为画像对照组:按照财报辨伪评分以及企业行为画像评分,划分成财报辨伪对照组(财报辨伪低风险、财报辨伪高风险)、企业行为画像对照组(企业行为画像低风险、企业行为画像高风险)、双项评分对照组(双项评分均低风险、双项评分均高风险)。
3.1.使用财报辨伪风险等级划分表,将全市场股票划分为两组:低风险(财报辨伪评分≤60)、高风险(财报辨伪评分>60)。
3.2.使用企业行为画像风险等级划分表,将全市场股票划分为两组:低风险(企业行为画像评分≥-5)、高风险(企业行为画像评分<-5)。
3.3.使用财报辨伪风险等级划分表和企业行为画像风险等级划分表,全市场股票划分为两组:双项低风险(企业行为画像评分≥-5 & 财报辨伪评分≤60)、高风险(企业行为画像评分<-5 & 财报辨伪评分>60)
4、计算日涨跌幅方法:由于常规市值加权法计算涨跌幅,会使得最终结果受高市值公司的股价涨跌幅影响较大,因此将当日符合条件的股票,采用等权计算的方法计算“日涨跌幅”。当日停牌股,不参与日涨跌幅的计算。
5、每日符合条件的成分股:在符合基本“评分条件”的基础上,以下两种股票做剔除处理:①京市股票由于上市时间较短,股价受非基本面影响较大——剔除;②新股上市不设涨跌幅限制,在等权计算每日涨跌幅的情况下影响过大,并且上市初期容易受炒作影响,严重偏离基本面,故新股仅在第21个交易日之后才纳入成分股。
6、设置累计收益统计起止日期:素镜科技提供的数据为2018年中报至2021年年报。2018年中报发布日期为2018年7月至9月,前期每日符合条件的股票数据较少,数据噪音较大,故起始日期定为2019年第一个交易日(2019年1月2日)。2021年年报发布日期为2022年1月至4月,由于素镜科技不评测一季报数据,故年报评分数据可沿用至2022年半年报发布日之前,故截止日期定为2022年6月30日。
7、累计收益计算方法:使用常规累计收益计算方法,区间累计收益率 = ∏(1 +日涨跌幅)- 1
8、计算每日成分股个数:由于部分长期停牌、暂停上市的股票,没有正常交易,但是仍然会披露财报,在实际计算中并不会纳入涨跌幅统计,因此统计每日成分股个数时,需要剔除这些股票。每个股票集计算平均每日正常交易成分股个数、最大每日正常交易成分股个数、最小每日正常交易成分股个数。
三、结论
从累计收益率角度看,财报辨伪、行为画像高、低风险组有明显差异:
(1)财报辨伪组:高风险组区间收益为44.57%,明显低于对照低风险组的64.55%。
(2)企业行为画像组:高风险组区间收益为29.44%,明显低于对照低风险组的79.22%。
(3)双项评分组:双项高风险组区间收益为27.59%,明显低于对照低风险组的80.24%。
每日成分股个数:
(1)财报辨伪组:高风险组每日成分股平均个数为2134(最大2540,最小1866),低风险组每日成分股平均个数为1769(最大2113,最小1471)。成分股平均数偏重较轻,成分股日度个数波动范围适中。
(2)企业行为画像组:高风险组每日成分股平均个数为2335(最大2743,最小1906),低风险组每日成分股平均个数为1568(最大2098,最小1064)。成分股平均数偏重较为明显,高风险组成分股明显多于低风险组,成分股日度个数波动较大。
(3)双项评分组:双项高风险组每日成分股平均个数为1586(最大1872,最小1293),低风险组每日成分股平均个数为1020(最大1392,最小744)。成分股平均数偏重较为明显,高风险组成分股明显多于低风险组,成分股日度个数波动较大。
总结:
(1)三项对照组低风险组收益均高于高风险组,证明素镜科技财报辨伪评分、企业行为画像评分均有效。
(2)企业行为画像评分有显著择优/排雷效果。
四、素镜点评:
1、经营与股价高度相关
以上部分为某金融机构第一轮测评,从中可以看到:行为画像评分(评估企业经营状况)与收益率强相关,行为画像分>=20区间,股价累计涨幅达100.72%;行为画像分>=0区间,股价累计涨幅达86.5%;而2018年-2021年期间,总体样本在等权基础上,涨幅为54.48%。
2、“不造假”≠“经营好”≠“股价涨“ & “造假”≠“股价跌“
以上金融机构的测评,对财报辨伪模型的理解有些偏差。
首先,素镜辨伪模型单期高风险预警线是70分,而该金融机构取了60分。素镜财报辨伪模型造假预警规则设置通常采用(单期辨伪分高低+历史预警次数)综合考虑,以排除偶然因素导致的财报调节。该机构测评时采用60分,误杀了许多造假信号尚未达预警的企业。
此外,财报辨伪识别造假信号,仅用于排除而非选择,“不造假”≠“经营好”,而经营与股价高度相关,因此单看财报辨伪意义不大。造假风险从开始造假到被发现爆雷,至少需要3-5年的风险演变,明显的造假已被市场定价,隐藏深的造假,财报诠释的经营状况优良,暂未被市场定价,“造假”≠“股价跌“。
尽管如此,可以看到综合类型中第1、2组,”财报辨伪低风险组“收益率明显高于”财报辨伪高风险组“,其中隐含的内在关系是:造假信号与经营好坏强相关,而经营又与股价强相关——也即经营好的企业通常不造假,但这个推论如果反过来却不一定成立,也即:“不造假”的企业不一定“经营好”,也不一定“股价涨“ 。
综上,行为画像直接反映企业经营状况,但其中也有noise,即造假,要剔除这部分noise,最好的方法是用素镜已有的预警规则(单期辨伪分高低+历史预警次数)剔除短期可能爆雷的成分股,而不是依据辨伪分一刀切。
第二轮:素镜数据与市场对照评测
一、概要
在第一轮评测中,已验证素镜科技财报辨伪评分、企业行为画像评分均有效,故进入第二轮深入评测。
由于最终目的为使用素镜科技评分选出优质股票,而素镜科技的评分中,剔除了金融行业股票,可能与大盘存在偏移。故在第二轮评测中,将对比两个素镜股票对照组,与全市场、主要指数之间的收益情况,评测在缺少金融行业股票的情况下,素镜低风险/高风险股票集,收益率是否高于/低于市场综合收益。
本轮评测注重点为低风险股票集,收益是否能跑赢基准,如果能跑赢基准,则认为评分强有效,进入下一轮深入评测。
二、具体步骤
1.基准设置:使用全沪深A股组合,以及沪深1800成分股合集(沪深300、中证500、中证1000)作为基准,以下简称“沪深1800”
1.1.沪深A股:沪深A股全股票作为第一项基准,为初级收益门槛。
1.2.沪深1800成分股合集:每日沪深300、中证500、中证1000的成分股合集,这三项指数涵盖了A股市场不同规模和不同行业中,大众意义上的“好标的”,为最为大众认可的业绩表现对比标杆,在此作为中级收益门槛。
2.基准计算方式:为保证收益率具有可对比性,基准也同样使用第一轮中,计算素镜收益率的计算方法。
三、结论
从上图可见,素镜各风险组合中,收益率最佳组为行为画像分>=20,与沪深A股相比,超额收益率为46.18%;与沪深1800相比,超额收益率为30.32%。风险最高组为双项评分风险高组(行为画像评分<-5 & 财报辨伪评分>60),与沪深A股和沪深1800相比,超额收益率分别为-26.95%和-42.81%。
此外,如果财报辨伪使用方法得当,依据上一部分素镜点评建议修改,高低风险辨识度在收益率区分上会表现更加明显。
第三轮:素镜数据与“讲故事”指标结合
在A股的股价逻辑里,“讲故事能力”似乎比“经营状况”更密切影响股价,如果把这个能力简易快速量化标准化,再与素镜模型数据结合,收益率会再大大提高,例如行业权重,如半导体、芯片之类;高收入增长率、高毛利率也常常隐含未来趋势逻辑,等等。
以下简单用收入增长率结合,与沪深A股相比,最高超额收益率为61.88%;与沪深1800相比,最高超额收益率近50%,整体增加16%。
具体如何提高收益率,需要花时间在不同指标和评分区间、样本数之间多加测试,找到其中临界点,相信只要方法得当,超过沪深1800收益80%-100%以上也未尝不行。素镜科技可提供2021年以前十年,任何年份历史数据供测试,有兴趣可与客服联系获取。
添加客服微信:SujingkjService
【进入公众号】-【会员】-【申请试用】