这是邢不行第 114 期量化小讲堂的分享
作者 | 邢不行、密斯锌硒
在美股百年历史中,人多势众的散户被机构花式收割,散户大战华尔街的GEM事件也仅此一桩。
反观大A却好似截然不同。A股机构常被群嘲为大号韭菜,基金经理追涨杀跌,屡创新低。
而散户不仅人数众多,还在3000点高地学艺多年,早已学富五车,博古通今,是不可忽视的一支生力军。
在A股这片独特的土壤上,是否能和美股的剧本不一样?散户能否凭人数优势战胜市场,战胜机构?我们又是否可以根据散户人数的优势来构建量化投资策略呢?
本文会就此来做相应的探究。
01
龙虎榜探索
1 | 散户大本营 |
想实现上述策略,就要有散户操作的相应数据。
数据对量化投资至关重要,没有数据就是巧妇难为无米之炊。
我找到了一个非常合适的数据来验证猜想,这个数据和东方财富这家券商有关。
作为全国最大的互联网券商,东财的主要客户群体就是散户。
在东财开户后,无论你身处何地,都会被统一归结到它在拉萨的几家营业部。
由于这些营业部的交易量大多来自于散户,它们也被称为散户大本营。
需要注意的是,这几家营业部也是龙虎榜的常客。
2 | 龙虎榜简介 |
有同学可能不知道什么是龙虎榜,这里简单介绍一下。
每个交易日都会有一些股票的价格出现异常的波动,只要符合下图中任意一个条件的股票,交易所就会把它列出来,放到一个榜单上,这个榜单就是龙虎榜。
想了解更多龙虎榜内容可以看我这期文章。
点击上图查看文章
3 | 龙虎榜表现 |
只要上了龙虎榜,交易所就会公布买入和卖出该股票活跃的营业部。
找到龙虎榜的历史数据,就会发现东财的东环路第一证券营业部经常上榜。
我还发现了某财经网站,它统计了该营业部在上榜后相关股票的未来表现。
东环路上榜后结果惨淡
细看上表,可以发现该营业部相关的股票,上榜后大概率是亏的,且上榜越久亏得越多,同时胜率也极低,简直就是追涨杀跌最好的反面教材。
并且除了东环路第一营业部,东财的其他三家营业部也有相应数据,表现也是同样的惨不忍睹。
更为魔幻的是,这个统计还是来自东财的官网,妥妥的我打脸我自己。
感兴趣的同学可以加我微信xbx297,我把相关网址发给你们,大家可以去围观一下。
4 | 初步判断 |
言归正传,通过龙虎榜数据我们可以初步判定,散户的人数优势并不能转化为实际收益。
但这个数据有一定的局限性,毕竟每天能上龙虎榜的股票是很有限的,东财的营业部也无法代表所有散户的操作。
如果数据不够全面,那基于这个数据构建的量化策略就会有失偏颇。
所以我们需要寻找其他可靠的数据,比如股东户数数据。
02
股东户数数据
1 | 数据解释 |
股东户数数据也好理解,假如我的账号是一家上市公司。
每个关注我的人就都是我的股东,大约有16万股东。
去看其他领域,比如张三有3000多万个股东,影响力就远在我之上。
2 | 散户人数 |
言归正传,真实的股东数据通常在上市公司的定期财务报告中披露,每季度发布一次。
通过该字段可以知晓一家公司具体有多少股东。
根据报告了解公司股东数
由于A股的散户远多于机构,也可以近似认为一家公司的股东户数约等于散户股东人数,即股东越多的公司,散户越多。
那么买散户多的公司能额外帮我们多赚钱还是会多亏钱呢?
3 | 数据&代码 |
要做这样的验证,我们需要找来A股历史上所有公司的股东人数数据,并借助Python代码进行计算。
相应的数据我已帮大家准备好了:
包含了不同报告期的股东户数、股东户数相对上期增减和户均持股市值等字段,非常全面。
懂行的一定能发现这份数据的珍贵,如果你对数据感兴趣的话,可以加我微信xbx297,都是可以直接免费发给你的。
4 | 简单统计 |
我们先借助数据做了一个简单统计。
股东户数最多的公司(126万户)和最少的公司(1757户)有着云泥之别。
2023年年报股东户数极值
股东户数最多的一批股票大多是基本面优秀的行业龙头,这也较符合大家买好公司的共识。
并且在很多人眼中,股东户数少的公司关注度较低,无话题性,甚至可能有严重的财务问题。
散户也就自然而然选择去抱团投资。
至于散户越多的公司到底能不能更赚钱,我们还是要用数据说话,去构建一个相关的量化策略做验证。
03
跟着散户买策略
1 | 策略构建 |
假设在每月最后一个交易日结束后将股东户数从小到大进行排序
删除当时处于ST/退市/停牌的股票,选出此时股东户数最大的10只。
在下个月的第一个交易日开盘时均仓买入。
一直持有至下个月最后一个交易日收盘,全部卖出。
再重新选择下个月股东户数最多的10只股票,并在下下个月的月初买入,如此循环往复。
2 | 举例说明 |
比如在2024年的2月29日,根据策略选出以下10只股东户数最多的股票:
在3月1日买入并一直持有至3月29日卖出,再重新选择符合条件的股票。
假设我们一开始投入一笔钱去交易这个策略,最终是赚是亏?
要验证这个想法,就需要借助相关历史数据和Python代码,如果你需要的话,可以加我微信xbx297,都是可以直接免费发给你的。
3 | 策略结果 |
程序运行结果如图所示:
代表策略的橙色曲线从1块钱涨到了1.29元,和代表大盘的沪深300指数极度接近。
年化收益仅2.29%,最大回撤却高达50%。
我们精挑细选的买股东户数最多的量化策略,结果反而不如直接持有指数。
这也就意味着:
04
股东户数分组统计
1 | 前10%策略 |
可能有人会说,每次只选10只股票太过极端,存在一定的偶然性,数据样本也不够,一旦有一只股票出现异常就很容易影响结论。
我们不仅只看股东户数前10的股票,还可以看股东户数最多的前10%的股票,这样更有说服力。
比如A股现在有5000只股票,前10%大约是500只,我们需将其一并买入。
大A散户人数最多,抱团最集中的股票大概率也处于这前500只中。
要做这样的验证也很简单,我们只需把原代码条件改为前10%即可。
如果你对这个代码感兴趣的话,可以加我微信xbx297,都是可以直接免费发给你的。
2 | 策略结果 |
程序运行结果如图所示:
代表策略的橙色曲线从1块钱涨到了1.19元,还不如直接买前10的股票。
至此我们从数据角度做出了以下证明:
3 | 分组统计 |
关于股东户数,我们甚至还可以看排名前10%-20%、20%-30%等等等等,一直到90%-100%的股票表现,也就是把所有股票按股东户数从大到小分为10组。
最终结果如图所示:
可以明显发现股东户数越少的股票收益越高,且呈单调的递增性,这也说明股东户数对股票未来的涨跌有显著的预测作用。
看来我们不仅不能去买散户多的股票,反而要买散户少的。
这也契合部分金融市场的规律,比如不要去人多的地方;真理往往掌握在少数人手中等等。
05
股东户数深究
至此我们知晓了A股散户的人数优势无效甚至有反作用力,造成该现象的原因也是多面的,我大概列了一下:
本文对股东户数的探究也相对粗浅,还有很多来不及介绍的地方:
策略探索方向
感兴趣的朋友可以加我微信xbx297,问我要了数据和代码自己去做相应的研究。
需要注意的是,买股东户数少的公司并不是一定能赚钱的,但我们可以基于该策略魔改优化,生成属于自己的策略。
06
后记
文章的最后,和大家分享一点量化投资的心得。
经常有人问我小白如何入门量化投资,有什么资料分享。
我特意为大家准备了一个《量化投资新手学习大礼包》。
首先是我们自己总结的适合零基础新手的量化投资学习路径,可以让你知道自己每一步需要达到什么阶段。
接下来你可以通过我整理的量化文章合集,来更全面的了解量化投资到底是什么。
我还精选了适合各个学习阶段的策略研报合集,正如我一直所说,量化研报是很好的量化实践项目,深度研报可以显著提升你的量化水平。
这一份代码则适合喜欢研究技术指标的人,你可以跟着教程轻松计算出所有技术指标,并测试这个指标的有效性。
如果你有一定的基础,还可以尝试回测一些策略,我为你准备好了十几个不同类型的经典策略和它们的代码,相信总有一个适合你自己去魔改开发,运用到实盘。
最后也是最关键的,量化的基础就是准确的历史数据,我会送你一份股票历史日线数据和一份财务数据,你可以用它测试所有技术指标和财务指标,也可以用来回测大部分策略。
识货的你一定能够发现这个大礼包的价值吧。如果你需要的话,可以加我微信xbx297,都是可以直接免费发给你的。
联系作者
往期文章推荐
以前嗤之以鼻,现在逐字学习!用Python量化缠论,一键自动生成交易信号 | 附代码 |【邢不行】
技术指标消亡史:从独领风骚到泯然众人 | 量化交易者如何看待技术指标,技术分析还能用吗?| 【邢不行】
微盘股还能买吗?量化轮动策略轻松跑赢指数12倍?!只会买指数ETF也能做量化?| 【邢不行】
大A为何频繁跳水,Python量化1200W条交易数据给你答案!| 【邢不行】
A股贵如金?Python量化验证AH股溢价效应,跟着买15年18倍?| 附策略代码
跟着基金买,别墅靠大海?买基金重仓股票,会破产吗?| 附最新选股结果 |【邢不行】
抓了几千万条热门股数据,用Python量化验证后发现结果竟然...... | 【邢不行】
抓了几千万条热门股数据,用Python量化验证后发现结果竟然...... | 【邢不行】
当我们谈论量化时,我们在谈论什么?量化投资常见策略有哪些?| 融券T0和高频交易详解|【邢不行】