抱最狠的团,亏最多的钱?Python量化散户抱团,揭秘A股股东户数秘密 | 附代码

科技   财经   2024-05-22 15:50   江苏  


这是邢不行第 114 期量化小讲堂的分享

作者 | 邢不行、密斯锌硒




在美股百年历史中,人多势众的散户被机构花式收割,散户大战华尔街的GEM事件也仅此一桩。



反观大A却好似截然不同。A股机构常被群嘲为大号韭菜,基金经理追涨杀跌,屡创新低。


散户不仅人数众多,还在3000点高地学艺多年,早已学富五车,博古通今,是不可忽视的一支生力军。



在A股这片独特的土壤上,是否能和美股的剧本不一样?散户能否凭人数优势战胜市场,战胜机构?我们又是否可以根据散户人数的优势来构建量化投资策略呢?


本文会就此来做相应的探究。



01

龙虎榜探索


1

散户大本营


想实现上述策略,就要有散户操作的相应数据。


数据对量化投资至关重要,没有数据就是巧妇难为无米之炊。


我找到了一个非常合适的数据来验证猜想,这个数据和东方财富这家券商有关。


作为全国最大的互联网券商,东财的主要客户群体就是散户。



在东财开户后,无论你身处何地,都会被统一归结到它在拉萨的几家营业部



由于这些营业部的交易量大多来自于散户,它们也被称为散户大本营。


需要注意的是,这几家营业部也是龙虎榜的常客。



2

龙虎榜简介


有同学可能不知道什么是龙虎榜,这里简单介绍一下。


每个交易日都会有一些股票的价格出现异常的波动,只要符合下图中任意一个条件的股票,交易所就会把它列出来,放到一个榜单上,这个榜单就是龙虎榜。



想了解更多龙虎榜内容可以看我这期文章


点击上图查看文章


3

龙虎榜表现


只要上了龙虎榜,交易所就会公布买入和卖出该股票活跃的营业部。


找到龙虎榜的历史数据,就会发现东财的东环路第一证券营业部经常上榜。


我还发现了某财经网站,它统计了该营业部在上榜后相关股票的未来表现。


东环路上榜后结果惨淡


细看上表,可以发现该营业部相关的股票,上榜后大概率是亏的,且上榜越久亏得越多,同时胜率也极低,简直就是追涨杀跌最好的反面教材。


并且除了东环路第一营业部,东财的其他三家营业部也有相应数据,表现也是同样的惨不忍睹。



更为魔幻的是,这个统计还是来自东财的官网,妥妥的我打脸我自己。


感兴趣的同学可以加我微信xbx297,我把相关网址发给你们,大家可以去围观一下。


4

初步判断


言归正传,通过龙虎榜数据我们可以初步判定,散户的人数优势并不能转化为实际收益。



但这个数据有一定的局限性,毕竟每天能上龙虎榜的股票是很有限的,东财的营业部也无法代表所有散户的操作。


如果数据不够全面,那基于这个数据构建的量化策略就会有失偏颇。


所以我们需要寻找其他可靠的数据,比如股东户数数据




02

股东户数数据


1

数据解释


股东户数数据也好理解,假如我的账号是一家上市公司



每个关注我的人就都是我的股东,大约有16万股东


去看其他领域,比如张三有3000多万个股东,影响力就远在我之上。



2

散户人数


言归正传,真实的股东数据通常在上市公司的定期财务报告中披露,每季度发布一次


通过该字段可以知晓一家公司具体有多少股东。


根据报告了解公司股东数


由于A股的散户远多于机构,也可以近似认为一家公司的股东户数约等于散户股东人数,即股东越多的公司,散户越多。



那么买散户多的公司能额外帮我们多赚钱还是会多亏钱呢?


3

数据&代码


要做这样的验证,我们需要找来A股历史上所有公司的股东人数数据,并借助Python代码进行计算。



相应的数据我已帮大家准备好了:



包含了不同报告期的股东户数、股东户数相对上期增减和户均持股市值等字段,非常全面。


懂行的一定能发现这份数据的珍贵,如果你对数据感兴趣的话,可以加我微信xbx297,都是可以直接免费发给你的。


4

简单统计


我们先借助数据做了一个简单统计


股东户数最多的公司(126万户)和最少的公司(1757户)有着云泥之别。


2023年年报股东户数极值


股东户数最多的一批股票大多是基本面优秀的行业龙头,这也较符合大家买好公司的共识。


并且在很多人眼中,股东户数少的公司关注度较低,无话题性,甚至可能有严重的财务问题


散户也就自然而然选择去抱团投资。



至于散户越多的公司到底能不能更赚钱,我们还是要用数据说话,去构建一个相关的量化策略做验证。



03

跟着散户买策略


1

策略构建


假设在每月最后一个交易日结束后将股东户数从小到大进行排序


删除当时处于ST/退市/停牌的股票,选出此时股东户数最大的10只。



在下个月的第一个交易日开盘时均仓买入。


一直持有至下个月最后一个交易日收盘,全部卖出。



再重新选择下个月股东户数最多的10只股票,并在下下个月的月初买入,如此循环往复


2

举例说明


比如在2024年的2月29日,根据策略选出以下10只股东户数最多的股票:



3月1日买入并一直持有至3月29日卖出,再重新选择符合条件的股票。



假设我们一开始投入一笔钱去交易这个策略,最终是赚是亏?



要验证这个想法,就需要借助相关历史数据和Python代码,如果你需要的话,可以加我微信xbx297,都是可以直接免费发给你的。



3

策略结果


程序运行结果如图所示:



代表策略的橙色曲线从1块钱涨到了1.29,和代表大盘的沪深300指数极度接近。


年化收益2.29%最大回撤却高达50%


我们精挑细选的买股东户数最多的量化策略,结果反而不如直接持有指数


这也就意味着:




04

股东户数分组统计


1

前10%策略


可能有人会说,每次只选10只股票太过极端,存在一定的偶然性,数据样本也不够,一旦有一只股票出现异常就很容易影响结论。


我们不仅只看股东户数前10的股票,还可以看股东户数最多的前10%的股票,这样更有说服力。


比如A股现在有5000只股票,前10%大约是500只,我们需将其一并买入。



大A散户人数最多,抱团最集中的股票大概率也处于这前500只中


要做这样的验证也很简单,我们只需把原代码条件改为前10%即可。



如果你对这个代码感兴趣的话,可以加我微信xbx297,都是可以直接免费发给你的。


2

策略结果


程序运行结果如图所示:



代表策略的橙色曲线从1块钱涨到了1.19元,还不如直接买前10的股票。


至此我们从数据角度做出了以下证明:



3

分组统计


关于股东户数,我们甚至还可以看排名前10%-20%、20%-30%等等等等,一直到90%-100%的股票表现,也就是把所有股票按股东户数从大到小分为10组。



最终结果如图所示:



可以明显发现股东户数越少的股票收益越高,且呈单调的递增性,这也说明股东户数对股票未来的涨跌有显著的预测作用。


看来我们不仅不能去买散户多的股票,反而要买散户少的。


这也契合部分金融市场的规律,比如不要去人多的地方真理往往掌握在少数人手中等等。



05

股东户数深究


至此我们知晓了A股散户的人数优势无效甚至有反作用力,造成该现象的原因也是多面的,我大概列了一下:



本文对股东户数的探究也相对粗浅,还有很多来不及介绍的地方:


策略探索方向


感兴趣的朋友可以加我微信xbx297,问我要了数据和代码自己去做相应的研究。


需要注意的是,买股东户数少的公司并不是一定能赚钱的,但我们可以基于该策略魔改优化,生成属于自己的策略。



06

后记


文章的最后,和大家分享一点量化投资的心得。


经常有人问我小白如何入门量化投资,有什么资料分享。


我特意为大家准备了一个《量化投资新手学习大礼包》






首先是我们自己总结的适合零基础新手的量化投资学习路径,可以让你知道自己每一步需要达到什么阶段。



接下来你可以通过我整理的量化文章合集,来更全面的了解量化投资到底是什么。



我还精选了适合各个学习阶段的策略研报合集,正如我一直所说,量化研报是很好的量化实践项目,深度研报可以显著提升你的量化水平。



这一份代码则适合喜欢研究技术指标的人,你可以跟着教程轻松计算出所有技术指标,并测试这个指标的有效性。



如果你有一定的基础,还可以尝试回测一些策略,我为你准备好了十几个不同类型的经典策略和它们的代码,相信总有一个适合你自己去魔改开发,运用到实盘。




最后也是最关键的,量化的基础就是准确的历史数据,我会送你一份股票历史日线数据和一份财务数据,你可以用它测试所有技术指标和财务指标,也可以用来回测大部分策略。




识货的你一定能够发现这个大礼包的价值吧。如果你需要的话,可以加我微信xbx297,都是可以直接免费发给你的。





往期文章推荐

以前嗤之以鼻,现在逐字学习!用Python量化缠论,一键自动生成交易信号 | 附代码 |【邢不行】

技术指标消亡史:从独领风骚到泯然众人 | 量化交易者如何看待技术指标,技术分析还能用吗?| 【邢不行】

微盘股还能买吗?量化轮动策略轻松跑赢指数12倍?!只会买指数ETF也能做量化?| 【邢不行】

大A为何频繁跳水,Python量化1200W条交易数据给你答案!| 【邢不行】

A股贵如金?Python量化验证AH股溢价效应,跟着买15年18倍?| 附策略代码

跟着基金买,别墅靠大海?买基金重仓股票,会破产吗?| 附最新选股结果 |【邢不行】

抓了几千万条热门股数据,用Python量化验证后发现结果竟然...... | 【邢不行】

抓了几千万条热门股数据,用Python量化验证后发现结果竟然...... | 【邢不行】

当我们谈论量化时,我们在谈论什么?量化投资常见策略有哪些?| 融券T0和高频交易详解|【邢不行】

散户反着买,别墅靠大海?股票上了龙虎榜还能买吗?【邢不行】

量化交易一定是机器人+自动化+高频交易吗?| 常见量化交易误区合集,新手脱坑入门指南 | 【邢不行】

抄底总在半山腰?抄底A股的时机何时到来?|【 邢不行】

邢不行
专注股票、B圈、期货、期权的量化交易,欢迎交流。
 最新文章