重磅更新V45版本-股市痛点二
财富
财经
2024-10-05 14:22
江西
2011年北京邮电大学软件工程硕士研究生。投资风格深受陶博士、股市魔法师mark影响,利用大数据挖掘分析量化专长,专注于净利润断层模式、口袋支点、VCP、3C等模式,分析第二阶段股票、致力于量化市场情绪规避系统风险。
在昨天的文章中,我们说了,我们经过国庆的几点加班加点,完成了概念匹配度V45版本的研发工作,并昨天在文章中说了,股市有2个痛点,第一就是热门板块,无法在早期被发现。这个在昨天的文章中,已经详细说过。 那今天来说说第二个痛点,概念板块的分类合理性问题。非常巧的事情是,今天早上陶博士在文章中,也谈到了板块RPS的相关内容。他在这里就是用的是通达信的板块原始数据。 这份数据,有几个比较问题,我们可以详情看下,第一他一共只有260个概念,第二,他每个概念中,不区分匹配度,把根红苗正的和小杂毛放在一起进行等权重计算板块指数。 第一个问题,由于的他的概念板块分类不够细致,很多细分领域的概念,他没有涉及到,导致一些概念出现异动,他无法识别到。我们的匹配度V45表格中,一共有接近900个概念,比260翻了好几遍,所以这个精细度会好很多,而且我们这个是根据市场变化,会更新新的概念板块。 第二个问题,就更严重,比如上面截图可以看到,他的化肥板块,都包括了53个成分股票。这种不区分根红苗正的,还是小杂毛的做法,导致板块指数不灵敏,没有办法在板块最早期,就及时发现该板块有异动。 概念板块研究,是一个永恒的课题,他的重要性不言而喻。大盘、板块和个股,概念板块研究,是个承上启下的过程,在大环境不太差的情况下,只要板块选对了,吃肉只是多少问题。板块研究,有几个层次,其实很多人还一直停留在1.0时代,也就是一直使用通达信、同花顺等软件的原始数据。以下是我对板块研究层级的划分:1.0时代 就是利用现有的通达信、同花顺等软件现有数据。
1)样本量太小,如果按照总共200-300个样本量太小
2)各个板块,各种分类方式混杂在在一起分类,没有统一。这种基础数据加工出来的东西,效果就可想而知了.而咱们的个股呢,为什么它会很好呢?因为个股都是统一标准,它都是实实在在在我们市场上交易的4000多个股票,它的标准非常统一
2.0时代 我们利用大数据挖掘技术,首创将目前的三级分类升级到了四级板块分类,板块数量也扩容到了接近900多个,后面还在不断更新。另外板块的分类方式统一化,都是按照概念来划分,标准统一。完全避免了1.0时代划分标准混乱的问题,1.0时代的板块划分,有按资金类型分的,比如外资背景,有按市盈率分的,比如低市盈率,又按省份地域分的,比如陕西板块,又按增减持分的。所以这种分类方式五花马门,强行把这些混乱的分类放在一起研究,得出的结论可想而知.另外还有一点,从统计学的角度来说,因为你的样本量不够,一共才200-300个这样统计出来的。1)通达信、同花顺等综合性软件,他们的板块分类就像一个大筐,只要跟某个板块挨边的都往里面装。举一个储能板块,储能板块。通达信里该板块一共400个股票。
看到了吧,一共400个股票,如果你是大资金要临幸这个板块,你可能雨露均沾吗?绝对不可能的,只会先发动最最根红苗正的,这个道理大家好理解吧。那如何区分哪些是根红苗正的,哪些是小杂毛,这就必须用到板块匹配度这个杀手锏了。
2)第二个原因,就是板块指数问题。大家都知道在计算某个板块指数的时候,都通过算术平均或者加权平均的方式,对这个板块里所有的股票进行计算。之前我举过一个例子,就是一个班,有学霸,也有学渣的。你把学霸和学渣放在一起打平均分。这样的分数很难脱颖而出。如果把学渣开除出这个班级,只计算学霸的平均分,那他是不是就能早早的脱颖而出呀。3.0时代 用拔毛算法,把板块中的小杂毛全部剔除,只留下根红苗正的,这样能大大增加板块指数的灵敏度,能做到早发现,早介入。为什么说拔毛算法是具有里程碑价值的呢?因为她的难度。首先,我们这个数据是动态的,而不是静态的数据。所谓的静态数据,那就非常好处理,就用每个股票的主营收入占比即可。主营收入占比第一的,就是最一板块,占比第二的,就是第二板块。这就是我说的静态数据,这个数据就非常好处理,但是在实战中你会发现,这样的数据,没有实战价值。真正有价值的数据,是动态数据,简单一句话,就是市场老师认为你有这个概念,你就有,市场老师不认可你有,那就是没有。 所以难就难在动态上面,我们在正则化径向基神经网络模型,用高斯聚合的距离函数计算权重分布的基础上,为了提高拟合率,我们首次加入了卷积神经网络CNN,采用了前向传播计算输出值,反向传播调整权重和偏置的方式。4.0时代 就是在3.0的基础上,用赛德尔迭代算法进行持续迭代升级。我们知道因为这个不断迭代的,不是一成不变的,去年你是主力部队,今天由于业务调整了,今年在各种大战,你都不参与,那今年你就被踢出这个主流圈子了。你不再有资格代表这个板块。赛德尔迭代算法在这种过程中,有比较重要的应用。 再同步一下进展,我今天有把我们的这个大杀器升级了一下,这列是增加了公司在这个概念板块中的详情。其实就是我昨天文章中说的,先根据动态选出最核心的股票,然后通过大模型匹配上公司的业务详情,增加了最后一列,算是动静结合的版本。这份研究成果,可以联系我,实战永远是我们的目标。==========================================
粉丝福利:1、享受 vip佣金万1开户(大家可以去查下自己的佣金,绝大部分都是万3以上,而且你个人去申请调至万1,基本不可能调到这么低)
2、30日日均资产1w的正常用户,免费给你续一年我的知识星球
============================= 经过贝塞尔三阶拟合算法的加持,目前量化算法的进入了新的阶段,我对目前的实战战况非常满意,后续我也会继续优化。 下面这2个表,反映的是连板股和昨天涨停今日的表现情况,这种复盘数据,对于复盘数据,对于测量市场温度,是非常必要的,也是很多一流超短选手每天复盘的必修课。我通过我的数据特长,把这些整理出来,让大家更加直观的看到,了解市场情绪的变化情况。下面2个图,是最新的数据:
对于主流板块的分析,我主要是采用2条路线,一种是通过涨停分类,另外一种是通过睿神的主流板块判断方式,通过2条不同的路线,来综合判断。
一)涨停分类法
二)睿神判断主流板块方法
睿神是谁?我不想多说,有兴趣的朋友自行百度。根据的睿神的线上发言整理的文字,我们提炼下,他判断主流板块的量化指标,我觉得非常有参考价值。我们不是要抄别人的代码,而是要学习大神们的一些经过实战考验的思路和策略。并通过自己的数据量化验证,逐步形成自己的操盘体系
1,看3%以上的板块指数个股,看8家以上涨停的板块,在以上板块里面选择强势股,第一时间介入或者次日。板块指数持续性趋势新高,这个是加分项。2,看赚钱效应多统计近期热点,看下是小盘低价还是大盘价值,赚钱效应在哪里就去哪里。 关于判断板块热点,睿神提出的一个很好的量化指标,看3%以上的板块指数个股,看8家以上涨停的板块,在以上板块里面选择强势股。我利用我的大数据挖掘专长,用今天最新的数据进行挖掘,得出了以下结论,我要说明的是这个数据是今天最新的数据,我会公开验证一周时间,后续不会持续公开。
数据解读:无。
以后,我把这个作为一个固定栏目,放在我的每天的文章里。
关注初云大数据后,添加我的个人微信:cybigdata便可获得最新一期的实战表格!
无
今天非常开心,我破例把经过拔毛算法加持过的五张表格,截图给大家看一下,有需要的可以联系我
板块类3张(分别是封神榜、必经之路、全量)
首先是封神榜表格
全量概念板块RPS表格 一共6万多条数据,我只能截图一部分
首先是第二阶段表格
首先我介绍一下我这个策略的特点:
1)全部量化完成,完全克服人类的贪婪和恐惧。
2)永远满仓,不择时。全部调测都是头天在网络上更新,第二天都按集合竞价 的价格进行调仓,盘中不做任何调仓行为。
3)最重要的就是真实,调仓计划都提前公布,计算过程绝对客观,网友也可以全程监督,最简单的方法,网友可以把我提前公布的10个股,放在通信达的一个自建板块里,收盘看看是否我统计的有误差。
4)这个策略,完全不需要经验,也不需要天赋,普通人只需要花3-5分钟按得分高低选股就行。简单、易操作,可重复。