【更新公告】年末大更新，多种实用发文算法上线

文摘 2025-01-23 20:02 江西

点击蓝字 关注我们

每月优化升级来咯，这次更新中优化了一些算法以及功能。让我们来看看都更新了什么内容吧！

机器学习自动寻参

网格寻参:寻参模型简单，数据集维度少，样本量较少时。

随机寻参:寻参模型较复杂，数据集维度较多，样本量较大时。

贝叶斯寻参:寻参模型复杂，数据集维度之间关联性高，样本量较大时。

连续二分网格寻参:提高搜索效率的网格寻参，需要对常规网格寻参参数进行优化时。

连续二分随机寻参:提高搜索效率的随机寻参，需要对常规随机寻参参数进行优化时。

遗传寻参:数据集经过常规寻参可能拥有多个最优参数解，寻参模型复杂，数据集维度多，样本量较大时。

分布式异步组态寻参:能够适应极度复杂的数据集，模型，且不确定性因素较多时。并且使用分布式异步组态寻参方法还可生成自动寻参最优损失曲线。损失曲线的对比能够帮助用户了解不同寻参策略在模型优化过程中的表现和差异，为选择合适的寻参策略提供依据。

样本均衡增加：混合采样、模型均衡法

过采样：过采样技术通过增加少数类样本的数量，使样本分布更加均衡，提高模型对少数类的识别能力。例如，在医学诊断中，通过过采样可以提高对罕见疾病的诊断准确率。SMOTE（合成少数过采样技术）是常用的过采样算法，通过在少数类样本的特征空间中生成新的合成样本，增加样本多样性，避免简单复制样本导致的过拟合问题。

欠采样：欠采样技术通过减少多数类样本的数量，使样本分布更加均衡，降低模型的计算复杂度。例如，在金融欺诈检测中，通过欠采样可以减少正常交易样本的数量，提高模型对欺诈交易的识别速度。随机欠采样是最基本的方法，但可能导致信息丢失。改进的欠采样算法如聚类欠采样，通过聚类算法保留多数类样本中的代表性样本，减少信息损失。

混合采样：混合采样结合了过采样和欠采样的优点，先通过过采样增加少数类样本，再通过欠采样减少多数类样本，使样本分布更加合理。例如，在不平衡数据集的分类任务中，混合采样可以有效提高模型的综合性能。通过调整过采样和欠采样的比例，可以根据具体数据分布和模型需求，灵活优化样本均衡程度，达到最佳的分类效果。

模型均衡法：一些集成学习算法内置了样本均衡功能，如EasyEnsemble，BalanceCascade等，可以直接在模型训练过程中进行样本均衡处理，简化了数据预处理的步骤。例如，使用集成学习方法设置内置均衡器参数，自动调整样本分布。内置均衡器通常结合了多种采样策略和算法优化，能够适应不同类型的不平衡数据集，提高模型的泛化能力和预测准确性。

COX回归支持生成DCA曲线

COX回归增加DCA曲线结果。

DCA是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如：敏感性，特异性和ROC曲线下面积仅测量预测模型的诊断准确性，未能考虑特定模型的临床效用，而 DCA的优势在于它将患者或决策者的偏好整合到分析中。

RCS样条优化

RCS样条会生成4副图，方便我们判断暴露因素与结局因素的非线性趋势的定性分析。

以下将讲解判断具体规则：

1.主线条形态判断：首先观察fig.proball.pdf，判断主线条是直线还是呈现非线性趋势。如果为直线，则无需进一步分析。

2. U型或J型趋势的判断：若主线条呈现U型或J型，则查看fig.ushapall.PDF图，识别最低切点，进一步进行二分类分析，探索不同区间内变量的影响。

3.倒U型趋势的判断：若主线条呈现倒U型，则查看fig.nshapall.PDF，找到最高点，识别关键的切点，进行二分类分析。

4. L型或平稳趋势的判断：若主线条接近L型或平稳，则查看fig.lshapall.PDF，这时通常可以通过提取关键点来进一步定量分析。

描述性统计添加分类变量

方便大家区分变量类型，描述性统计增加分类变量选项。

岭回归

岭回归通过在回归模型的目标函数中加入正则化项，对回归系数进行收缩惩罚，从而缓解共线性问题，提高模型的稳定性和预测能力。例如，在岭回归中，通过调整正则化参数alpha，可以控制回归系数的收缩程度，找到模型复杂度和预测误差之间的平衡点。

岭回归的正则化项通常采用L2范数，即回归系数的平方和，使得回归系数向零收缩，但不会完全变为零，保留了所有自变量的信息。

报错反馈优化

近期我们针对平台报错信息进行了优化，原先需要点击反馈过后才能看到报错详情修改为可以直接展示。并且点击头像中的我的反馈即可查看反馈问题的解决方案。

结语

临床研究的根本使命是发现并解决生命科学领域亟待解决的临床问题，同时，为即将发生的临床难题提供备选解决方案。

打开极智分析—智能医学统计分析平台 https://www.xsmartanalysis.com/ 进行实操吧！

扫二维码

关注我们

公众号｜极智分析

B站｜极智分析

极智分析

为临床、科研人员提供一站式临床研究在线分析建模平台；提供医学统计咨询服务；提供临床数据分析服务；提供医疗大数据建模服务；分享研究进展、临床研究设计方案、询证医学案例。

【放假通知】蛇年快乐，吉祥圆满！

【更新公告】年末大更新，多种实用发文算法上线

一项回顾性单中心研究（IF=6）：机器学习+模型解释+在线预测模型=坏疽性胆囊炎可解释的预测机器学习模型

Nature子刊：机器学习+多模态数据+mRMR特征筛选=pLGG全面的放射基因组学分析

不用实验室数据，LANCET子刊教你使用生命体征和症状数据更早的检测出脓毒症

发文没思路？ GBD数据库+流行病学分析=深度剖析全球胃食管反流病负担

最强发文工具-极智分析荣获江西省数据大赛二等奖

极智分析团队联手南昌大学第二附属医院获省金奖

【今晚18点开播】2025年最新发文思路讲解，GBD数据库给你答案

多元回归模型如何预测疾病进展？一文便知！

【直播倒计时1天】2025年最新发文思路讲解，GBD数据库给你答案

【直播倒计时2天】2025年最新发文思路讲解，GBD数据库给你答案

《Cardiovascular Diabetology》IF=8.5，预测老年心力衰竭合并高血压患者死亡率？机器学习模型给出结果

【直播倒计时3天】2025年最新发文思路讲解，GBD数据库给你答案

【直播预告】2025年最新发文思路讲解，GBD数据库给你答案

突破临床瓶颈冲刺顶刊文章，公共数据库＋分层分析＋解释模型=SLE患者的亚群(IF10.4)

解锁临床预后诊断新高度，机器学习助力突破9+

《CARDIOVASC DIABETOL》（IF=8.5），探索甘油三酯-葡萄糖指数对首次中风危重患者的预后影响

《CARDIOVASC DIABETOL》（IF=8.5），非糖尿病人群TyG水平与生活方式评分对缺血性卒中风险的影响

RFE特征筛选+SHAP模型解释+在线预测模型=sICH患者的短期预后结局（IF=6.1）

《CARDIOVASC DIABETOL》（IF=8.5），TyG 指数与外科重症监护患者预后的相关性

《eClinicalMedicine》IF=9.6，如何预测肺CT自动分割和急性呼吸窘迫综合征？深度学习给出答案。

LANCET子刊：Lasso回归+机器学习+生存分析=肝硬化患者经颈静脉肝内门体分流术后的生存率（IF=9.6）

【直播今日开讲】没有数据又想发高分期刊可以学习起来了，挖掘Nhanes数据解锁更多发文新思路

eClinicalMedicine (IF=9.6)：模型可视化-15年数据构建预测模型评估女性CSEP术中出血的风险

【直播倒计时1天】没有数据又想发高分期刊可以学习起来了，挖掘Nhanes数据解锁更多发文新思路

预测模型特征太多？LANCET子刊教你从249个特征中筛出11个

【直播倒计时2天】没有数据又想发高分期刊可以学习起来了，挖掘Nhanes数据解锁更多发文新思路

Nature子刊：蛋白组+代谢组=构建心肌病调控功能网络并提供在线应用程序

【直播倒计时3天】旧指标也能变废为宝，MR联合Nhanes解锁发文新思路

【直播预告】旧指标也能变废为宝，MR联合Nhanes解锁发文新思路

Nature子刊：基于蛋白质的机器学习预后模型用于对儿童乳头状甲状腺癌患者进行分层

CARDIOVASCULAR IMAGING(IF=12.8)：基线分析+模型解释性+生成分析=NICM右心室功能障碍的预后意义

《Eur J Heart Fail》IF=16.9，如何识别高危糖尿病心肌病表型？新开发和验证的机器学习的方法帮助解决！

归因分析与GBD数据库如何完美交织？这一篇就够了！

Joinpoint回归也能结合GBD数据库？瞧瞧高手们的做法

《eClinicalMedicine》IF=9.6，饮酒者饮酒与痴呆发病率之间有何关系？孟德尔随机化给出答案！

《CARDIOVASC DIABETOL》（IF=8.5），TyG与心血管疾病风险中内脏肥胖之间的相互作用

European Respiratory Review（IF=9.0），如何预测儿童哮喘的恶化？机器学习模型给出解决方法。

Critical Care（IF=8.8）危重患者新发心房颤动可以预测？机器学习模型给出解决。

零实验照样高分，公共数据库+机器学习+预后模型助力发文

LANCET(IF=90+):机器学习+SHAP+风险分层=非ST段抬高急性冠状动脉综合征患者GRACE评分的性别特异性评估

《Molecular Therapy-Nucleic Acids》(IF=8.8): 组学分析+机器学习 =子宫内膜癌分型系统

《CARDIOVASC DIABETOL》（IF=8.5），糖尿病前期和肝脂肪变性对年轻人心脏代谢结局的综合影响

《CARDIOVASC DIABETOL》（IF=8.5），估计葡萄糖处理率和心血管疾病发病率的变化

LANCET子刊(IF = 9.6)：深度学习使用磁共振血管造影数据构建烟雾病自动诊断模型

【今晚18点开播】零基础入门孟德尔随机化及GWAS Catalog公共数据库（IF=5.8）

Advanced Science（IF=14.3）：LASSO+模型融合+生存分析=多模态标志物高尿酸血症的早期检测和预后预测

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉