业
务
清
单
医学统计是指以医学的理论为指导,运用统计学的原理和方法研究医学领域中数据的搜集、整理、分析和推断的一门应用科学。
医学统计的基本任务在于从样本去推断总体,应用概率论的方法探讨样本与总体的关系揭示偶然现象中隐藏着的必然规律性从而对总体做出比较正确的结论。
本文介绍一下常见的医学统计分析方法以及一些衍生方法。欢迎各界人士共同探讨,欢迎有数据分析需求的同仁联系小号。
医学统计资料的类型
(1)计量资料:是指由一组同质的数值变量值所组成的资料。如一组身高(em)、体重(kg)、血压(kPa)、呼吸次数(次/分)数据等。
(2)计数资料:是按事物的属性特征分组,清点各组的观察单位数而得到的资料。如血型变量A型18例、B型19例、0型35例、AB型23例。
(3)等级资料:是按事物的等级或类别分组,清点各组观察单位数而得到的资料,也称半定量资料。这类资料变量值间不仅有类别的不同,且不同类别间也有顺序、等级或量的差别,但这种差别又无法精确量化。
1.数据空间可视化(地图绘制)
2.空间自相关、空间聚类分析及LISA散点图
3.空间回归(空间滞后+误差模型)
4.时空扫描及动态地图视频
5.时空面板数据的OLS、TWR、GWR、GTWR、MGTWR等模型
一、问卷分析(问卷星?等来源或现场调查数据)
二、临床流行病学数据分析
1.t检验、方差分析、x2检验、logistic回归重复测量方差分析与配对T检验、ROC曲线
2.非参数检验、生存分析、样本含量估计、筛检试验:灵敏度、特异度、约登指数等计算
3.绘制柱状图、散点图、小提琴图、列线图等
三、公共卫生等监测数据分析
1.三间分布描述 2.危险因素分析
3.时空特征 4.时间序列预测
一、有监督学习
1.单模型
朴素贝叶斯模型、线性模型、KNN模型、线性模型、logistic模型、lasso模型、决策树模型、神经网络模型、SVM模型
2.集成学习
Boosting:XGBoost模型、lightGBM模型、AdaBoost模型
CatBoost模型
Bagging:随机森林模型、Extra Trees模型
二、无监督学习:
聚类:K-means 算法、分层聚类
降维:PCA主成分分析、SVD奇异值分析、LDA线性判别
网络分析、时间序列分析、五运六气、潜在剖面分析、潜在类别分析
等等…
医学统计学的基本步骤有:
机器学习是人工智能的一个重要分支,近年来在数据分析、图像识别、自然语言处理等领域发挥的作用越来越重要。机器学习的基本概念围绕着如何让计算机利用数据来进行学习和预测。而R语言,作为一种统计分析和图形表示的强大工具,因其丰富的包和灵活的数据处理能力,在机器学习领域中占有一席之地。今天我们开始R语言机器学习的第一篇,数据准备与包的批量安装。
机器学习是一门研究如何使计算机系统从数据中学习和改进性能的学科。它通过训练模型来识别模式、预测趋势和做出决策从而实现对数据的自动处理和分析。
机器学习算法通过对大量数据进行学习,提取出有用的特征并建立模型来预测新数据。这些模型可以不断优化,以适应不同类型的数据和任务。常见的机器学习算法包括KNN、决策树、随机森林、贝叶斯等。
医学统计数据分析分享交流SPSS、R语言、Python、ArcGis、Geoda、GraphPad、数据分析图表制作等心得。承接数据分析,论文修回,医学统计,空间分析,问卷分析业务。若有投稿和数据分析代做需求,可以直接联系我,谢谢!
新
年
快
乐