介绍
教程地址:https://tidyversetopandas.readthedocs.io/en/latest/
测试环境:西柚云服务器 juputerlab
tidyversetopandas是一个Python包,专为熟悉R的tidyverse并正在过渡到Python的用户而设计。它通过为流行的tidyverse函数提供pandas等价物来弥合R和Python之间的语法差距。这个包对那些试图利用pandas强大的功能和熟悉的tidyverse语法的数据科学家和分析师特别有益。
融入Python生态系统
虽然pandas是Python中数据操作的强大工具,但对于那些习惯于R的tidyverse语法的人来说,它可能具有挑战性。tidyversetopandas在融合这两个世界的方法上是独一无二的。在Python生态系统中,tidyversetopandas与旨在将类似tidyverse的功能整合到Python数据操作环境中的包一起使用,主要是pandas。目标是让那些习惯于tidyverse语法的人更容易使用pandas。该领域的两个著名包是tidypandas和siuba。与tidyversetopandas类似,它们都代表了弥合R的tidyverse方法和Python的pandas库之间差距的努力,为熟悉R数据操作工具的用户提供了一个更舒适的过渡到Python数据科学生态系统的过渡。
tidypandas官网:https://tidypyverse.github.io/tidypandas/_build/html/index.html
官网:siubahttps://github.com/machow/siuba
主要功能:
Mutate():与tidyverse类似,此函数允许在DataFrame中创建新列或修改现有列。
•filter():启用逐行过滤,更容易根据指定条件筛选DataFrame。
select():有助于选择DataFrame中的特定列,简化数据操作和分析。
arrange()::提供基于一列或多列的数据帧排序功能。
安装
pip install tidyversetopandas
导入包
安装后将包导入Python环境:
from tidyversetopandas import tidyversetopandas as ttp
加载数据
首先将您的数据加载到pandas中。此包假定您有一个名为df的数据可供操作。
mutate
使用mutate创建新列或修改现有列。我们可以通过将我们想要的表达式编写为字符串来做到这一点。
df = ttp.mutate(df, "b=b*2")
Filter
Filter函数用于根据指定条件对数据帧进行子集。例如,选择“A”大于1且“B”小于6的行
df = ttp.filter(df, "A > 1 and B < 6")
Arrange
使用Arrange对数据框进行排序。您可以按多列排序并指定升序或降序。例如,按升序按“A”排序,然后按“C”排序
df = ttp.arrange(df, True, "A", "C")
Select
要仅保留某些列,请使用select函数。例如,仅保留“A”列
df = ttp.select(df, "A")
高分文章新方法-基于R语言的动态预测模型课程第三期
开课目的及前言
预测模型类文章目前总结起来发展经历了以下三个阶段:
基于传统流行病学的列线图模型(本质都是cox回归及glm回归),简单的统计学分析模型,是模型依赖的方法,临床上实际情况很难满足其前提假设,实际效果不好。
基于机器学习/深度学习的预测模型的构建(在数据上提高了维度,在算法上引入了机器学习),虽然算法上引入了机器学习模型,处理数据更加灵活,模型的假设也更少。但是在使用的数据上还是患者的一次基线数据进行预测,与临床实际不符。
基于纵向数据的动态预测模型(基于纵向多次随访数据,模型应用联合模型等动态预测模型方法),应用患者的多次随访数据对最终的生存结果进行预测,从数据和方法上都更类似于临床实际。
考虑到动态预测模型有以下特点,因此必然是后续高分文章的必备方法:
数据上必须有同一个患者的多次随访数据,相对于既往横断面一次基线数据,数据的收集难度更大,而且动态预测模型需拟合纵向的线性混合模型,因此需要的数据量较大。这就提示我们如果能收集到如上数据更加容易发高分文章。
应用方法学动态预测模型需首先掌握普通生存分析及普通预测模型的方法,并且还需要熟悉纵向数据分析的广义线性混合模型,再次基础上还需要掌握tidyverse语法基础来将自己的数据转换为满足函数要求的纵向数据,另外对于联合模型,模型的结合形式及变量选择也均需要从临床背景及统计学方法考虑。
授课老师
1 灵活胖子
双一流学校肿瘤学博士毕业,目前就职于国内五大肿瘤中心之一。科研方向为真实世界研究,生物信息学分析及人工智能研究。目前以第一或共同第一作者身份发表SCI论文10余篇,累计IF50+。目前与国内多个院校及医院有科研合作。联合翻译小组同学,在国内第一次将jmbayes2及dynamicLM全文翻译为中文并在公众号发表。
2 Rio
医学博士,临床医生。发表中英文文章 10 余篇。R 与 python 爱好者。