应用bibliometrix包进行文献计量学（一）

文摘 2024-10-14 00:11 北京

A brief introduction to bibliometrix（一）

包网址：https://www.bibliometrix.org

教程网址：https://www.bibliometrix.org/vignettes/Introduction_to_bibliometrix.html

介绍

biblometrix包提供了一套用于文献计量学和科学计量学定量研究的工具。

文献计量学将科学的主要工具——定量分析——转向自身。本质上，文献计量学是定量分析和统计对期刊文章及其附带引用数量等出版物的应用。对出版物和引用数据的定量评估现在几乎用于所有科学领域，以评估科学社区的成长、成熟度、主要作者、概念和知识图谱、趋势。

文献计量学也被用于研究绩效评估，特别是在大学和政府实验室，也被决策者、研究主任和行政人员、信息专家和图书馆员以及学者自己使用。

Biblometrix包在三个关键的分析阶段为学者提供支持：

数据导入和转换为R格式；
出版数据集的文献计量分析；
为共引、耦合、协作和共词分析构建矩阵。矩阵是执行网络分析、多重对应分析和任何其他数据缩减技术的输入数据。

文献数据库

Biblometrix使用从四个主要文献数据库中提取的数据：SCOPUS、Clarivate Analytics Web of Science、Cochrane系统评论数据库（CDSR）和RISmed PubMed/MedLine。

SCOPUS（https://www.scopus.com）成立于2004年，为文献计量用户提供了很大的灵活性。它允许查询不同的字段，如标题、摘要、关键字、参考文献等。SCOPUS允许相对容易地下载数据查询，尽管对超过2000个项目的非常大的结果集有一些限制。
Clarivate Analytics（https://www.webofknowledge.com）由Clarivate Analytics拥有，由文献计量学的先驱之一Eugene Garfield创立。该平台包括许多不同的集合。

Cochrane系统评价数据库（https://www.cochranelibrary.com/cdsr/about-cdsr）是医疗保健系统评价的主要资源。
CDSR包括Cochrane评价（系统评价）和Cochrane评价协议以及社论。CDSR也有偶尔的补充。CDSR定期更新，因为Cochrane评价“准备好”出版，并形成月刊；见出版时间表。

PubMed对MEDLINE、生命科学期刊和在线书籍的生物医学文献的引用超过2800万次。引用可能包括来自PubMed Central和出版商网站的全文内容链接。

数据采集

文献数据可以通过按主题、作者、期刊、时间跨度等不同领域查询SCOPUS或Clarivate Analytics Web of Science（WoS）数据库来获得。在此示例中，我们展示了如何下载数据，查询手稿标题字段中的术语。我们选择通用术语“文献计量学”-“bibliometrics”。

从Clarivate Analytics WoS查询

在链接https://www.webofknowledge.com，选择Web of Science Core Collection数据库。在搜索字段中写下关键字“bibleometrics”，然后从下拉菜单中选择标题（参见图1）。

选择SCI-EXPANDED和SSCI引文索引。

该搜索于2016年5月9日产生了291个结果。

可以使用页面左侧的选项（手稿类型、来源、主题类别等）来改进结果。完善查询后，您可以通过单击页面末尾的“添加到标记列表”按钮并选择要保存的记录来将记录添加到标记列表中（参见图2）。

标记列表页面为您提供了所选出版物的列表以及导出数据的各种方式。

要导出所需的数据，请选择导出工具并遵循三个直观的步骤（参见图3）。

导出工具允许您选择要保存的各种字段。因此，请选择您感兴趣的字段（例如，有关标记记录的所有可用数据）。

要以适合bibleometrix包的格式下载导出文件，请确保选择选项“保存为其他文件格式”并选择Bibtex或纯文本。

WoS平台一次只允许导出500条记录。

Clarivate Analytics Web of Science导出工具创建一个默认名称为“savedrecs”的导出文件，扩展名为“. txt”或“.bib”，分别用于纯文本或BibTeX格式。导出文件可以单独存储。

从SCOPUS查询导出数据

进入SCOPUS是通过https://www.scopus.com。要查找标题包含术语“bibleometrics”的所有文章，只需在字段中写下此关键字并选择“文章标题”（参见图4）

该搜索于2016年5月9日产生了414个结果。

您可以通过选中“全选”框并单击链接“导出”来下载参考资料（最多2,000条完整记录）。选择文件类型“BibTeX导出”和“所有可用信息”（参见图5）

bibliometrix installation-安装

下载并安装最新版本的R（https://cran.r-project.org）

下载并安装最新版本的RStudio（https://rstudio.com）

install.packages(“bibliometrix”, dependencies=TRUE)

library(bibliometrix)

数据加载和转换

可以使用函数vert2df读取和转换导出文件：

convert2df(file, dbsource, format)

参数file是一个字符向量，包含从SCOPUS、Clarivate Analytics WOS、Digital Science Dimensions、PubMed或Cochrane CDSR网站下载的导出文件的名称。

es. file<-c（"file1.txt"，"file2.txt"，…）

file <- "https://www.bibliometrix.org/datasets/savedrecs.bib"

M <- convert2df(file = file, 
                dbsource = "isi", 
                format = "bibtex")

Convert2df创建一个文献数据框架，其中包含与原始导出文件中的手稿和字段标签变量相对应的案例。

Convert2df接受两个附加参数：dbsource和format。

参数dbsource指示从哪个数据库下载了集合。它可以是：

“isi”或“wos”（用于Clarivate Analytics Web of Science数据库），
“scopus” (for SCOPUS database),
“dimensions” (for DS Dimensions database)
“pubmed”（用于Pubmed/Medline数据库），
“cochrane”（用于Cochrane图书馆系统评论数据库）。

参数格式表示导入集合的文件格式。对于WOS集合，它可以是“plaintext” or “bibtex” ，对于SCOPUS集合，它必须是“bibtext”。如果集合来自Pubmed或Cochrane，则忽略参数。

每篇稿件都包含若干要素，如作者姓名、标题、关键词等信息，所有这些要素构成了一篇文献的书目属性，也称为元数据- metadata。

数据框列使用标准Clarivate Analytics WoS Field Tag编码命名。

主要的字段标签是：

有关字段标记的完整列表，请参见https://www.bibliometrix.org/documents/Field_Tags_bibliometrix.pdf

to be continued

广告-新课推荐

高分文章新方法-基于R语言的动态预测模型课程第三期

开课目的及前言

预测模型类文章目前总结起来发展经历了以下三个阶段：

基于传统流行病学的列线图模型（本质都是cox回归及glm回归），简单的统计学分析模型，是模型依赖的方法，临床上实际情况很难满足其前提假设，实际效果不好。
基于机器学习/深度学习的预测模型的构建（在数据上提高了维度，在算法上引入了机器学习），虽然算法上引入了机器学习模型，处理数据更加灵活，模型的假设也更少。但是在使用的数据上还是患者的一次基线数据进行预测，与临床实际不符。
基于纵向数据的动态预测模型（基于纵向多次随访数据，模型应用联合模型等动态预测模型方法），应用患者的多次随访数据对最终的生存结果进行预测，从数据和方法上都更类似于临床实际。

考虑到动态预测模型有以下特点，因此必然是后续高分文章的必备方法：

数据上必须有同一个患者的多次随访数据，相对于既往横断面一次基线数据，数据的收集难度更大，而且动态预测模型需拟合纵向的线性混合模型，因此需要的数据量较大。这就提示我们如果能收集到如上数据更加容易发高分文章。
应用方法学动态预测模型需首先掌握普通生存分析及普通预测模型的方法，并且还需要熟悉纵向数据分析的广义线性混合模型，再次基础上还需要掌握tidyverse语法基础来将自己的数据转换为满足函数要求的纵向数据，另外对于联合模型，模型的结合形式及变量选择也均需要从临床背景及统计学方法考虑。

授课老师

1 灵活胖子

双一流学校肿瘤学博士毕业，目前就职于国内五大肿瘤中心之一。科研方向为真实世界研究，生物信息学分析及人工智能研究。目前以第一或共同第一作者身份发表SCI论文10余篇，累计IF50+。目前与国内多个院校及医院有科研合作。联合翻译小组同学，在国内第一次将jmbayes2及dynamicLM全文翻译为中文并在公众号发表。

2 Rio

医学博士，临床医生。发表中英文文章 10 余篇。R 与 python 爱好者。

课程目录及安排

第一部分：R语言基础部分

第二部分：传统临床基础统计图表制作

第三部分：常规生存分析部分

第四部分：高级生存分析部分

第五部分：动态预测模型部分

授课形式及时间

授课形式：远程在线实时直播授课。

授课时间：2024年12月开课，总课时不少于30小时，每周利用休息时间进行4-6小时的授课，预计4-6周完成所有授课内容。

答疑支持：建立课程专属微信群，1年内课程内容免费答疑。

视频回看：3年内免费无限次回看。

课程售价及售后保证

课程售价：总价3000元，报名可先交300元预定，开课后2周内交齐即可

对公转账等手续务必提前联系助教

承办公司：天企助力（天津）生产力促进有限公司

奖励政策：学员应用所学内容发表IF 10+文章可退还学费（具体要求及流程需要咨询助教）

报名咨询

可联系我的助教进行咨询

助教联系电话：18502623993

灵活胖子的科研进步之路

医学博士，R语言及Python爱好者，科研方向为真实世界研究，生信分析与人工智能研究。

最新文章

数据可视化

数据处理

Cursor的python语言配置-基于anaconda

整洁数据在R语言中的要求

Cursor的R语言配置-本地实操截屏步骤版

tidyplots学习超详细注释版-基于Cursor-(4)

12月15日开课-动态预测模型

Cell主刊文章超详细解读及代码注释-基于Cursor

第40期分享会-1区动态预测模型文章解析

tidyplots学习超详细注释版-基于Cursor-(3)

tidyplots学习超详细注释版-基于Cursor-(2)

tidyplots学习超详细注释版-基于Cursor-(1)

课程更新-应用Cursor进行代码编写演示

Cursor 的基本用法-R语言实战版

第39期分享会-算力平台介绍及AI辅助编程体会

外网第一AI辅助IDE-Cursor配置R语言环境(实操总结)

lcmm(2)-如何使用hlme函数估计潜在类别混合模型-2

lcmm(2)-如何使用hlme函数估计潜在类别混合模型-1

pycaret学习笔记（6）-quickstart-时间序列

第38期分享会-动态预测模型文章分享-联合法模型

肌少症文献计量学分析

应用潜类别分析扩展混合模型体系-lcmm（1）：introduction&get started

pycaret学习笔记（5）-quickstart-异常值检测

50分肿瘤学年鉴文献分享-乳腺癌的动态预测:利用TEAM试验在临床实践中证明动态预测模型的可行性

动态预测模型文献分享-血小板计数作为感染患者住院死亡率的动态预测标记

第37期公开课-临床结构化数据整理及科研选题

目标仿真试验的基本原理、设计要素及其优缺点

动态模型文献分享-通过纵向D-二聚体分析动态评估癌症患者静脉血栓栓塞风险：一项前瞻性研究

冰冷的临床数据背后，是一个个活生生的个体

西柚仓库集合

第36期公开课-肿瘤学年鉴（IF 50）文献动态预测模型方法学分享

pycaret学习笔记（3）-quickstart-回归任务

pycaret学习笔记（2）-quickstart-分类任务

给pandas带来tidyverse的力量！-tidyversetopandas教程(3)

给pandas带来tidyverse的力量！-tidyversetopandas教程(2)

pycaret学习笔记（1）-整体介绍及安装

胖子老师独自授课-基于R语言的动态预测模型课程

给pandas带来tidyverse的力量！-tidyversetopandas教程(1)

应用bibliometrix包进行文献计量学（四）

conda使用教程

IF=30.8：COX+竞争风险+XGBOOST+神经网络=预测英国普通女性10年癌症死亡率风险

第35期公开课-基于Python机器学习文献解读及实操演示

应用bibliometrix包进行文献计量学（三）

应用bibliometrix包进行文献计量学（二）

应用bibliometrix包进行文献计量学（一）

文献计量学的一体化解决方案-bibliometrix包（slides-1）

第34 期分享会-也来谈谈贝叶斯

bulk+单细胞+热点文章套路分享学习-bulk和scRNA揭示肝细胞癌中的细胞异质性和免疫浸润(一)

DEPTH2-基于表达谱的肿瘤异质性分析

IOBR2：转录组数据预处理

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉