一图展春秋,一览无余
一图胜万言,一目了然
VOSviewer以色彩斑斓的网络图谱
直观地呈现信息单元之间的特定关系
可对多种数据可视化分析
也可描绘信息间的潜在关联
还可预测信息的动态变化
如何使用VOSviewer
呈现知识网络图谱?
何菊香老师娓娓道来,答疑解惑!
一、知识准备
1. 科学知识图谱概念与认识
科学知识图谱是显示科学知识发展进程与结构关系的一种图形。以科学知识为计量研究对象,属于科学计量学范畴;以数学模型表达科学知识单元及其关系,以可视化形式绘制成二维或三维图形。
2. 科学知识图谱理论基础
(1)引文分析是利用各种数学、统计学及逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用进行分析,揭示其数量特征和内在规律。
(2)共词分析通过对一组词两两统计它们在同一篇文献中出现的次数,以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所代表的学科和主题的结构变化,发现学科的研究热点,横向和纵向分析学科领域的动态发展和静态结构。
(3)社会网络分析将社会结构界定为一个网络,这个网络由成员之间的联系进行连接。社会网络分析更多地聚焦于成员之间的联系而非个体的特征,并把共同体视为“个人的共同体”,就是视为人们在日常生活中所建立、维护并应用的个人关系的网络。
3. 科学知识图谱主要研究对象
4.科学知识图谱关键技术
(1)降维技术包括因子分析、聚类分析、多维尺度分析、力矢量布局算法、寻径网络技术、最小生成树算法、三角测量以及自组织映射神经技术等。
(2)交互技术包括鱼眼视图、透视墙视图以及双曲视图等。
5.构建科学知识图谱的一般步骤
6.常用科学知识图谱绘制软件
常用科学知识图谱绘制软件包括SPSS、Pajek、Bibexcel、VOSviewer、Gephi、Citespace等,各软件简介见下图。
二、 VOSviewer概述
1. VOSviewer概念与功能介绍
VOSviewer是荷兰莱顿大学科技研究中心(The Centre for Science and Technology Studies, CWTS)的Van Eck和Waltman于2009年开发的一款基于JAVA的免费软件,主要面向文献数据,适应于一模无向网络的分析,侧重科学知识的可视化。
VOSviewer 是一个用于构建和可视化文献计量网络的软件工具。这些网络可能包括期刊、研究人员或单独的出版物,它们可以基于引用、文献耦合、共同引用或共同作者关系来构建。VOSviewer 还提供文本挖掘功能,可用于构建和可视化从大量科学文献中提取的重要术语共现网络。
2. VOSviewer的下载与安装
(1)打开VOSviewer官方网址,点击左下角的VOSviewer下载按钮。
网址:https://www.vosviewer.com/
(2)直接点击Download,会出现不同操作系统对应的版本,直接下载安装即可。
(3)通过网页下载VOSviewer.jnlp文件并启动。
(4)下载完成后,先解压,然后双击运行VOSviewer。
(5)首次使用VOSviewer,会提示需要安装运行Java环境,如已安装Java可忽略,若未安装则跟着提示下载即可。默认转到Java官网,点击下载。
三、 VOSviewer软件使用
1. VOSviewer主窗口
VOSviewer的主窗口由以下5个部分组成(见下图):
(1)主界面:主界面显示当前活动图谱,具有缩放和滚动功能,可用于详细浏览图谱。
(2)选项界面:选项界面调整可视化图谱属性(形状、颜色等)。
(3)信息界面:信息界面描述当前图谱中知识单元(聚类数量等)。
(4)概览界面:显示当前活动图谱的整体概览。
(5)操作界面:矩形框表示主面板中显示的图谱区域。操作界面可用于执行不同类型的操作,例如创建新图谱、制作屏幕截图、更新布局或聚类等。
2. VOSviewer数据库选择及数据下载
(1)VOSviewer常见的文献获取数据库有:Web of Science、Scopus、CNKl、Pubmed等。推荐使用Web of science数据库,因为引文数据比较全面,可分析的东西较多。
(2)根据构建科学知识图谱的目的和用途,制定检索策略,构建检索式。根据检索结果,优化调整检索式直至得到合适的分析样本数据(一般建议数据在几千条,如果上万条,有可能机器带不动,无法分析)。
(3)直接通过网页使用,下载VOSviewer检索完成之后,选择导出数据:纯文本文件;以此类推下载,直至最后一个。建立一个文件夹,把所有下载数据放进去,等待后面的分析即可。
3. VOSviewer数据导入及分析
(1)打开VOSviewer软件,基于已下载数据创建一张图。
(2)点击next,选择来源数据库。
(3)点击浏览,选择全部数据。
(4)点击next进行读取数据,数据读取完后选择图谱类型。这里选择第一个作者分析。
(5)选择“Thesaurus file”进行初步数据清理,即采用VOSviewer官方设置来合并同义词、删除指定词语。
(6)点击Next,这里进行选择阀值,一般可以不动。
(7)显示满足设定阈值的作者情况(此处为发文数>=5)。
(8)点击Finish,得到一张简单的作者合作情况分析图。
4. VOSviewer面板功能介绍
Create
(1)构建图谱。
(2)选择数据来源。
(3)选择合作情况及选择统计方法。
(4)选择阈值。
(5)选择分析和计算方法的类型。
Save
保存节点和边的数据以及图谱数据。
Screenshot
直接点击截图后面的下拉箭头,选择save;提供多种类型的图片。如果只是暂时性的使用,可以点击直接粘贴到剪切板;更多选项中,可以选择放大缩小多少倍,是否包括边界,是否需要透明背景。
Items
节点越大,代表出现次数越多,或者文章越多;连线代表两个节点之间关系的强弱,越强则线越粗;不同的颜色代表不同的术语,软件将领域或者研究相近的关键词进行了归类,点开Item就能发现每一个Cluster的具体的关键词。
Analysis
Method指呈现的数学方法,推荐第4种算法。Layout调节图形外观参数,一般采用默认2和1,也可以采用其他建议参数2和0,1和0,调整完后点击update。Clustering中设置聚类的类目数量以及类目下面包含的terms数量。Rotate/flip图形旋转情况,一般不动。
Visualization
VOSviewer软件通过其独特的三种可视化图谱——网络可视化、叠加可视化和密度可视化,为用户提供了深入分析和理解复杂数据集的强大工具。
(1)网络可视化也叫聚类视图:圆圈和标签组成一个元素,元素的大小取决于节点的度、连线的强度、被引量等,元素的颜色代表其所属的聚类,不同的聚类用不同的颜色表示,通过该视图可以查看每个单独的聚类,例如通过主题共现发现研究热点的结构分布、通过作者合作发现研究小团体、通过作者耦合网络发现学者对研究主题的异同情况等。
(2)关键词叠加可视化分析指将时间因素叠加到关键词共现网络中。如下:不同的颜色对应着关键词出现的年份,颜色越蓝表示关键词出现的时间越早,越黄说明关键词出现的时间越晚。节点颜色是由每个关键所处年份的平均时间确定的。
(3)密度视图即热力图。在密度可视化中,以与网络可视化和叠加可视化类似的方式,通过其标签来表示。密度可视化中的每个点都有一个颜色,指示该节点的密度。默认情况下,颜色范围从蓝色到绿色再到黄色。一个点附近的节点数量越多,相邻节点的权重越高,该点的颜色越接近黄色。反之,一个点附近的节点数量越少,相邻节点的权重越低,该点的颜色越接近蓝色。颜色可以自行修改。
5. VOSviewer使用注意事项
数据清理
(1)确保下载数据中包含以下四项完整信息:author、title、keywords、abstract(特别是keywords完整)。
(2)检查abstract和keyword项是否有乱码。若出现乱码,可再次找到原始数据,再次下载或手工输入摘要和关键词。有些文献格式,本来就没有关键词,可以尝试根据摘要或者文章添加keywords,可通过手工方式或软件补充。
(3)确保同一作者的名字表示是一样的。如果作者没有统一,可能会导致作者网络的分析结果严重偏差。
(4)Thesaurus_terms.txt里含有两列。
(5)文档的第一行是标题行(label/replaced by)。
(6)从第二行开始,两列的内容用tab键分隔。
(7)当A出现在label列,与此同时B出现在replaced by列,代表的含义是:B可以替换A。如果B是空白,没有内容,意味着A可以被忽略。
(8)使用excel文件打开txt文档,编辑完之后保存为“unicode 文本”格式。
参数设置
(1)选择阈限值——“1”即出现1次就被纳入,则所有作者均可入选。这个操作可看到所有作者的情况。
(2)确认选择的关键词(可剔除一些跟研究不相关的)。
总结
VOSviewer
在这场精彩纷呈的讲座中,何老师以其精湛的讲解技巧和深入浅出的方式,为我们揭开了VOSviewer软件的神秘面纱。通过近一小时的分享,同学们不仅对VOSviewer的功能和操作有了深刻的认识,更学会了如何运用这一工具绘制知识网络图谱,从而推动学术研究的深入发展。愿每位同学都能在学术的海洋中乘风破浪,以VOSviewer等工具为帆,开拓出属于自己的独特研究成果!
文案|张海霞 钟嘉媛
排版|楼可心
责编|方欣然 何朴静
东南大学研究生会 学术交流中心
东南大学研究生会 宣传与新媒体中心