这是 科研写作研究所 的第 3381 篇原创文章
在数字时代,当知识发展驶入新的和不熟悉的道路时,我们对已经发生转变的认识可能会有很长时间的滞后。学术科学和学术研究也面临着快速累积的转变,不再是沟通和存储信息、接触受众以及与外部力量和机构互动的“传统”模式。若是我们固执地以过去的眼光来看待知识变革的新时代,也会使我们的理解产生明显的“学术”偏见和盲点。在知道如何应对这些之前,我们需要对数字时代所发生的学术变化有一个全面且深刻的认识。在英国学者帕特里克·邓利维所著的《如何最大化你的学术影响力》一文中,便提出了数字时代的五种变化且及性了详细的说明,下面则呈现出来,以供读者阅读参考。
一、丰富的数据
“大数据”的出现对很多学科产生了巨大的影响。一些极端评论者甚至会觉得这意味着归纳推理的胜利和学术界所有理论的死亡。然而,尽管变化的速度比不上现在,但许多STEMM学科(如天文学、天气预报、高能物理学、电子学和基因分析)几十年来一直在处理大量不断变化的数据。社会科学的少数领域(如金融市场的数据建模)也是如此。对于这些领域的研究员来说,数字技术的变化只是扩大了现有的分析能力。存储容量增加了,内存几乎不受限,而且计算的速度也迅速提高了。设备和分析成本的下降符合“摩尔定律”——一个预测芯片的处理能力将每两年翻一番的经验法则。尽管这种转变的覆盖范围广泛,但它们并没有从根本上改革这些学科的信息基础或它们进行研究的方式。
但在社会科学以及人文学科的某些部分,以及比过去应用数字技术更为广泛的STEMM学科中,更多的变化已经发生。数字技术的变化意味着以下的变化。
(一)“行政数据”已可用于大规模分析。
这些数据是客户或公民在商业或公共机构中,通过数字的方式进行购物或交易、询问或填写表单时产生的信息,尤其通过“实时”方式产生的。这些数据大多被固定的数据字段高度结构化。但是,如果它可以链接到客户或公民ID(就像超市客户ID将编码产品的每一个购物篮链接到特定的客户会员卡),那么其他数据也可以索
引到它。在线商务和交易系统特别适合于以前只有在复杂的科学协议中才可行的那种探索和实验。商店的数据库实时显示顾客正在购买什么,需求预测改进了,灵活的采购便可以避免仓储短缺或过剩。这类数据库也是研究许多其他现象的潜在财富,例如与吸烟、饮酒或食用不健康食物有关的健康行为。聚合大数据可以不为人知地对最初看似五花八门或难以分析的行为进行编码和建构。
(二)留下大量“数字痕迹”
大量数字化文本(以及日益数字化的图像、语音或音频和视频)由各种形式的人类活动产生并被大量存储,留下“数字足迹”。这些痕迹现在是有关社会行为的主要信息来源,并且是非结构化的或自由文本。在自由文本分析中,基于计算机的搜索引擎可以很容易地搜索和统计使用特定词汇或短语的每一个实例,并且可以穷尽地查找组合。多个模式可以以一种清晰和量化的方式浮现出来,而以前只能凭借直觉注意到这些模式,并以定性的方式进行评估。文本数据库也会做出递归响应。因此,从STEMM学科中的医学或软件工程,到所有社会科学和“数字人文”领域里研究人类行为的学科,寻求新的模式并得到不同的答案往往是可行的。
(三)自动获取数据
通过应用程序编程接口下载大量信息的新技术可以自动获取数据。“机器学习”和人工智能方法如今已经发展到可以处理复杂数据和缺失数据的问题。通过对算法的不断重复和试验,“机器学习”和人工智能可以自主学习并快速地分析改进。
二、强大的搜索
数字化变革也改变了我们对“再搜索”的理解。搜索引擎使更多的知识比前数字时代更容易获得,为它们的创建者创造了巨大的价值。在学术界,这种影响在人文和社会科学领域特别明显,这些领域的知识数据库以前不如STEMM学科发达。数字化变革和在线资源在医学等领域的作用可能较小,这些领域的专有数据库(如PubMed)已经发展得很好,并以全面覆盖为目标。然而,在所有学科中,更好的搜索方式极大地增加了核心期刊以外的文章的引用。
在人文社会科学的某些领域,尤其是在历史学和政治学领域,文献搜索和呈现的某种综合性虽然受到重视,但搜索的界限常常是模糊的,纳入或排除研究的标准可能只是主观上得到了证明或隐晦的解释。在许多社会科学和人文学科中,进行系统综述的文章十分罕见,并且可能没有多少推动力来界定共同点或综合研究成果。使用旧式定性方法的学科尤其如此,它们要么在讨论何为有趣的研究问题上受到基本理论或“意识形态”争议的困扰,要么争论着什么是解决这些问题的根本方法。与之形成鲜明对比的是STEMM学科关于系统综述的观念,尤其是在医学领域。分析人员需要明确综述的目的,在某种程度上包含所有相关文献(没有遗漏或空白),之后对所涉研究进行完全透明的质量评估。研究根据其方法的可靠性进行分级,使用预先定义好的、标准的(即不是临时设定的或可变的)实施准则。用倒金字塔形的程序,首先筛选出大量最经不住检验的研究,然后筛选出缺漏较少的研究。在金字塔底部,集中关注在方法上最复杂也最可靠的研究。即便到这里,综述者也会努力发现并考虑到任何存在的遗留问题或研究结果的人为风险。最后,医学系统综述会查找所有最权威的研究,在研究数据允许的情况下,用精确的统计方式汇聚所有的定量研究结果(如效果估计)。
但是现如今随着数字方法的出现,不同学科间长期形成的差异已被削弱。传统的文献综述十年前可能需要六个月完成,现在却可以在六周内完成,而且能以更好的水平完成,尤其在使用GS和大学研究电子文献库等开放式访问资源时。数字变革往往使新的可能性成为通用标准,进而成为强制性标准。因此,博士生导师和评审,以及期刊和图书的审稿人,都提高了该领域能够算作综述的标准。系统综述的实践也从医学扩展到了健康研究领域和同源的STEMM学科,现在又越来越多地扩展到社会科学。更广泛的综述方法和途径使用已经适应于尝试、模拟或匹配这些领域中可获取的不同材料和证据水平。
在数字人文学科中,被认为可接受的、系统的历史(数字)档案搜索或文学研究中的文本档案搜索的标准有了很大提高。研究员现在规定了一致的数字搜索公式,在许多文件和资源中使用,以便计算结果。这种比较分析的发展催生了新的调查课题。哲学或文学研究中的传统实践,过去主要集中在对一个文本或作者的深入分析上,而且往往针对的是“伟大的思想家”。他们被认为脱离了同时代更广泛的、可能会对其做出反应,并受到其影响的“不太伟大的”作品。在文学研究或哲学等领域,转向多文本分析可以解决这些过去的问题,也可以更好地从时间上追踪模因和思想。
三、流畅的沟通
糟糕的学术交流的典型刻板印象是,在一个挤满了人、声音杂乱的大房间里,一个研究员正试图解释一张幻灯片,其上有大约100个数据点(显示到小数点后7位),字体的大小连前排的观众都看不见,更不用说后面的观众了。学术界的大多数人在某个时候都有过类似的交流实践经历。但是,这种陈词滥调无论多么令人沮丧,在那些严肃或专业的论坛上却越来越少见。
特别是STEMM学科的科学家,他们已经开发出越来越复杂的“科学交流”实践。他们的目的是向不同类型的受众解释研究方法和研究结果。在学术界,他们向其他分支领域或邻近学科的专业同行进行解释;向外则延伸到资助者、政府机构、企业主管或民间社团成员;当然,他们还会通过(“大众”或传统)媒体和大型互联网站和网络向大众传播。许多技术都可以在这里提供帮助。如今,有效的数据和过程的可视化在报告和外部演示中比在出版商控制的教科书和专业期刊中更加常见。专业的可视化有助于对复杂现象进行非常有用的直观展示,特别是使用在线方式演示时间或行动上的演变。因此,科技传播和科学新闻学在美国、英国和欧洲的STEMM学科中都各自成为一个重要的分支领域。大多数资助程序,以及许多专业和行业咨询机构,现在都要求研究团队制订完善的“传播计划”,以便将关键的研究结果传播给尽可能多的相关受众。进而为学术部门或实验室带来更多的声誉和资金支持。在STEMM学科之外,专业交流的标准也得到了提高,尽管专用资源少得多。一些在关键学科(如文学、历史和一些哲学领域)从事有趣课题的有成就的作者,总是从学术市场“跨越”到更大的商业非虚构市场。
最近,早期“学术”和媒体角色的僵化分离开始以多种方式被打破——通过更专业的在线新闻、资源的数字化访问、“大众科学”书籍的兴起、TED讲座和视频或播客的增加、新的信息图表和动态可视化、视频和音频在实地工作中的普遍使用,以及博客等简短形式的公共宣传的兴起(见下文)。衡量(大多是次要的)“名人”的标准已经扩展到了一些直观可及或极具话题性领域的学者,其中既有STEMM科学家,也有人文社会科学学者。
对写作拙劣和令人厌烦的学术成果(学术腔)的批评大大增加。然而,进入21世纪以前,研究型大学的学术和科学工作的基本模式在超专业化的轨道上几乎没有变化,他们广泛使用过于复杂的文本,并坚持对其辩护。网络上有普遍可用的知识,通过博客之类的数字媒体可以呈现和发布知识,而随着这些转变和新机会的出现,传统的做法才开始真正瓦解。大多数研究员已经开始把更多的精力放在更好的写作、从根本上改善科学和学术的交流上。开发新的简短出版物,使用不同于文本的媒体,也是使博客变得可行的重大变革。
四、快捷的研究
为获得新发现而进行的竞争是“快速进步或高度共识”的STEMM学科发展模式的命脉,这种模式从19世纪末开始发展起来,在20世纪70年后达到顶峰。科学家们绞尽脑汁想成为第一个做出同行评议发明的人。在创造性的艺术领域,创新和新的探索形式也很重要。那么,在这样的领域,数字时代有什么改进的空间?这里有两个关键的答案。
首先,即使在STEMM学科领域,围绕核心研究工作的辅助程序也有很大的改进空间。与私营或政府管理的研究实验室相比,大学的科研机构和实验室在某些方面进展仍然是缓慢的,特别是在争取拨款或建立跨学科研究团队方面的时间较长。然而,他们现在正在以其他方式快速发展。搜索和扫描的改进显著减少了时间的滞后,并提高了文献审查的一致性。确定有前途的研究课题更快,监测研究前沿也更简单。在20世纪90年代的电子邮件和列表服务新闻推送中,STEMM学科通信网络在同行评议之前就已经得到了很好的发展。从那时起,数字和基于互联网的联网带来了更显著的即时性和便利性。它从根本上提高了预印内容生产的质量,降低了网络成本,并为交换各种不同的媒体和数据集创造了更简单的方式。
数字出版的变化也开始解决许多导致出版前同行评议过程延长的问题,特别是难以找到专家评审员投入大量时间来检查技术含量极高、数学化程度极高的论点。较新的“出版后评论”期刊,如在生命科学领域如今规模庞大的PLOS One,在接受文章之前,故意将出版前审查要求(“这一次通过的是否算优秀学术成果?”)降到最低。出版后专家读者的反应和评论(加上阅读、下载、点赞、引用等替代计量学指数的证据)有助于筛选出哪些文章代表了更重要或原创的进步。就实现有效的同行评议而言,结果似乎是可以比较的,但成本却大大降低了,公布速度也快得多。研究中问题的提炼和呈现看起来也是有效的,而“传统”同行评议的问题却变得更加突出。在整个STEMM学科中,期刊“影响因子”(其本身是一个无用且有争议的平均数)与其他作者随后被引用之间的相关性在2011年降到了40年来的最低水平。
数字时代加速的第二个主要领域是STEMM学科之外的社会科学和人文学科。此领域的研究进度向来较慢,及时开展工作的意愿也较弱。事实上,这里有一种对“慢学术”的崇拜,它明确地重视反思和长期项目(长时间不发表),而不重视被贬低的、“快餐”式的应用学科文化。这些学科的引文积累的准备时间很长,通常在出版后3~5年,而且出版过程也需要更长的时间。例如,在社会科学领域,同行评议可能需要4~6个月的时间,而在主要的经济学期刊上,从投稿到公开发表的总时间可能长达3年以上。在线出版减少了一些延迟,但这些学科的一些学者不会访问(更别提引用)在线作品。我们中的一个人(邓利维)最近等了18个月,才让一篇已经在网上发表的论文被放到相关期刊的特定印刷版上。
相比之下,简短的博客文章和社交媒体在这些曾经不发达的领域促进并形成了持续的、实时的学术网络。思想的传播以跨越国界的特定主题模式得到了改进,并以互动的方式汇集了现有的知识。这是对以前只有在社会科学和人文学科中通过会议和原始新闻报道才能获得信息的复制。有了志同道合的学者迅速加入,思想的传播就加快了——创造了一种“有组织的偶然机会”,其为知识交流提供了场所,并为表达、形成思想或论点创造了一个强有力的发展氛围。数字媒体和社交媒体的速度更快,远离了长篇出版的评价环境,对待年轻或初级和高级学者也更加平等。
五、开放的获取
现如今,一个更广泛的“开放获取”和“开放科学”运动紧密联系在一起。这一运动旨在让任何一个通过智能手机、平板电脑或笔记本电脑连接网络的人都能立即免费阅读所有学术成果。到2000年左右,期刊论文被封存在很高的付费门槛后面,只有那些拥有大学图书馆或大型企业订阅的人才可以访问获取。“开放获取”运动试图确保任何出版费用在过程之初就得到支付,或者确保被封锁的研究可以通过其他方式获得,包括可行的免费途径。由于大学里的大多数科学工作是由政府或基金会资助的,研究员出于公共利益而将成果无偿提供给期刊,但这些却成了出版商的私有财产,并以很高的价格发行,这是完全说不过去的。