图源 | Internet
黄如花1,2 石乐怡1
1.武汉大学信息管理学院,武汉,430072;
2.武汉大学图书馆,武汉,430072
✧
摘 要
✦
开放科学时代的到来,改变了信息环境和学术交流体系,也为高校图书馆信息资源建设带来了全新的机遇与挑战。面向我国建成教育强国、科技强国、人才强国、文化强国等国家战略,开放科学时代我国高校图书馆信息资源建设亟需在服务国家多重战略的基础上谋求高质量发展。本文提出四个方面的对策:建设符合总体国家安全观的信息资源,打造我国高等教育数字化所需的信息资源体系,夯实科技高水平自立自强的信息资源基础,强化构建中国特色哲学社会科学所需的信息资源支撑。
关键词
信息资源建设 开放科学 高校图书馆 开放存取 高质量发展
引用格式
黄如花,石乐怡.开放科学时代高校图书馆信息资源建设服务国家战略之思考[J].信息资源管理学报,2024,14(4):16-28.
1 引言
全球已进入开放科学时代。2021年,联合国教科文组织(United Nations Educational,Scientific and Cultural Organization,UNESCO)在《UNESCO科学报告——与时间赛跑,争取更明智的发展》上刊发标题为“开放科学时代正是此刻”的文章[1]。2023年12月,UNESCO发布的《开放科学展望(第1期):全球现状和趋势》(简称《开放科学展望1》)指出,开放科学必须成为一个公平的全球现象[2]。美国白宫科学与技术政策办公室将2023年确立为“开放科学年”,旨在推动更为开放、公平、安全的研究[3]。
我国积极融入并推动全球开放科学进程。《中华人民共和国科学技术进步法》(2021年修订)指出,“促进国际科学技术资源开放流动,形成高水平的科技开放合作格局,推动世界科学技术进步,完善科研论文和科学技术信息交流机制,推动开放科学的发展”[4]。2023年12月13日,“面向信息资源管理的开放科学高端论坛”召开,会议期间,“开放科学与数字资源建设联合研究中心”正式揭牌,并组建中国科学技术情报学会开放科学专委会;2024年1月23日,中国科学院文献情报中心召开“UNESCO《开放科学展望1》和中国开放科学实践研讨会”,探讨我国开放科学实践中的基础设施建设、文化转型、激励机制等重要议题。
高校是全球开放科学进程中极其重要的参与者。早在2015年,《UNESCO科学报告——面向2030》便刊发了标题为“高校已成为越来越全球化的参与者”的文章[5]。2022年,UNESCO发布《高校实施UNESCO开放科学建议的备忘录》,强调高校要推进开放科学基础设施建设,以在开放科学活动中发挥更关键的作用[6]。美国百余所高校共同成立并推进“高等教育开放学术领导力倡议”,以构建一个更加透明、包容和可信的学术生态系统[7];“开放科学年”运动将高校、图书馆等主体共同作为联邦机构广泛合作社区中的重要组成部分,共促开放科学运动的持续、深入开展。
开放科学时代为高校图书馆信息资源建设带来了机遇和挑战。从高校图书馆有限的资源建设经费和用户不断增长的数字信息资源需求之间的矛盾来看,用户数量扩大、对数字信息资源的偏好超过纸本资源,而高校图书馆正面临经费不确定形势,以及因数据库、电子出版物等的价格连年上涨导致相对购买能力下降等问题;从高校图书馆与数据库商、出版商之间不对等的供需关系来看,我国高校图书馆获取数字信息资源的最主要方式是采购,仅是重金购买使用权而非拥有权的“一纸协议”,一旦协议终止,所有内容与服务荡然无存;从国家的长远发展需求来看,我国建成教育强国、科技强国、人才强国、文化强国等战略目标[8],对高校图书馆为人才培养和科学研究提供的信息资源支撑提出了更高的要求。高校图书馆亟需寻求购买以外的信息资源建设方式。开放科学促进了信息、知识、数据、方法、工具等资源的开放共享,推动了开放存取(Open Aceess,OA)资源仓储/库/平台等科学基础设施的不断发展,为图书馆采集、整合和生产信息资源提供了更多的选择和更好的契机。但是,在任何网络用户都可以发布信息的开放科学时代,“用户生产内容”(User Generated Content, UGC)“专业生产内容”(Professional Generated Content, PGC)和“职业生产内容”(Occupationally Generated Conten, OGC)的信息生产模式并存甚至交叉,如今还伴随着“人工智能生成内容”(Artificial Intelligence Generated Content, AIGC)模式,不可避免地导致了内容质量良莠不齐等问题;此外,在信息访问、生产、重用、改编、发布、共享等行为的成本不断降低甚至免费的开放科学时代,也存在限制与管束的灰色地带,甚至伴随着深度伪造、不良言论、错误信息、恶意篡改、信息窃取、黑客入侵等威胁安全发展的问题,这要求开放科学时代高校图书馆信息资源建设必须要以保障安全为最基本原则。
实践与研究的不足迫切需要提出开放科学时代高校图书馆信息资源建设的发展之策。我国只有极少数高校图书馆注意到OA资源的利用、生产与传播;过往关于OA资源的研究也主要集中在OA期刊,对开放教育资源(Open Educational Resources, OER)、开放数据、开源软件、开放源代码等类型的信息资源,以及来自社交媒体等渠道的OA资源关注不够,更缺乏从国家战略层面提出系统性对策的研究。鉴于此,下文将提出开放科学时代我国高校图书馆信息资源建设服务国家多重战略的些许思考。
2 建设符合总体国家安全观的信息资源
习近平总书记提出的总体国家安全观,是一个集政治安全、国土安全、军事安全、经济安全、文化安全、社会安全、科技安全、网络安全等16大领域为一体的战略思想,为我国高校图书馆建设一个安全可控的开放信息资源体系提供了重要指导。其中,政治安全、文化安全、科技安全、网络安全与高校图书馆信息资源建设颇为相关。
2.1 确保开放信息资源的意识形态正确
政治安全、文化安全要求必须保证开放信息资源内容意识形态的正确性,这也是我国高校图书馆信息资源建设的根本性、方向性问题。当前,全球开放信息资源体系仍以西方价值观为主导的英文内容为主,截至2023年1月,英文网页约占全球网页份额的58.8%,而中文网页仅占1.7%,开放科学时代高校图书馆信息资源建设不可避免地要引入来自国内外的开放信息资源。为最大程度地确保意识形态的正确性,必须引入来自权威渠道的开放信息资源,且应当最优先关注来自我国的权威渠道。
2.1.1 获取来自我国政府部门的信息
由我国政府部门发布的信息内容在意识形态问题上最为安全、可靠。以科学数据的获取渠道为例,应优先关注来自我国国家政府部门的数据,如中国科技部、财政部批准的20家国家级科学数据中心、国家统计局、教育部等国家部门官方网站的数据服务相关专栏发布的数据。
2.1.2 获取受到我国政府部门认可的渠道的信息
一些信息渠道虽然不直接来自于我国政府部门,但是受到政府部门的认可,其意识形态正确性也有较高的保障。比如,为获取正确、可信的国内外党政新闻、时政热点,可参考中央网信办发布的最新版《互联网新闻信息稿源单位名单》[9],优先从该名单中的中央新闻网站、中央新闻媒体及其官方微博/微信等渠道获取信息。
2.1.3 获取来自大型国际组织的信息
此外,还可以各类大型的国际政府间组织为主要获取渠道,包括联合国及其下设的政府间国际组织(如世界卫生组织)、世界贸易组织、经济合作与发展组织、欧盟等的官方网站;大型国际组织专设的信息或数据平台,如联合国UNdata、联合国数字图书馆系统、联合国教科文组织UIS.Stat、经济合作与发展组织OECD data、世界银行开放知识库(World Bank Open Knowledge Repository)等。
2.1.4 获取来自具有影响力的学术机构的信息
最后,来自我国国家级科研院所、权威学术团体、知名高校的信息内容在意识形态方面也具有较高正确性。其中国家级科研院所包括中国科学院下设的32个科学数据中心,中国社会科学院“国家哲学社会科学文献中心”、中国社会科学文库等。
各领域、各学科的权威学术团体则包括国家级别和国家层面的学会、协会、研究会等。以图书情报学科为例,要从国际图书馆协会联合会(International Federation of Library Associations and Institutions, IFLA)、中国图书馆学会、美国图书馆协会(American Library Association, ALA)、英国图书馆协会(Chartered Institute of Library and Information Professionals, CILIP)等组织获取信息。再以电力领域为例,可从电气与电子工程师学会电力与能源分会(IEEE Power and Energy Socie-ty,IEEE PES)、中国电工技术学会、美国电力研究协会(Electric Power Research Institute,EPRI)等组织获取信息。
知名高校的研究数据仓储、机构知识库、特色数据库等也具有较高权威性。比如,来自我国“双一流”高校发布的信息内容,权威性有较高保障。除国内高校外,也可适当引入来自国外知名高校的信息内容,包括在世界四大学术排名——QS世界大学排名(Quacquarelli Symonds Limited World University Rankings,QS)、软科世界大学学术排名(Academic Ranking of World Universities,ARWU)、《泰晤士报》世界大学排名(Times Higher Education)和《美国新闻与世界报道》(U.S. News & World Report Best Global Universities,U.S. News)榜单中靠前的国外高校。
2.2 重视数字信息资源的长期保存
数字信息资源的长期保存与总体国家安全观中的科技安全、网络安全密切相关。开放科学时代,数字信息资源成为最主要的信息资源,然而,数字信息资源存在一定脆弱性。例如,在线访问非本土保存的数字信息资源,随时可能出现被断供的风险,也存在访问日志有可能暴露我国科研动态和研究方向等科技安全问题[10]。网络环境的不稳定性,还可能导致在访问非本土保存的数字信息资源的过程中,因网络系统的硬件、软件及其中的信息和数据受到破坏、篡改、窃取等,出现内容丢失、数据泄露、系统停服等网络安全问题。鉴于此,开放科学时代的信息资源建设,必须重视数字信息资源长期保存,以增强信息资源建设的安全性和稳定性。
2.2.1 采取技术措施提升长期保存的可靠性
数字信息资源长期保存已有多种比较成熟的技术措施,主要包括迁移(migration)、更新(refreshing)、转换(conversion)、仿真(emu-lation)、数据加密(data encryption)等技术,还有在数字信息资源生产过程中进行数据备份、及时恢复或修复数据等措施。当然,不同的长期保存技术和手段各有利弊,比如,迁移可以将原始数据格式转换为独立于具体原始软硬件平台的标准数据格式,但适用的资源类型很有限;仿真适合超文本、多媒体等复杂的数字信息,但是兼容性相对较低;数据备份安全性较高,但是实现难度较大、成本较高。
鉴于此,高校图书馆需要结合自身情况和需求选择适宜的手段,往往需要复合使用多种技术措施,以最大程度地提升数字信息资源长期保存的可靠性。剑桥大学图书馆《机构知识库保存政策》指出,为了防止数据损坏和丢失,所有数字内容将实时从主存储器(primary storage)中以加密传输手段复制到辅助存储器(second storage)中,并放置于三个离散的物理位置进行实时备份;对数据进行实时监测和分析,一旦发现数据与所保存的检验和不匹配就立即采取修复措施,以确保数据的安全性、完整性和可靠性[11]。
2.2.2 通过强化合作提升长期保存的可信赖性
通过强化合作可分摊长期保存中的风险,并大幅提高长期保存的可信赖性。高校图书馆可作为重要的参与主体、甚至是主导力量,推动如下几个层面的合作保存:
(1)高校系统层面的合作保存。较具代表性的是联合了加州大学10个分校的图书馆而组建的加州数字图书馆系统(California Digital Library, CDL),CDL还将合作对象扩大至各校乃至加州的博物馆、档案馆等。CDL在数字资源长期保存中作出的贡献包括建立机构知识库eScholarship、开发加州在线档案平台(Online Archive of California, OAC)等。
(2)地区层面的合作保存。早在10余年前,美国高校图书馆就作为重要力量之一参与并推进了各州的数字资源长期保存项目。比如,北卡罗莱纳州立大学图书馆作为核心成员之一,与当地相关政府部门、公共图书馆、档案馆等合作完成了“北卡罗来纳州地理空间数据存档计划”[12]。
(3)国家层面的合作保存。经过10余年的探索,国家科技图书文献中心(National Science and Technology Library,NSTL)牵头中国科学院文献情报中心、中国科技信息研究所、北京大学图书馆以及全国200多家图书馆,建立了国家数字科技文献资源长期保存体系,并面向全国各类组织和个人提供合作保存服务。
3 打造我国高等教育数字化所需的信息资源体系
推进教育数字化已被写入中国共产党第二十次全国代表大会报告中(简称“党的二十大报告”)[8]。建设OER不仅是开放科学时代的重要议题之一,也是推动教育数字化的关键,《“十四五”数字经济发展规划》明确指出“加快推动文化教育……等领域公共服务资源数字化供给和网络化服务,促进优质资源共享复用”[13]。
当前,我国高校图书馆OER建设与服务仍较为薄弱,缺乏独立的OER平台或门户,OER类型也较为单一[14]。高校图书馆亟需在OER建设中发挥主导作用,并与多类机构开展合作[15]。我国高校图书馆可从如下四个方面努力,以提升自身服务于高等教育数字化的能力。
3.1 汇聚已有的优质开放教育资源
重点从国家智慧教育平台、学习强国、中国大学MOOC等我国权威渠道采集具有中国特色的代表性OER。以免费在线课程为例,基于本校所开设学科专业的情况,以及各学科专业开展线上教学、线上线下相结合教学、虚拟仿真实验教学的个性化需求,依据教育部公布的国家精品在线开放课程、国家级一流本科课程(包括线上课程、线上线下混合式课程、虚拟仿真实验教学课程,截至2024年4月已公布两批)等名单,以及针对高职院校的职业教育国家在线精品课程名单,从中遴选出符合本校专业设置和人才培养要求的在线课程,从上述渠道采集参学站点并进行专题组织,帮助本校师生便捷、高效地利用我国的优质OER。
3.2 丰富本馆生产的开放教育资源内容
为更好地服务于高等教育数字化中的师生数字能力建设目标,满足师生在科研、学习、创新创业等多元场景中的素养培育需求,应在本馆自建OER体系中增加数字素养、AI素养(Artificial Intelligence literacy, AI literacy)和创新创业能力培育等有关的内容,并围绕这些内容开发针对各知识模块的教学视频、微课,配套各模块的在线教学大纲、电子课件、在线测试的网页/小程序/游戏APP、在线互动问答社区等形态更为多元的OER。笔者已有专文论述数字素养教育OER的建设[16],在此不赘述。
3.2.1 增加人工智能素养教育的内容
针对AI的基本知识、场景化应用、伦理道德等内容开发OER。IFLA指出,AI素养培育的很多内容可包含在已有的信息素养教育产品中[17]。我国高校图书馆可直接在已有信息素养OER中新增AI素养培育的相关内容,或是将生产信息素养教育OER的先进经验直接迁移至AI素养OER建设中。比如,在通识类的信息素养OER中,增加关于AI技术的基础认知(如AI发展历史、生成式AI概念内涵)、AI技术的辩证利用(如评价AI生成内容可靠性的方法、甄别深度伪造的方法)、AI技术中的法律与伦理问题(如我国治理与监管AI技术的法律、隐私保护与知识产权)等内容;在针对教师/学者、不同专业和不同阶段学生的差异化信息素养OER中,围绕师生在科研、教学、学习等不同场景中的AI工具利用需求增加相关的教学内容,比如指导教师如何正确利用AI工具、优化追问方式以生成个性化的课堂习题、学习评价等,指导师生合乎道德地利用AI工具辅助论文选题、查找各学科的学术信息等。
3.2.2 充实创新创业能力提升的内容
开发深度嵌入创新创业实践需求的OER。我国已加快了培养优秀创新创业人才的步伐,并于2022年建设首批国家级创新创业学院、国家级创新创业教育实践基地;培养高端创新人才的端口不断前移,2023年9月,国家自然科学基金委在八所高校中启动了优秀本科生资助试点[18]。亟需围绕学生申请各级各类的大学生科研创新项目、参加大学生创新创业训练计划、创新创业竞赛(如大学生信息搜索竞赛、全国“互联网+”竞赛、高校开放数据创新研究大赛)、获得本校创新创业学分认定(如发表学术论文/专利/软件著作权、参加学术会议)等的实践需求,新建或在已有信息素养教育OER中充实多源数据与信息的获取、数据可视化分析或商务智能工具的使用、研究内容/方案与技术路线的设计、项目申报书的撰写、创新创业成果产出形式与发表途径的选择等相关内容,以增强学生找准创新创业突破口、产出高质量创新创业成果的能力。
3.3 推广本馆的开放教育资源
提升本馆生产的OER的传播力与影响力。仅通过图书馆网站传播本馆自建的OER,其用户基本局限于本校师生,服务效能有限。除了利用微信公众号、微博等常见途径,还可充分利用多种具有影响力的途径,定制各类型OER的推广方案。比如,在网络视频平台哔哩哔哩、抖音、微信视频号等发布“微课”、在线讲座或培训、直播课等视频类OER,通过较受年轻用户欢迎的社交媒体平台小红书、知乎等发布图片类、文字或文档类、短视频类OER,通过自建微信小程序、移动应用程序等发布在线自测、小游戏等交互类OER。例如,武汉大学图书馆在哔哩哔哩视频平台上线了本馆承办的“大学生科研训练营(第一届)”活动的所有课程视频,供全国用户观看,其中点击率最高的课程为“项目计划书的撰写”,截至2024年5月4日已有7094次播放。
3.4 合作建设本校的开放教育资源
联合本校教学管理与评价、教学服务、技术开发等方面的职能部门,以及各院系、研究中心等教学单位,共同推进本校教师生产和贡献OER的进程,合力建设全校教育数字化所需的OER体系。
3.4.1 推动开放教育资源建设纳入教学规划
积极参与学校人才培养规划或教学管理制度的制定与宣讲。争取本校的本科生院、研究生院、教师发展中心、各院系教务部门等相关部门的支持,将推动生产与贡献丰富的OER纳入本校的教学发展与人才培养规划、教学管理或评价制度中;主动争取机会在全校人才培养体制建设、教学工作或教学改革会议、馆员进院系等活动中,作OER服务于高等教育数字化、推动人才培养高质量发展的相关报告,使校领导和各院系分管教学工作的领导、学科带头人、国家一流课程负责人、国家级教学成果奖获得团队等主体,认识到建设优质OER对高等教育高质量发展的重大意义,进而积极主动地通过高校图书馆贡献OER,或是直接参与到高校图书馆自建OER的实践中。
3.4.2 提供开放教育资源存取的专门渠道
高校图书馆可与本校信息中心、网络技术中心等部门合作,共同开发本校的OER服务平台、在线门户、开放仓储、学科导航等,以专题化汇聚本校教师贡献的OER,实现本校特色的OER按学科、专业、院系、类型等的归类、描述、组织、关联、检索。
3.4.3 汇集多模态开放教育资源
整合教师自建的OER。鼓励本校教师向前述的OER专门存取渠道提交由本人自主生产的符合安全要求、可以开放利用的教学资料,包括但不限于自行录制的教学视频、自制的电子课件和多媒体教学素材、数字化教学大纲/课堂习题/试题试卷、主讲讲座或直播课的回放视频等形态丰富的OER。
整合教师推荐的OER。号召各学科教师推荐来自各类开放渠道中的优质教学资源,包括具有教学与学习价值且可免费获取与再利用的在线图片/音频/视频/文档、短视频、网络直播课、在线讲座或培训等,并在推荐时附上简要说明,比如获取站点、资源名称/主题、适用的学科与阶段等。
4 夯实科技高水平自立自强的
信息资源基础
实现科技高水平自立自强已被写入“党的二十大报告”中[8]。习近平总书记对实现科技高水平自立自强的信息资源建设作出重要指示,要求“超前部署新型科研信息化基础平台”“全面提升开放共享水平和运行效率”“建设具有国际影响力的科技文献和数据平台”[19],为高校图书馆(界)信息资源建设更好地服务于科技强国战略指明了方向。
4.1 根树立科技信息资源“卡脖子”的忧患意识
开放科学虽然在一定程度上改善了美国等西方国家掌握全球科技交流制度的局面,但是在裹挟着政治、经济、文化等因素的科技创新博弈格局中,开放科学时代的到来也无法彻底解决国外对我国实施“卡脖子”技术限制的问题。对于高校图书馆界乃至全国的图书情报领域而言,强化科技信息资源建设“卡脖子”的忧患意识,才能未雨绸缪、加快建设步伐、优化建设工作,具体而言,需要强化以下两方面的意识。
首先,意识到信息资源建设技术“卡脖子”对我国的制约。国外对我国实施“卡脖子”的35项技术中[20],与信息资源建设相关的有操作系统、数据管理系统、EDA工业软件等,意味着我国自主开发学术数据库、科学研究与学术交流的软件工具、知识服务平台等实践面临着关键技术受制于人的困境。
其次,意识到科技信息资源内容“卡脖子”的威胁。我国高校图书馆界应当及时跟进、深入了解国外对我国实施科技信息资源“卡脖子”的手段和方式。比如,在美国政府出口管制要求下,MATLAB软件突然对哈尔滨工业大学暂停激活[21];俄乌战争背景下,科睿唯安宣布暂停对俄罗斯和白俄罗斯新提交期刊的所有评估[22]。这些案例深刻地说明,美国等西方国家仍然掌握着科技信息资源供应的主动权。我国高校图书馆界必须借助开放科学时代带来的机遇,建设具有自主保障能力的科技信息资源保障体系,提升应对“科研食粮断供”威胁的能力。
4.2 建设机构知识库应对科技信息资源“卡脖子”威胁
机构知识库是OA资源仓储的重要分支之一,我国还发展出“学者库”“学术典藏库”等类型,推动了期刊论文、学位论文、会议论文、著作、专利、基金信息等科技信息资源的开放获取。建设机构知识库有助于应对学术信息资源“断供”危机和科技信息资源“卡脖子”威胁。
然而,我国高校图书馆的机构知识库建设仍存在全文链接缺失、版本信息不完整或无效、无法访问全文或全文收录率很低、以期刊论文为绝对主流导致所收录资源类型颇为单一等问题[23-24],与提升我国科技信息资源自主保障能力和开放共享水平的发展目标仍有较大差距,可从以下三个方面优化。
4.2.1 收录成果全文
与出版商谈判,要求降低成果全文的OA限制。比如,英国联合信息系统委员会(Joint Information Systems Committee, JISC)与出版商积极谈判,致力于推动全英的科研成果的全文OA,在JISC的支持与推动下,牛津大学图书馆与多家出版商达成多项OA协议,美国化学学会(American Chemical Society, ACS)、计算机协会(Association for Computing Machinery, ACM)等全球顶级出版商支持牛津大学学者以金色OA方式出版文章,意味着成果发表后立即免费公开全文,即可马上被机构知识库收录,还有一些出版商如爱丁堡大学出版社(Edinburgh University Press, EUP)等,则同意将牛津大学学者所刊发的成果直接存缴至牛津大学机构知识库中[25]。
引导与支持学者选择合适的OA出版方式。通过宣传推广、出版资金支持、教育培训等方式,让本校学者更倾向于选择绿色OA,使得成果全文可自动存入本校的机构知识库,或是选择黄金OA以推动研究成果全文的无限制免费开放。例如为提升机构知识库的全文OA水平,瑞士洛桑联邦理工学院图书馆要求本校学者必须在绿色OA、金色OA和混合OA中做出选择,要求所有被接受发表的版本必须在机构知识库中自行存档,明确提出一般不鼓励研究人员在混合OA期刊发表论文,并采取一定的激励措施,为在金色OA期刊和同行评议公认为高科学标准的OA期刊上发表成果的学者支付文章出版费[26]。
争取学者、科研管理领导等利益相关者的支持。很多高校图书馆的机构知识库OA政策缺少关于存缴内容的强制性要求,仅依靠学者自觉、自愿存缴成果内容,效果不尽人意。高校图书馆需要号召学者和科研管理领导配合机构知识库的内容建设,比如,让学者认识到,通过机构知识库实现成果全文的OA有助于增加成果可见度和被引量,促进职业发展[27],哈佛大学机构知识库就是非常好的例证,截至2020年12月15日,其所收录成果的累计下载量高达4000万次;让科研管理人员认识到,机构知识库是本校科研评价与管理的权威数据源甚至是唯一认可数据源,学者上传全文或配合认领全文链接,有助于提升本单位科研绩效评估的竞争力。
4.2.2 拓展资源类型
收录多维度呈现科技创新贡献的学术信息资源。数据密集型的第四科研范式下,凝聚科技创新贡献的科学文献资源不仅是公开发表的论文、著作,还包括科技报告、预印本、专利、软件著作权、标准等。机构知识库所收录的信息资源越丰富,越有助于提升服务科技创新的效能。要在机构知识库OA政策中将除了公开发表的论文、著作以外的各类学术创新成果纳入存缴范畴,配合和指导教研人员将他们的资源录入库中,馆员还要学习和熟悉各种非正式出版物的著录方式,以便给予教研人员更好的指导[28]。西安交通大学机构知识库值得借鉴,其不仅收录了多模态科技信息资源,还进行分级分类管理,核心级资源包括公开发表的期刊论文、会议论文、专著、译著、编著、专利等,扩展级资源包括硕博学位论文、预印本文章、科技报告、学术报告演示文稿、研究报告、学习对象、数据集、工作文档、非文本资源等,关联级资源包括课件、网络公开课、MOOC、精品课程、讲座视频等。
4.2.3 增加研究方法内容
开放研究方法(open method)是开放科学运动的一大进展。致力于推动全球科学出版物OA进程的美国科学公共图书馆(Public Library of Science,PLoS)指出,研究方法包括研究过程、手段和材料,根据各学科、领域的特征,包括研究方案、协议、代码、材料和试剂、数据集等,开放研究方法将促进科技研发过程的复现和成果的复用[29]。为促进美国“开放科学年”运动的深入开展,美国能源部科学技术办公室开发了可发现、访问和重用其所资助项目所产出的软件与代码的搜索工具“DOE CODE”。
建设关于研究方法的专题内容。UNESCO认为,开放仓储(open repository)要“超越科学文献”,应当合理纳入原始科研成果、研究数据、软件、源代码、工作流程和协议、科学研究活动所产生的各类图像与多媒体素材等内容[30]。剑桥大学机构知识库收录了研究过程中产生的视频记录、电子表格、计算脚本、代码、软件、图像、演示文稿等,并支持将软件、代码、方法作为专门的资源类型进行检索。对于那些更可能大量产出软件、代码、数据集等的机构,比如理工类、医学类等高校/科研院所,或是以自然科学与工程技术学科、医学学科等实验性较强的学科为优势学科、重点学科的高校而言,可将软件、代码、数据集、工作流程与协议等内容作为机构知识库中的特定资源类型进行专门分类和标引,还可建设研究方法的专栏或子库,以加速科技研发成果在全国的复用和推广。
4.3 围绕“卡脖子”领域优化科技信息定向服务平台
建议由我国科技部领导,中国科学院、NSTL等牵头,号召全国高校图书馆、专业图书馆、知识服务头部企业等主体,发挥各自优势,重点围绕当前“卡脖子”领域中还未解决或仍需持续攻关的领域,以及与“卡脖子”领域交叉或密切相关的其他关键领域,加大定向科技信息资源的精准供给力度,打造更加直面“卡脖子”攻关需求的信息服务平台,扩大高校图书馆界信息资源建设服务于科技强国战略的影响力。
以AI定向平台为例,NSTL推出的AI重点领域信息门户融合了国内外关于AI治理的政策法规、关于AI发展的战略规划和智库报告,以及AI关键技术的研发资讯等多源异构的科技文献资源。未来,还可新增面向“卡脖子”技术的内容,比如,AI的核心算法开发,不仅是我国AI研发的“卡脖子”环节,算法本身也是科技“卡脖子”领域之一。提供国内外的开源算法、开放源代码、开源数据(集),虽也能为赋能大模型、优化AI算法提供参考,但是,利用国外开源算法训练的AI大模型在精准性、自主性上都较为欠缺。面向科技高水平自立自强的战略,应基于我国自主研发具有原创性的AI基础算法的目标,从核心算法开发的底层数理逻辑和基础研究源头出发,增加关于基础算法的数学原理的内容,比如基础数学理论、高性能数值计算、核心算法数学公式与模型等领域的开放信息资源,促进我国通过新的数学技术提升AI技术的原始创新水平。
5 强化构建中国特色哲学社会科学
所需的信息资源支撑
为构建中国特色哲学社会科学,我国出台了《国家“十四五”时期哲学社会科学发展规划》[31],要求加快中国特色哲学社会科学学科体系、学术体系、话语体系建设。高校在中国特色哲学社会科学的构建过程中十分关键,《面向2035高校哲学社会科学高质量发展行动计划》指出“要围绕三大体系建设特别是加快建构中国自主知识体系的目标任务……以有组织科研推动新时代中国特色哲学社会科学知识体系创新”[32]。
习近平总书记已针对强化我国哲学社会科学的信息资源保障做出多次重要指示[33-34]。开放科学时代,高校图书馆要推动哲学社会科学领域的优质学术资源信息和知识的采集、整合、生产、开发与共享,强化构建中国特色哲学社会科学所需的信息资源支撑。
5.1 采集优质学术信息资源
为助力本校学者立足中国传统、中国实践、中国问题产出高质量成果,各高校图书馆应优先、重点采集中国特色哲学社会科学的高水平学术信息资源,包括但不限于国家哲学社会科学文献中心、国家哲学社会科学学术期刊数据库、中国社会科学文库等,以及笔者相关成果提及的获取党政和时政信息、经济与社会发展数据等适用于哲学社会科学的开放信息资源的国内权威渠道[35]。
5.1.1 整合我国自主建设的开放信息资源
持续追踪我国哲学社会科学的学术信息资源建设的进展,引入并整合来自我国权威渠道的自主建设前沿开放信息资源,在本馆的数据库导航、OA资源导航/专栏中增加这些开放信息资源的网站链接,并通过微信公众号、馆员进院系等方式向本校师生推介。比如,跟进中国科学院科技论文预发布平台“ChinaXiv”相关学科子平台的建设进程,其于2023年1月推出“法律与科技交叉前沿领域预印本平台”;再比如,中国人民大学牵头建设并于2024年4月上线的面向社会公众开放的“哲学社会科学主文献平台”和“哲学社会科学预印本平台”,均是值得各高校图书馆引入的前沿开放信息资源。
5.1.2 搜集我国哲学社会科学的高水平学术成果
开放科学时代,各种环境下的各类学术信息资源爆炸式增长,质量却良莠不齐,高校图书馆更需为用户提供精华的、先进的、具有代表性的学术信息资源。可依据国家哲学社会科学优秀成果文库、国家社科基金成果文库、教育部高等学校科学研究优秀成果奖(人文社会科学)、本省社会科学优秀成果奖等信息,采集各学科领域中的优质成果。对于那些能在PubScholar、GoOA、期刊官方网站、机构知识库等OA渠道中免费获取全文的内容,可将其数字化版本下载或链接至本馆网络中;对于那些暂时不能从开放渠道中获取的成果,则可采购纸质资源,并将其著录信息及时纳入本馆的联机公共目录检索系统(Online Public Access Catalog, OPAC)、学术资源发现系统、学科信息门户等资源整合渠道中,为本校哲学社会科学的发展提供高站位、复合式的文献信息资源。
5.2 建设国家层面的学科库
学科库是OA资源仓储的另一重要分支。对于高校图书馆而言,建设学科库也是服务于哲学社会科学的学科建制与发展的关键之一,费孝通将学科建制设定为学会、专业研究机构、大学的学系、图书资料中心、学科的专门出版机构五个方面[36]。
为更好地服务于我国哲学社会科学的三大体系建设,中国社会科学文库发布马克思主义学术资源库等12个学术资源子库和“马列党建”等11个专题子库。未来,可进一步建设一批具有影响力和前沿性的哲学社会科学学科库。建议教育部、中国社会科学院等主体领导和组织全国高校图书馆,共同优化已有的学科库和开发新的学科库,凸显图书情报领域作为国家高端学术智库的担当。
5.2.1 增加跨学科资源
学科交叉融合是我国哲学社会科学学科高质量发展的重大趋势之一。我国于2023年3月发布的《普通高等教育学科专业设置调整优化改革方案》明确要求,“构建中国特色哲学社会科学……推动文科间、文科与理工农医学科交叉融合,积极发展文科类新兴专业……”[37]。
鉴于此,在学科库建设中应着力增加面向学科交叉融合的资源内容。以已有的历史考古学术资源库为例,如能适当增加与科技考古相关的遥感技术、航空摄影技术、物探技术等领域的学术资源,将能促进我国考古学学术研究和实践工作借用自然科学相关的方法和技术,提升信息提取以及价值挖掘的效率。再以未来值得新建的法学学科库建设为例,可基于《关于加强新时代法学教育和法学理论研究的意见》所要求的“推进法学和经济学、社会学、政治学、心理学、统计学、管理学、人类学、网络工程以及自然科学等学科交叉融合发展”[38],融汇跨学科资源,比如增加与AI监管、数据安全、网络安全、科技立法等相关的内容,从而促进交叉学科“数字法学”的研究。
5.2.2 丰富学科资源特色
拓展各学科的特色资源类型。比如,政治、历史、文学、哲学等相关学科的学科库,可重点增加红色文献、古籍、民国文献等信息资源,这需要将这些纸质资源数字化后的图像转换为可搜索、可发现的文本数据;社会学、管理学等相关学科,在研究活动中往往需要大量的社会调查数据、经济社会数据等科学数据,其学科库可适当增加开放研究数据仓储/平台等资源。再比如,ChinaXiv显示,我国图书馆学/情报学、数字出版、心理学等学科的预印本资源建设进展很快;ChinaXiv-Global显示,全球范围内法学、经济学等学科的预印本数量较为突出,因此,这些学科的学科库可适当纳入预印本资源。
增加中国特色的学术成果。我国哲学社会科学的不同学科产出了中国背景下独有的学术成果。比如,外语类学科以各类中外文译著见长,马克思主义的相关学科在报纸文章、资政报告、社论文章等较为突出,教育学、经济管理等产业化水平较高的学科还会有面向各种专题或各区域的白皮书、蓝皮书、发展报告等。如能在学科库中汇聚这些服务我国经济社会发展的高水平成果,并在确保安全的前提下适当开放,将更有益于向全球贡献哲学社会科学领域的中国经验与中国智慧。
5.3 合力打造国家层面的知识服务平台
融合多源异构文献与新兴技术打造开放的、数智化的知识平台,是推动开放科学实践走向深入的必然,也将提升文献资源服务于构建中国特色哲学社会科学的效能。
汇聚全国图书情报领域与各学科权威专家的智慧。建议由中国社会科学院、中国高校人文社会科学文献中心(China Academic Humanities and Social Sciences Library,CASHL)、教育部高校图工委、中国科学院文献情报中心等单位共同牵头,发动各学科的权威专家成立决策咨询团队,组织全国高校图书馆、专业图书馆、相关科研院所、出版商等主体,尤其是号召那些以哲学社会科学学科见长的“双一流”高校的图书馆作为核心建设主体,分工开发一批面向哲学社会科学各具体学科的知识服务平台。
增强学术知识的聚合、挖掘与发现功能。借助数据挖掘、语义关联、知识图谱等技术,利用自然语言处理、共词分析、社会网络分析等方法,揭示哲学社会科学某一学科或研究领域的发展脉络,尤其重点、深入揭示其在中国的起源与发展历程,以及各历程中的关键学术问题、研究流派或范式的演变等;基于各学科的核心概念术语,借助主题词云图、河流图等丰富的可视化界面,生动呈现其内涵与外延的变迁沿革,尤其是在中国情境下的演变,助力专家学者提炼出立足中国实践、具备世界影响的标志性学术概念;构建本领域的国内核心作者、核心研究机构与团队的地域分布图、科研合作网络与态势演变图,呈现中国特色哲学社会科学的科研主体标识;智能化分析和预测当前热点、学科发展的影响因素,帮助专家学者凝练出本领域或学科的发展痛点与症结、未来需重点研究的具体方向等,进而更好地提出中国方案,从而深度支撑中国自主的知识体系建构目标的实现。
6 结语
站在推动落实多重强国战略的高度上,开放科学时代我国高校图书馆的信息资源建设,应在坚持总体国家安全观的基础上,更大力度地融合、开发与贡献多源、异构、多模态的开放信息资源,以更积极、主动的姿态强化全国高校图书馆界乃至全国图书情报领域的合作,提升信息资源建设服务于人才培养、学术研究和科技创新的效能。
说明:本文部分内容来自第一作者黄如花于2023年12月13日在“面向信息资源管理的开放科学高端论坛”和于2023年12月28日在“2023中国信息资源管理学界十大学术热点发布会”的主题报告《开放科学时代我国高校图书馆信息资源建设》。
参考文献
作者简介
*原文载于《信息资源管理学报》2024年第4期,欢迎个人转发,公众号转载请联系后台。
* 引用格式
黄如花,石乐怡.开放科学时代高校图书馆信息资源建设服务国家战略之思考[J].信息资源管理学报,2024,14(4):16-28.
往期 · 推荐
制版编辑 | 周凡倩
审核 | 于 媛
长按识别二维码关注我们
信息资源管理学报
分享、在看与点赞
只要你点,我们就是朋友😊