摘 要
生成式人工智能技术对于改变档案服务思维方式与发展理念,推动其向智慧服务方向转变具有强大支撑作用。基于ArcGPT语言模型,本文构建了主体维、功能维、资源维、技术维等四维一体的数智化档案服务体系,并提出理念重塑、流程再造和技术赋能等策略,以期搭建虚实智能联动的档案资源服务平台,提供个性化、模块化、全周期、注重全景式漫游交互体验的档案知识化服务,推动数智化档案服务体系的创新与发展。
基于ArcGPT的数智化档案资源服务体系构建及实现
1
引言
当前,档案机构经由数字档案馆建设、电子查阅系统开发、数字档案智能化编研等手段,积极推动档案资源服务体系“数智化”转型升级,但仍面临着应用层面不均衡、技术更新滞缓、服务模式单一、资源整合不足等现实困境[1]。《“十四五”全国档案事业发展规划》(以下简称《规划》)将加快档案开放、扩大档案利用、提供优质服务等视为重要任务,积极推动知识管理、人工智能等新兴技术在档案信息深层次加工和利用中的应用与深度融合,以期为档案事业发展提供持久动力[2]。2023年9月8日,习近平总书记在听取黑龙江省委省政府工作汇报时强调,要整合科技创新资源,引领发展战略性新兴产业和未来产业,加快形成新质生产力[3]。新质生产力是创新起主导作用,由人工智能、虚拟现实和增强现实设备等技术实现革命性突破、生产要素创新性配置、产业深度转型升级而催生的新发展理念。因此,档案事业高质量发展,迫切需要构建以创新开发利用为导向、以新兴技术为手段实现数智赋能的数智化档案资源服务体系,革新档案资源生产结构、推动档案资源要素优化组合、激发资源开发生产活力,以便提供更加质优、可持续的档案资源开发成果,不断催生档案资源开发新模式、新动能。
ArcGPT是档案智能开发与服务重点实验室主持研发的为实际存档应用程序量身定制的生成式大型语言模型,该模型可通过构建档案领域知识库和档案业务指令数据集进行针对性训练,为用户提供档案知识问答、文档对话、智慧编研、档案密级筛查和开放审核等档案智能化服务。通过引入ArcGPT生成式大型语言模型,开展档案资源智能问答与交互、数据分析与挖掘、个性化服务定制,构建数智化档案资源服务体系,将提升档案管理效率、驱动信息共享与合作、促进智能化决策,推动档案资政服务、公共服务、文化教育能力明显提升,推动档案资源服务体系朝着数智化、便捷化的新阶段迈进。
基于ArcGPT的数智化
档案资源服务体系模型建构
2
“数智化”就是数字化和智能化两个过程或两个层面的有机融合,即“数智化=数字化+智能化”。数字化汇聚了大量数据,形成了从物理世界到虚拟世界的映射,而智能化基于大量数据的智能分析,提供面向问题解决和决策支持的智慧应用服务,其核心在于主体对于作用客体的价值重构和技术赋能。因此,根据数智化档案资源服务体系的参与各要素和运行机制,可以从主体维、功能维、资源维、技术维四个维度来实现个性化、模块化的档案服务模型搭建,基于ArcGPT的数智化档案资源服务体系模型如图1所示。
图1 基于ArcGPT的数智化档案资源服务体系模型
2.1主体维:行动共同体构建
从数智化档案资源服务体系的作用机制上看,作用主体对档案事业与外部环境的响应与调适是数智化档案资源服务模式和服务方向转变的主要内在推动因素。这个作用主体不是个体的档案学者,而是具有共同的档案服务发展目标、专业责任等价值理念以及相关概念、理论、方法论等共识性认识的档案工作者组成的行动共同体。正是行动共同体的求索精神和对档案事业的热爱,档案资源服务体系才得以建立,形成了自己独特的发展特色,不断走向规范化和专业化。
数智化环境下,档案资源服务体系的参与主体更加多元、参与途径更为丰富、作用对象更为广泛。参与主体从档案部门主动作为转向面向信息资源开发利用的全民参与,参与途径从档案编研、档案借阅利用转化为知识应用、主动服务,更为显著的是作用主体逐渐脱离档案载体的束缚走向数字化、信息化、智能化,内容从归档文件转向为全部信息资源。因此,通过形成全领域、跨周期的合作机制,档案服务体系能够汇聚多方智慧和资源,打破信息孤岛,共同推动数智化档案服务的发展,实现资源的共享和优化配置。
2.2功能维:功能模块化设计
根据用户需求和服务场景,数智化档案服务体系将功能进行模块化划分,如可设置档案信息管理、档案知识问答、智慧编研、档案密级筛查和开放审核等模块。每个模块都具备独立的功能和接口,可以根据需要进行组合和定制,从而满足用户的个性化需求。从结果导向上看,功能模块的设置必须覆盖档案数据收集、档案数据处理、档案数据利用、档案数据展示、个性化服务窗口、效果评价与反馈等全周期、各方面,从功能导向上看,高科技、高效能、高质量为主要特征的功能模块必须具有强大的自然语言和理解能力、海量知识抓取和存储功能、档案数据清洗和价值挖掘功能、个性化精准推送和传播能力[4],可以通过通用数据中心构建丰富的机器学习模型,快速发挥ArcGPT各类底层技术支撑作用,集成AI、应用程序和数据,优化客户体验和业务流程,跟踪用户需求并做出及时反馈,以提升客户体验、降低劳动成本。
2.3资源维:资源整合与利用
科技数据、工业信息资产、改革发展档案等档案资源对于政府与企业等有关组织合规管理、投资决策、生产运行的支撑作用越发明显,也对档案知识服务中知识资源的组织、知识产出的质量、知识服务的方式提出了更高要求,助推档案知识服务在能力和质量上加速提升,促使档案信息资源进行增值再利用。新时代档案部门应实现从重保管到重利用、重服务的职能转变,做好信息数据支撑服务,使档案库成为文件库、信息库和知识库。
为此,数智化档案服务体系的首要环节便是建立知识资源库。一方面,需要梳理档案管理与业务发展实际,明确知识使用情况,对现有知识进行盘点、分类以及对重要性进行区分。在此基础上,提出知识需求,编制文件归档范围,制定合理的档案分类体系,确保档案知识资源库长期可持续。另一方面,应加强工作经验和典型工作案例等隐性知识的积累与书面材料形成,建立自身的知识标准体系,明确各项业务工作的知识要素,特别是对于管理与技术咨询得到的专家知识应利用口述档案或者其他载体实现档案化沉淀;对于典型工作案例,业务部门应定期对隐性知识进行识别、提炼与更新,形成相关文件进行归档,档案部门应确保归档知识文件的系统性与规范性。
此外,应明确档案与知识融合管理的目标与原则,将资源分类、知识库建设、应用、保护、更新等知识管理工作流程要求与档案管理八大工作环节规范进行融合,规范统一,构建新的档案知识管理工作模式。推动档案、图书情报、档案、知识产权等知识资源业务集成,构建若干知识集散中心,打破档案管理与文件管理的界限,推动档案工作前移,对知识的来源文件进行全生命周期管理,并对其价值与质量进行专项评估。
2.4技术维:技术应用与创新
基于ArcGPT构建数智化档案资源服务体系,通过对各类档案资源进行数字化处理、整合和分类,构建了一个庞大的数字资源库。用户可以通过系统快速检索和获取所需的档案信息,提升档案资源的利用效率和价值。其关键在于知识图谱、语言模型、机器学习模型、生成式AI等人工智能新兴技术等先进技术的引入、应用和推广,为数智化档案服务体系提供了强大的技术支撑,通过自然语言处理、机器学习等技术,满足智能问答、自动分类、智能推荐等功能,进一步推动知识抽取、知识融合、知识发现等功能的实现。
首先,需要通过分类、关键词提取、实体关系提取、摘要生成、向量嵌入等技术,针对多模态档案数据资源进行知识提取,以此实现文档的智能处理、数据清洗和分析。其次,需要根据实体对齐和个性化业务需求形成数字档案专题知识库,完成数据集成和知识融合。最后,通过自动化工具如自动标记、推理规则等与语言模型相结合,创建和管理知识图谱、数据看板、视频集,推动窗口端的个性化、模块化搭建,揭示数据联系和逻辑,提升内容发现的效率和质量,改善决策、促进创新、提升生产力、降低学习曲线、保留知识、提升客户服务、增强竞争优势、规避风险、促进协作、符合法规、节约成本、促进组织学习,深度推进知识发现。
值得注意的是,数字时代数智化档案服务体系尤其注重使用全景式漫游、虚拟现实展示和沉浸式交互等形式为用户提供丰富的交互体验。ArcGPT语言模型能够通过模拟真实的档案室环境和提供自由的交互操作,让用户仿佛置身于其中。用户可以通过鼠标或触摸屏等设备进行交互操作,进行自由浏览和探索,如放大缩小视图、旋转档案、查看详细信息等,获得更加真实、直观和便捷的档案服务体验。这种交互体验不仅增强了用户的参与感和沉浸感,还使得档案信息的展示更加生动、直观和易于理解。同时,减少了查找和浏览的时间成本,提高了服务效率。
3
基于ArcGPT的数智化
档案资源服务体系实现策略
在推动数智化档案服务的创新与发展过程中,理念重塑、流程再造和技术赋能等策略发挥了重要作用。理念重塑强调以用户为中心,注重服务质量和效率的提升;流程再造通过优化和再造档案服务流程,提高了服务的规范化和自动化水平;技术赋能则依托先进的技术手段,为档案服务提供了强大的技术支持和创新动力。这些策略共同作用于数智化档案服务体系,推动了档案服务的现代化和智能化发展。
3.1理念重塑:树立数智化档案服务创新理念
《规划》指出:“档案事业坚持人民立场。贯彻以人民为中心的发展思想,坚持档案工作为了人民、依靠人民,建设好覆盖人民群众的档案资源体系和方便人民群众的档案利用体系,提高人民群众满意度。”[5]因此,基于ArcGPT的数智化档案资源服务体系必须树立人民主体地位、数智创新服务的建设理念,延伸档案服务领域、提升人民参与度和参与体验,充分实现档案对国家和社会的价值。通过“制度创新+数智赋能”融合优势,持续优化档案服务环境,积极释放政策效能,聚力支持高新技术推动档案资源服务体系的智慧发展、新科技的应用、数据安全的治理和科技成果的转化,推动档案资源服务体系数智化转型和升级产学研一体化发展,更好满足人民群众需求和档案事业发展实际,如百度文心大模型借助AIGC技术,经由海量数据的学习分析,实现了对《富春山居图》高精度的残卷修复,为档案文献遗产数字化修复还原提供了新的思路[6]。
3.2流程再造:打造全周期数智化服务的流程
现代知识服务,更侧重于知识利用效率和效果。为此,全周期数智化档案资源服务体系需集知识获取、数据清洗、知识利用和知识后评价于一体,以提升用户粘性、实现马太效应。第一层是指档案知识的发现,通过构建档案资源知识管理机制以及电子化、数字化和海量抓取存储,建立档案数据资源库。政府部门负责构建立体式的制度政策支持创新体系,优化“技术+文化+治理”环境,推动档案支撑公共决策、人人都是档案员理念深入社会各领域、全方位;政府和企业档案机构承担职能,建立档案资源服务、知识传授和传播机制;社会组织和个人承接部分职能,开展规范化和差异化的档案资政知识传授指导服务活动[7]。第二层是指数据价值的提炼,即“智慧数字化”,运用数字技术,把人从繁杂的劳动中解脱出来,由新兴技术实现档案资源数据的清洗和提炼,如耶鲁大学的“让二战大屠杀受害者发声(Let Them Speak)”项目,通过结合自然语言处理技术,实现了对近3000份大屠杀幸存者所留存下的视听资料、文本证词等材料的数据清洗、价值提炼、文本挖掘与可视化,以此探究档案内容更深层次的语义关联、集体记忆等内容[8]。第三层是指效率应用的赋能,把档案数据的价值落地到应用场景,构成人机深度对话,使机器继承人的某些逻辑和思维,实现深度学习,甚至能启智于人,以智慧为纽带。一方面,应采用基于用户需求的知识获取与存储、业务流程的导航、任务驱动的学习模式以及重塑内容的方法,使用户能够快速、准确地获取所需信息,从而提高学习效果和工作绩效。另一方面,需要建立知识后评价模式,提供知识管理、合作、学习和适应以及监测、评估和学习方面的服务生产和传播的知识影响的指数的框架和方法,旨在衡量产品到达用户后产生的传播范围、参与程度、消费情况、受众感知、价值效果以及对公共政策和运营业务的影响等方面价值与效果。据此不断修正用户服务,解决ArcGPT数智化档案资源服务体系发展面临的挑战、提升ArcGPT数智化档案资源服务体系声誉以及改善运营效率。
3.3技术赋能:构建虚实智能联动的服务平台
数智赋能是指特定组织或系统通过推动智慧数据、知识、人工智能技术等数字资源的深度融合,重构和整合数智类生产要素,从而为利益相关者赋予创新、生产、竞争、科学发现与应用转化等能力,以实现资源的高度整合和高效利用,促进组织系统实现价值共创的一系列活动。新兴技术的应用,配合知识发现、知识创造和知识应用的价值理念,构建出虚实智能联动的服务平台,给新时期的档案知识服务带来了深刻变革和历史性机遇,使档案资源走向前端、走向价值创造。
第一,充分落实档案资源“存量数字化、增量电子化”的要求,加强档案管理系统检索技术的效能,以提升从档案中提取知识的能力,例如全文检索、图像检索。同时,通过知识图谱、数据挖掘、机器学习自然语言处理、智能搜索与智能推荐等人工智能技术与算法的分析与解释能力,推动档案工作从被动向主动,从传统服务向知识服务转变,增强档案管理系统进行知识分析与利用的能力,以此为基础对现有档案知识进行特征识别与建模,实现档案知识结构的重新组织。
第二,充分发挥技术革命作用,使数据增值,提高大数据的效用。数智化的终极目标便是机在人中、人在机中,实现资源在人、机中的高效流转、多模呈现、价值创造。档案服务体系建设可以为数智赋能提供实践场景和数据资源,例如通过对企业生产建设、合规管理、经营运维等方面的记录和管理,为数字化技术的应用提供更多的数据支撑,推动数字化转型和智能化升级,为数智化档案资源服务体系的建设和发展提供更加坚实的基础[9],如中国石油天然气集团有限公司通过新技术的应用,从数字档案管理系统1.0到2.0的跨越。实现9大功能模块、100项二级功能的全面升级,为集团智能化档案服务、深度开发利用等提供了海量档案数据资源支撑[10]。
第三,形成知识产权。档案资源服务走向前端,必须转化为管理体系文件、转化为企业技术标准,拥有一套自己的工作体系与标准并嵌入到用户业务系统,存入知识库或相关系统。为了数智化档案服务体系的可持续,可以在平台集成专家知识分享模块,构建学习型组织,促进专家知识的分享、交流,进一步提升知识创新能力。
4
结语
数智化档案服务体系通过引入ArcGPT,能够优化档案资源要素组合、激发档案资源开发动力、活化档案资源数据要素价值,推动档案资源服务体系现代化与智能化转型、提升档案资源服务的效率与质量、促进档案资源个性化与模块化服务,实现档案资源服务体系的跨越式转型与档案事业高质量发展。未来,随着人工智能技术的更新迭代与数字化转型的不断深入,基于ArcGPT的数智化档案资源服务体系将进一步优化与完善,借助诸如增强现实(AR)、虚拟现实(VR)等创新技术的应用,推动档案资源服务体系朝着数智化、开放化、系统化方向迈进并实现跨越式转型。
作者/娄海婷,孙大东
《档案管理》2024年2期
档
案
管
理
杂志社
官方公众号