多人谈 | 王斌:大语言模型促进语言应用开发的四个维度

学术   2024-09-24 17:14   北京  

2024年第5期



“大语言模型”多人谈


本期嘉宾

王 斌

小米科技有限责任公司人工智能实验室主任、NLP首席科学家


大语言模型促进语言应用开发的四个维度

 一、大语言模型是语言学研究的全新利器。大语言模型基于海量语言数据进行训练,能够有效处理和分析大规模语料库,为语言学研究提供新的方法和工具。传统语言学研究通常依赖于小规模的语料库和定性分析,而大语言模型能够在短时间内处理和分析海量的语言数据,从中发现语言现象和规律。例如,通过大语言模型对大量文本数据的分析,可以研究语言的演变、方言的分布以及语言之间的相互影响。

二、利用大语言模型构建自动化语言分析工具。在大语言模型基础上可以构建词法分析器、句法分析器和语义分析器等工具。基于大语言模型构建这些工具的难度小,但是构建的工具的精度高。这些工具可以辅助语言学家进行语言结构的分析,从而大大提高研究效率。例如,基于大模型构建出的语义分析器,可以帮助研究人员深入理解词汇和句子的意义,从而进一步揭示语言的深层结构。

三、利用大语言模型来构建或扩展语言资源。传统的手工或者自动构建词典、语料库、知识图谱等资源的方法效率低下、精度有限,构建出的资源分布相对单一。而大语言模型可以自动标注大规模的语料库,从而大大减少人工标注的工作量,提高语料库建设的效率和精度。同时,大语言模型基于大量语言文本数据预训练微调而成,蕴含着大量实例背后的通用结构。基于大语言模型,可以快速、准确地生成多样化的语言实例,从而大大丰富语言学的研究内容,提升研究效率。

四、大语言模型可以为语言学研究开辟新的方向。大语言模型基于极大规模的语言文本数据预训练微调而成,这些数据来源分散、风格各异、时代不一、语种多样,里面包含着大量的语言现象,也隐含着丰富的语言学规律。基于大语言模型,可以衍生出一些以往难以想象的研究问题,或者使得一些挑战性的研究问题变得可行。例如,大语言模型能够生成大量的自然语言文本,这为研究语言的创造性提供了新的可能。研究人员可以探索语言创造性的机制,揭示语言创新的认知过程。

 

该文发表于《语言战略研究》2024年第5期,引用请以期刊版为准,转发请注明来源。

编排:韩   畅

审稿:王   飙 余桂林

相关推荐

《语言战略研究》入选为CSSCI(2023—2024)来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

主持人语丨杨尔弘,胡韧奋:大语言模型与语言研究的双向赋能与融合发展

詹卫东,孙春晖,肖力铭:语言学知识驱动的空间语义理解能力评测数据集研究

李绅,胡韧奋,王立军:古汉语大语言模型的构建及应用研究

杨尔弘等:大语言模型的中文文本简化能力研究

多人谈丨韩先培:迫切需要探索大语言模型的语言与知识机理

多人谈丨李涓子:大语言模型知识认知能力的存在问题与提升路径

多人谈丨刘鹏远:重视大语言模型对价值认知的重塑,防范国家意识形态相关风险

多人谈 | 刘知远:大语言模型推动人工智能的智能涌现


《语言战略研究》2024年第5期目录与提要

《语言战略研究》2024年第4期目录与提要

《语言战略研究》2024年第3期目录与提要

《语言战略研究》2024年第2期目录与提要

《语言战略研究》2024年第1期目录与提要

约稿启事丨“国际中文教育”专题(每年一期)

约稿启事丨“汉语哲学”专题(每年一期)

约稿启事丨“全球视野下的闽粤客方言流布史”专题

约稿启事丨“语言文字法治问题”专题

约稿启事丨“边境语言能力”专题


本刊从未与任何第三方合作从事征稿、审稿及发稿活动

从不以任何形式收取版面费、审稿费

请认准本刊官方网站界面→

编辑部联系方式 

电话:010-65219062,010-65219060    

电子邮箱:yyzlyj@cp.com.cn

地址:北京市东城区王府井大街36号    

投稿网址:yyzlyj.cp.com.cn

订阅方式 

1.全国各地邮局订阅,邮发代号:82-104.    

2.网店订阅:

(1)商务印书馆官方微店  (关注商务印书馆微信公众号;点击公众号页面底部的“官方微店”;在微店中搜索“语言战略研究”即可下单)

(2)商务印书馆京东旗舰店 (登录旗舰店,搜索“语言战略研究”即可下单)   

3.中国邮政—微商城(微商城中搜索“语言战略研究”,即可预订全年)

↓↓↓点击“阅读原文”可访问本刊官网

语言战略研究
《语言战略研究》是我国第一份以语言政策和语言规划为主要内容的专业学术期刊,于2016年1月正式创刊。该刊由国家语言文字工作委员会指导,中国语言学会语言政策与规划研究会学术支持,商务印书馆主办出版。主编李宇明教授,执行主编郭熙教授。
 最新文章