专著推荐 | 《构建和使用可比语料库:实现多语自然语言处理》(2024年新书)

学术   2024-10-27 08:01   河南  


WGRADUATION

点击蓝字 关注我们



书名

Building and Using Comparable Corpora for Multilingual Natural Language Processing

主题词:语料库翻译学;人工智能;GPT; 语料库

ISBN978-3-031-31386-8

出版社:Springer

出版时间:2024

作者

Serge Sharoff, Ph.D.,  is Professor of Language Technology and Digital Humanities at the Centre for Translation Studies, University of Leeds. His research focuses on Natural Language Processing, including automated methods for collecting very large corpora from the Web, their analysis in terms of domains, genres or text quality, as well as extraction of lexicons and terminology from corpora. The application domains for this kind of research in the Digital Humanities include text annotation, information retrieval, machine translation and computer-assisted language learning. His research stresses the inherent multilingualism of NLP, which implies that tools and resources can be ported across languages by paying attention to the respective linguistic properties.

Pierre Zweigenbaum, Ph.D., FACMI, FIAHSI, is a Senior Researcher at the Interdisciplinary Laboratory for Digital Sciences (LISN, Orsay, France), a laboratory of the French National Center forScientific Research (CNRS) and Université Paris-Saclay, where he has led the ILES Natural Language Processing group. Before CNRS he was a researcher at Paris Public Hospitals in an Inserm team. He also was a part-time professor at the National Institute for Oriental Languages and Civilizations.  His research focus is Natural Language Processing, with medicine as a main application domain. He has also designed methods to acquire linguistic knowledge automatically from corpora and thesauri, to help extend monolingual and bilingual lexicons and terminologies, using parallel and comparable corpora.

Reinhard Rapp, Ph.D., is Professor of Applied Translation Studies at Magdeburg-Stendal University of Applied Sciences and is also affiliated with the University of Mainz. He has conducted EU-funded research projects at the University of Geneva, the University of Tarragona, the University of Leeds, at Aix-Marseille University, at the University of Mainz and at the Athena Research Center in Athens. His main research interests are in computational linguistics, translation studies and cognitive science. His publications have dealt with unsupervised language learning from text corpora, word sense disambiguation, text mining, thesaurus construction, bilingual dictionary induction from parallel and comparable corpora, and with statistical and neural machine translation. 

扫码购买


本公众号与国际知名出版社合作推广原版进口著作,所谓“专著”指的是专业著作,而非是狭义的作者专著。我们不推广电子书,谴责一些侵权行为。所有著作价格都涵盖书费、国际物流、报关等一揽子费用在内。国际物流9周正常时间。支持对公转账,下单3个工作日开电子发票。如需私人定制询价联系王老师13501892122


推荐语


This book provides a comprehensive overview of methods to build comparable corpora and of their applications, including machine translation, cross-lingual transfer, and various kinds of multilingual natural language processing. The authors begin with a brief history on the topic followed by a comparison to parallel resources and an explanation of why comparable corpora have become more widely used. In particular, they provide the basis for the multilingual capabilities of pre-trained models, such as BERT or GPT. The book then focuses on building comparable corpora, aligning their sentences to create a database of suitable translations, and using these sentence translations to produce dictionaries and term banks. Then, it is explained how comparable corpora can be used to build machine translation engines and to develop a wide variety of multilingual applications.
本书全面概述了构建可比语料库的方法及其应用,包括机器翻译、跨语言迁移和各种多语言自然语言处理。作者首先简要介绍了该主题的历史,然后与平行资源进行了比较,并解释了为什么类似的语料库得到了更广泛的使用。特别是,它们为预训练模型(如 BERT 或 GPT)的多语言功能提供了基础。然后,本书的重点是构建可比语料库,对齐他们的句子以创建一个合适的翻译数据库,并使用这些句子翻译来生成词典和术语库。然后,解释了如何使用类似的语料库来构建机器翻译引擎和开发各种多语言应用程序。


本书目


研究方法提升 

扫码学习 免费回放

近期录播与直播网课推荐







原版进口著作推荐

应用语言学

专著推荐 | 《应用语言学的叙事研究方法》(2024年新书)
专著推荐 | Cognitive and Educational Psychology for TESOL(2024年新书)
专著推荐 | Vocabulary, Corpus and Language Teaching(2024年新书)
专著推荐 | 《二语习得中的语言使用:批判性反思与未来展望》(2024年新书)
专著推荐 | 《外语教师教育的反思性工具、技巧与策略》(2024年新书)
专著推荐 | 《二语数字多模态写作能力评估》(2024年新书)
专著推荐 | 《视听输入与二语学习》(2024年新书)
专著推荐 | 生成式二语习得研究方法导论(2024年新书)
专著推荐 | 《语言教师身份与幸福》(2024年新书)
专著推荐 | 《何以培养语言技能?生成式AI与机器学习在语言学习及译者培训中的应用》(2024年新书)
专著推荐 | 《亚洲语境中学习英语之外的外语:多语自我和学习动机》(2024年新书)
专著推荐 | 数字多模态作文:第二语言习得理论、研究与实践的结合(2024年新书)
专著推荐 | 数字人文看世界 Digital Humanities Looking at the World (2024年新书)
专著推荐 | 《数字空间中的对话分析语言教师教育》
专著推荐 | 《多模态会话分析与解释现象学分析:研究超语、多语课堂话语的方法论框架》
专著推荐 | 《语言学习、数字沟通与海外学习:跨地域背景下的身份和归属感》  (2024年新书)
专著推荐 | 基于内容的语言教学法何以促进语言教师发展?Teacher Development for Content-Based Language Education
专著推荐 | Knowledge-Making from a Postgraduate Writers' Circle
专著推荐 | 学术英语研究 English for Academic Purposes(2024年新书)
专著推荐 | 徐浩《语言教师社会认知》(2024年新书)
专著推荐 | 《二语教师专业发展》Second Language Teacher Professional Development
专著推荐 | 如何让英语课堂栩栩如生?(2024年新书)
专著推荐 | 《二语写作教师教育与专业发展》(2024年新书)
专著推荐 | 美国的世界语言教师的信念与经验
专著推荐 | 《三语学习者的阅读概念、教育和教学领域》
专著推荐 | 《语言社区的连贯性:有序的异质性与社会意义》Routledge
专著推荐 | 《应用语言学非常用研究方法》(2024年新书)
专著推荐 | 语言课程设计经典读本:《劳特利奇语言教育与课程设计手册》
专著推荐 | 《整合二语课堂的电子档案袋:面向未来的教育》
专著推荐 | 为语言教学开发教材Developing Materials for Language Teaching
专著推荐 | 《如何研究二语写作过程》(2023年新书)
专著推荐 | 多语言课堂的跨文化教学法:应对理论和实践中不断变化的现实 (2023年新书)
专著推荐 | 用于语言教学的语料库:弥合研究与实践的鸿沟(2024年新书)

话语分析与理论语言学

专著推荐 | Discourse Analysis 第三版(2024年新书)

专著推荐 | 如何用语用学研究医疗健康沟通话语

专著推荐 | 《语篇分析的定量研究:如何用 作复制研究?》(2024年新书)

专著推荐 | 《功能语言学:理论假说与实证依据》

专著推荐 | Doing Corpus Linguistics(2024年新书)

专著推荐 | 《批评社会语言学方法论》Critical Sociolinguistic Research Methods(2024年新书)

专著推荐 | 语用学与系统功能语言学的界面研究:礼貌研究新解

专著推荐 | 《话语分析:实用导论》(2024年新书)

专著推荐 | AI for Communication(2024年新书)

专著推荐 | 《对比语言学的构式与认知解读》(2024年新书)

专著推荐 | 如何用话语研究民粹主义政治?(2024年批评话语分析新书)

专著推荐 | 《解读大型社交媒体语料库》

专著推荐 | 《揭开虚假新闻与谣传信息的符号学代码》 (2024年新书)

专著推荐 | 《解读政治话语中与隐喻相关的介词》 (2024年新书)

专著推荐 | Vocabulary, Corpus and Language Teaching(2024年新书)

专著推荐 | 《AI生成的流行文化:一个符号学视角》(2024年新书)

专著推荐 | Language and Mediated Masculinities (男性气质的跨语言文化媒介的批评话语分析)

专著推荐 | Advancing Language Research through Q Methodology(新书)

专著推荐 | 认知语义学(2024年新书)

专著推荐 | A Typological Study of the Existential Clause (2024年新书)

专著推荐 | 认知语言学视野下的谚语研究Proverbs within Cognitive Linguistics (2024年新书)

专著推荐 | Advancing Language Research through Q Methodology(新书)

专著推荐 | 麦克·尤恩小说中的(不)礼貌:文学语用文体学

专著推荐 | 如何用认知修辞学研究《庄子》?

专著推荐 | 文体学经典读本:Explorations in Stylistics

专著推荐 | 对比语言学的构式与认知研究

专著推荐 | 《就业能力的语言:基于语料库的英国大学网站分析》

专著推荐 | Cultural Linguistics and Critical Discourse Studies

专著推荐 | Literary Digital Stylistics in Translation Studies

专著推荐 | Discursive Mediation in Translation

专著推荐 | 施旭 The Routledge Handbook of Cultural Discourse Studies

专著推荐 | Data Analytics for Discourse Analysis with Python

专著推荐 | 批评会话分析Critical Conversation Analysis(2024年新书)

专著推荐 | 方志辉教授 Demystifying Academic English 系列读本

专著推荐 | 《礼貌研究方法论》

专著推荐 | Interfaces and Features in Second Language Acquisition

专著推荐 | Francisco Yus《网络幽默的语用研究》

专著推荐 | 《认知和沟通干预:语言病理学家的神经科学应用》

专著推荐 | Cognitive Communication Disorders (医学语言学系列2024年新书)

专著推荐 | Doing Corpus Linguistics(2024年新书)

专著推荐 | 互动语用学(经典读本)

专著推荐 | 语言教学与研究的语料库应用研究 (2023年新书)

专著推荐 | 语料库在跨语言研究中的应用为教学、翻译和专业交流铺平道路(2023年)

专著推荐 | 用大数据探索语言与社会跨越时空的议会话语(2023年)

专著推荐 | Photography in Children's Literature (2023年新书)

专著推荐 | Text and Wine: Approaches from terminology and translation

专著推荐 | 会话分析(2024年新书与经典读本推荐)

专著推荐 | For F*ck's Sake《为什么脏话惊人,粗鲁又有趣?》 (牛津新书)

专著推荐 | Redoing Linguistic Worlds: Unmaking Gender Binaries

专著推荐 | Linguistic and Extralinguistic in Interaction

专著推荐 | 新媒体、数字话语分析的国际新发展

专著推荐 | A Systemic Functional Typology of MOOD

专著推荐 | Advances in Sign Language Corpus Linguistics

专著推荐 | Stylistics: text, cognition and corpora

专著推荐 | 语言教学中的语用学 Pragmatics in Language Teaching

专著推荐 | Evaluation Across Newspaper Genres(另附作者讲座视频)

不当你的世界  只作你的肩膀

语言学通讯、翻译学通讯

请留下你指尖的温度

让太阳拥抱你

助力您的语言学习、教学、科研

点个在看,为运动健儿喝彩

语言学通讯
欢迎关注语言学通讯、翻译学通讯两个公众号。18万学者关注了我们,本号主要发布国内外语言学、翻译学、文学相关的会议讲座、1教师研修、专著推荐、期刊动态等。投稿和业务合作请联系 dianzishu@126.co
 最新文章