双方共同为商务印书馆建设的学术出版专业大模型是国内首个出版领域大语言模型。双方以商务印书馆哲学、历史、法学、经济等上百个垂直领域的大量学术资源构建海量语料数据,进行大模型训练,使大模型的翻译水平达到学术出版级别,较通用大模型在专业书籍的 BLEU提升 30% 以上,满足学术垂直领域的高准确度翻译需求。第四范式投入AI技术和研发资源,打造了高质量AI翻译引擎。先进的生成式技术、语义理解技术、超长文本输入技术能够确保翻译的准确、流畅和一致性。
联合实验室致力于推动学术出版领域的创新与进步,结合双方资源优势,为学术界和出版界提供一流的研究和技术支持,提升学术出版物的翻译质量和效率。研究方向主要集中领域包括:
生成式技术:聚焦学术垂直领域高精度文本数据,通过生成式技术使翻译效率提升。
语义理解技术:对标学术出版译稿质量要求,通过语义理解技术使翻译结果更流畅。
自然语言处理:通过自然语言处理技术,提升学术出版物的语义理解和内容分析能力。
知识图谱构建:构建学术领域专业术语库、语料库及知识图谱。
超长文本输入技术:提升整体翻译结果一致性。
跨学科研究:推动不同学科之间的数据融合应用,促进知识的综合和创新。