准确率提升11.4%!Uni-Finder发布专利侵权判定模块 定义化合物保护范围判定新水准

文摘   科学   2024-11-15 17:18   日本  




前言


在科研和工业领域,正确理解和应用专利信息始终是研究者所关注的话题。尤其是在化学和药物开发领域,准确判断一个化合物是否受现有专利保护,对于避免潜在的专利侵权风险至关重要。然而,传统的专利检索和比对过程繁琐、费时费力,给研发人员带来了巨大的挑战。

为了解决这一问题,深势科技推出了专利侵权判定模块,该应用模块基于自研专利侵权判定智能体 PatentFinder 驱动。借助深势科技自研的科学多模态大模型 Uni-SMART(Universal Science Multimodal Analysis and Research Transformer ),PatentFinder 能够高效、准确地分析特定化合物是否受专利保护。通过考虑分子的骨架和取代基等多种因素,模型可以正确判断出化合物是否属于专利的保护范围,帮助药物研发团队极大地提升研发效率。

解决方案

PatentFinder 框架

PatentFinder 采用群体智能算法解决专利保护判别任务,即通过合理的任务拆解,调度多个智能机器人分别解决小规模的子问题。PatentFinder 配备了由深势科技自研的 Uni-SMART 多模态、结构匹配神经网络等算法,参考人类专家专利进行保护判定的研究范式,执行全自动专利保护判别报告生成。

1.实验结果

下表展示了不同模型在真实世界分子专利数据集中执行专利保护判定下的结果。PatentFinder 在实验室环境下显著优于现有最先进的大语言模型。PatentFinder 判别结果的 F1 Score 相较于 Open-AI 发布的最先进语言模型 GPT-o1 提升了12.5%,平均准确率提升了11.4%。在使用大语言模型进行专利保护判定时,部分语言模型中出现了严重的幻觉现象,倾向于将所有分子都认定为被专利所保护的样本,在实验结果中呈现出正样本召回率 ( TPR ) 虚高、负样本召回率 ( TNR ) 极低的结果。与之相比,PatentFinder 对于正负样本都表现出较强的区分能力,相较于次优方法 TNR 召回率提升了约20%.

功能介绍


Uni-Finder 专利侵权应用模块借助 Markush 解析与多模态大模型技术,比对用户提供的分子结构与指定范围内的专利文献,提供完整的匹配报告以及专利保护结果。主要功能包括:

1. 精准判定专利保护范围

  • 分子专利比对:专利侵权可以根据用户提供的分子和专利,判定分子是否被专利所保护。

  • 核心结构提取:专利侵权能够从专利中抽取核心的 Markush 结构,与待查询分子进行基团比对,并给出详细的分析报告。

  • 关键字段定位:能够定位出原文中决定专利保护的关键字段,帮助用户深入理解专利内容。

2. 多样化的分子输入方式
  • 在线分子绘制:支持用户直接在线绘制分子结构,方便快捷。

  • SMILES 式导入:支持从 SMILES 表达式( Simplified Molecular Input Line Entry System )导入分子,加速输入过程。

  • 分子图片导入:支持从图片导入分子,利用图像识别技术自动解析分子结构。

3. 多渠道的专利文献获取

  • 本地 PDF 上传:支持从本地上传专利PDF,直接进行专利保护判定。

  • 知识库接入:接入用户知识库,可从知识库中导入文献进行分析,拓展资料来源。

  • 多篇专利批量判定:支持同时将分子与多篇专利进行保护判定,大幅提升工作效率。


该应用模块的诞生,为化学和药物研发人员提供了强大的工具,简化了专利分析流程,降低了侵权风险。借助专利侵权,研发团队能够专注于创新,加速产品的研发和上市进程。

案例展示


1.创建保护检验任务

点击产品首页的新建侵权查询按钮,即可。

2.多种数据导入方式
专利侵权支持多种分子输入方式,如交互式分子绘制工具、SMILES 式导入、从图片导入。

专利侵权支持多种文献导入方式,如从知识库导入专利,从文件导入专利。

3.专利保护判别报告查询

专利保护判别报告会被记录在产品主页。用户可以点击查询记录右侧的详情按钮查看解析明细。
在解析明细页面,可以看到保护判定的判别结果,点击解析详情查看解析报告。
解析报告中,可以看到文献信息、判断依据等内容

总结


Uni-Finder 专利侵权功能的发布标志着深势科技在化学和药物研发领域专利分析工具的一大步进。该工具简化了传统的专利分析流程,将专利保护判定准确率提升了11.4%,显著降低了研发过程中的侵权风险。通过集成多模态大模型 Uni-SMART,专利侵权能够迅速准确地判断化合物的专利保护范围,提供详尽的匹配报告和专利保护结果。未来,深势科技将继续优化专利侵权机器人,支持更广泛的专利文献来源,进一步提升工具的准确性和用户体验。我们致力于为化学与药物研发团队提供强大的支持,助力他们在科研道路上更加自信地迈进。

参考资料

  1. 多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告

  2. Uni-SMART: Universal Science Multimodal Analysis and Research Transformer

关于深势科技

深势科技是全球AI for Science领导者,AI for Science 即运用 AI 学习一系列的科学原理和科学知识,并进一步解决科学研究和工业研发领域的关键问题。
依托在交叉学科领域的深耕,构建了“深势·宇知”AI for Science大模型体系,并进一步解决科学研究和工业研发领域的关键问题,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”,形成了AI for Science的“创新-落地”链路和开放生态,构建了基于AI for Science的微尺度工业基础设施,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业设计与仿真系统。

深势科技是国家高新技术企业、国家专精特新“小巨人”企业,在北京、上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过35%。核心成员获得过2020年全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。

深势科技 DP Technology
深势科技致力于运用人工智能和多尺度的模拟仿真算法,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。
 最新文章