前言
在科研和工业领域,正确理解和应用专利信息始终是研究者所关注的话题。尤其是在化学和药物开发领域,准确判断一个化合物是否受现有专利保护,对于避免潜在的专利侵权风险至关重要。然而,传统的专利检索和比对过程繁琐、费时费力,给研发人员带来了巨大的挑战。
为了解决这一问题,深势科技推出了专利侵权判定模块,该应用模块基于自研专利侵权判定智能体 PatentFinder 驱动。借助深势科技自研的科学多模态大模型 Uni-SMART(Universal Science Multimodal Analysis and Research Transformer ),PatentFinder 能够高效、准确地分析特定化合物是否受专利保护。通过考虑分子的骨架和取代基等多种因素,模型可以正确判断出化合物是否属于专利的保护范围,帮助药物研发团队极大地提升研发效率。
解决方案
PatentFinder 框架
PatentFinder 采用群体智能算法解决专利保护判别任务,即通过合理的任务拆解,调度多个智能机器人分别解决小规模的子问题。PatentFinder 配备了由深势科技自研的 Uni-SMART 多模态、结构匹配神经网络等算法,参考人类专家专利进行保护判定的研究范式,执行全自动专利保护判别报告生成。
1.实验结果
下表展示了不同模型在真实世界分子专利数据集中执行专利保护判定下的结果。PatentFinder 在实验室环境下显著优于现有最先进的大语言模型。PatentFinder 判别结果的 F1 Score 相较于 Open-AI 发布的最先进语言模型 GPT-o1 提升了12.5%,平均准确率提升了11.4%。在使用大语言模型进行专利保护判定时,部分语言模型中出现了严重的幻觉现象,倾向于将所有分子都认定为被专利所保护的样本,在实验结果中呈现出正样本召回率 ( TPR ) 虚高、负样本召回率 ( TNR ) 极低的结果。与之相比,PatentFinder 对于正负样本都表现出较强的区分能力,相较于次优方法 TNR 召回率提升了约20%.
功能介绍
1. 精准判定专利保护范围
分子专利比对:专利侵权可以根据用户提供的分子和专利,判定分子是否被专利所保护。
核心结构提取:专利侵权能够从专利中抽取核心的 Markush 结构,与待查询分子进行基团比对,并给出详细的分析报告。
关键字段定位:能够定位出原文中决定专利保护的关键字段,帮助用户深入理解专利内容。
在线分子绘制:支持用户直接在线绘制分子结构,方便快捷。
SMILES 式导入:支持从 SMILES 表达式( Simplified Molecular Input Line Entry System )导入分子,加速输入过程。
分子图片导入:支持从图片导入分子,利用图像识别技术自动解析分子结构。
3. 多渠道的专利文献获取
本地 PDF 上传:支持从本地上传专利PDF,直接进行专利保护判定。
知识库接入:接入用户知识库,可从知识库中导入文献进行分析,拓展资料来源。
多篇专利批量判定:支持同时将分子与多篇专利进行保护判定,大幅提升工作效率。
该应用模块的诞生,为化学和药物研发人员提供了强大的工具,简化了专利分析流程,降低了侵权风险。借助专利侵权,研发团队能够专注于创新,加速产品的研发和上市进程。
案例展示
1.创建保护检验任务
3.专利保护判别报告查询
总结
Uni-Finder 专利侵权功能的发布标志着深势科技在化学和药物研发领域专利分析工具的一大步进。该工具简化了传统的专利分析流程,将专利保护判定准确率提升了11.4%,显著降低了研发过程中的侵权风险。通过集成多模态大模型 Uni-SMART,专利侵权能够迅速准确地判断化合物的专利保护范围,提供详尽的匹配报告和专利保护结果。未来,深势科技将继续优化专利侵权机器人,支持更广泛的专利文献来源,进一步提升工具的准确性和用户体验。我们致力于为化学与药物研发团队提供强大的支持,助力他们在科研道路上更加自信地迈进。
参考资料
Uni-SMART: Universal Science Multimodal Analysis and Research Transformer
关于深势科技
深势科技是国家高新技术企业、国家专精特新“小巨人”企业,在北京、上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过35%。核心成员获得过2020年全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。