2024年,中科闻歌聚焦高质量、高价值人工智能专利布局,申请专利50余项,37项发明专利获国家知识产权局批准授权,覆盖大模型基础技术、多模态融合、计算机视觉、深度语义理解、领域AI工程实践等方向,涵盖人工智能技术从理论到应用的完整创新链路,进一步增强公司自主创新产品的知识产权优势,完善知识产权保护体系。
2024 授权发明专利摘要(部分)
PART 1
大模型基础技术
01. 一种多模态大型语言模型训练方法、电子设备及存储介质
本发明提出了一种多模态大语言模型训练方法,通过图文对齐模型和大型语言模型的训练,处理自然图像、文档、表格和图表等多种数据。通过对图像中的区域进行精准定位,提升模型在复杂数据场景中的理解与应用能力。
02. 一种多模态大模型训练策略确定方法、电子设备及介质
本发明提供了一种通过比较一阶段和两阶段训练策略性能参数,确定最佳训练策略的方法。该方法优化了多模态大模型的训练过程,确保选择最优的训练方案,提升模型性能。
03. 面向大语言模型的词向量生成方法、电子设备及存储介质
本发明提供了一种高效的词向量生成方法,通过将相邻词组合视为一个词,压缩分词长度,并使用张量积组合不同词的特征向量,显著降低可训练参数量,提高词向量生成效率。
04. 标注数据处理方法和装置、电子设备、计算机存储介质
本发明通过筛选不重复的标注数据,结合大模型处理,提升数据标注效率。基于内容问题类型和多模型处理,实现高效且准确的标注数据集生成,优化自然语言处理任务。
PART 2
多模态融合技术
01. 基于语音驱动和人脸自驱动的虚拟人视频合成方法
本发明通过口型驱动和人脸图像自驱动技术,实现高精度虚拟人视频合成,可高清还原虚拟人的唇形与发音吻合,且无需额外训练即可快速迁移新人物形象。
02. 实时问答虚拟人视频生成方法、电子设备及存储介质
本发明将音频与场景视频结合,通过提取音频特征和人脸关键点,合成匹配口型与音频的视频,显著提升虚拟人视频制作效率。
PART 3
计算机视觉技术
01. 针对包含边框的视频拷贝检测方法及装置
本发明通过关键帧提取与边缘检测,识别视频中的拷贝片段,结合图像特征索引技术,精确检测视频拷贝并定位其原始位置,提高视频版权保护的准确性。
02. 图片匹配方法、装置、电子设备以及存储介质
本发明通过文本特征与图片特征匹配,自动为文本选择合适图片,提升内容呈现的质量和读者体验。模型基于预训练的特征提取模型,优化了文本配图的效率与准确性。
03. 一种智能裁剪视频的方法及存储介质
本发明利用目标视频对象信息,基于预设规则和优先级进行智能裁剪,支持从横屏到竖屏的动态视频剪裁,提高视频内容展示的灵活性与用户体验。
PART 4
深度语义理解技术
01. 基于集成学习的命名实体识别方法、装置、设备和介质
本发明通过集成多个基学习器,实现命名实体识别模型的高效性和准确性。每个基学习器根据权重对文本进行处理,最终输出优化的识别结果,降低了模型复杂度和耗时。
02. 一种基于端到端模型训练的智能地址识别方法及装置
本发明通过端到端模型训练,优化了地址文本的识别过程。模型通过调整多个子模型的误差,减少误差累积,提高了地址识别的精度和效率。
03. 语义情绪识别方法、装置、设备及存储介质
本发明通过结合全局语义信息与词向量矩阵,识别文本的情绪类别,考虑到了语义信息、词义和句子情绪,显著提高了情绪识别的准确度。
PART 5
领域AI工程实践
01. 基于BERT的媒体信息观点抽取方法、装置、设备和存储介质
本发明利用BERT模型对命名实体及其观点进行抽取,减少人工工作量,提高信息抽取的准确性。通过识别命名实体及其观点,优化媒体信息分析的效率。
02. 公共卫生安全事件检测及事件集合构建方法及系统
本发明通过事件检测与主题信息更新,提高了互联网新闻流数据的检测效率。构建事件集合并实时更新,有效提升公共卫生安全事件的监测能力。
03. 金融风险线索确定方法、装置、设备和介质
本发明基于词向量和文本分类技术,快速识别金融文本中的违规行为,通过提高分类速度和精度,优化了金融风险线索的检测流程。
04. 一种面向复杂网络环境的高性能区块链共识方法
本发明通过异步区块传输和流式执行协议,优化了大规模网络环境下的区块链共识性能,确保低延迟和高性能,适应复杂网络环境。
授权专利列表
2024授权发明专利证书(部分)