2024年6月世界知识产权组织发布了《生成式人工智能专利和科学出版物报告》。报告指出,自2017年以来,GenAI领域的专利和科学出版物数量大幅增长,表明该技术正处于快速发展阶段。腾讯、平安保险集团和百度是拥有最多GenAI专利的公司,而中国科学院则在科学出版物数量上领先。中国是GenAI技术研发的主要国家,其次是美国、韩国、日本和印度。报告还分析了GenAI的不同模型、模式和应用领域。生成对抗网络(GANs)、变分自编码器(VAEs)和解码器式大型语言模型(LLMs)是三种主要的GenAI模型,而图像/视频、文本和语音/声音/音乐是最常见的GenAI模式。GenAI的应用领域非常广泛,包括软件、生命科学、文档管理和发布、商业解决方案、工业和制造业、交通运输、安全和电信等。
一、GenAI简介
GenAI 技术正在迅速发展,并将在各个领域产生深远的影响。这份报告为理解和分析 GenAI 技术的专利和科学研究活动提供了宝贵的参考,并有助于我们更好地理解和应对 GenAI 带来的机遇和挑战。
(一)GenAI 的历史和发展背景
GenAI 并非新鲜事物,其根源可以追溯到 20 世纪 50 年代和 60 年代的早期人工智能研究。然而,真正推动 GenAI 发展的是深度学习和神经网络技术的进步。深度学习利用多层神经网络,能够从海量数据中学习并生成新的内容,例如图像、文本、音频和视频。近年来,Transformer 架构的出现进一步推动了 LLM(大型语言模型)的发展,使其能够生成连贯、上下文相关的文本,并应用于各种自然语言处理任务。
(二)深度学习和判别性任务与生成性任务
深度学习可以应用于两种类型的任务:判别性任务和生成性任务。
判别性任务:涉及对输入数据的分类或识别,例如图像识别、文本分类等。
生成性任务:涉及创建新的数据样本,例如图像生成、文本生成等。
(三)GenAI 模型的类型和主要特点
GenAI 模型种类繁多,主要包括:
生成对抗网络(GAN):由生成器和判别器组成,两者相互竞争以生成更逼真的图像。
基于解码器的大型语言模型(LLM):例如 GPT-3 和 ChatGPT,能够生成连贯、上下文相关的文本。
变分自编码器(VAE):能够将输入数据压缩为低维表示,并用于生成新的数据样本。
扩散模型:通过逐步去除噪声来生成新的图像或音频。
自回归模型:通过预测序列中的下一个元素来生成新的数据样本。
(四)GenAI 模式和数据类型
GenAI 模型可以处理多种类型的输入和输出数据,例如:
图像/视频:用于图像生成、图像编辑、图像识别等。
文本:用于文本生成、文本摘要、机器翻译等。
语音/声音/音乐:用于语音合成、音乐生成、语音识别等。
代码:用于代码生成、代码补全等。
分子/基因/蛋白质:用于药物发现、蛋白质结构预测等。
3D 图像模型:用于 3D 场景生成、虚拟现实等。
(五)GenAI 软件和开源模型
GenAI 技术的发展也伴随着软件和开源模型的兴起。例如,OpenAI 的 GPT-3 和 GPT-4 是最著名的 LLM,而谷歌的 BARD 和 Meta 的 LLaMA 2 和 3 是其他重要的开源模型。开源模型的优势在于其透明度和可扩展性,但同时也存在安全和知识产权等方面的风险。
二、全球专利和研究总体情况
GenAI 领域的专利和科学研究活动呈现出蓬勃发展态势,反映着该技术的快速进步和应用潜力的不断扩展。中国和美国在 GenAI 专利数量和科学研究方面占据领先地位,亚洲国家和欧洲国家也积极参与其中。GenAI 技术的应用领域不断扩展,包括软件、生命科学、文档管理/发布、商业解决方案、工业和制造、交通、安全、电信等。随着 GenAI 技术的不断发展,我们可以期待其在各个领域产生更大的影响。
(一)专利和科学出版物数量的增长
自 2017 年 Transformer 架构引入以来,GenAI 专利数量呈现爆发式增长。2014 年,GenAI 专利家族数量仅为 733 个,而到了 2023 年,这一数字已超过 14,000 个,增长了超过 800%。与此同时,GenAI 相关的科学出版物数量也呈现指数级增长,从 2014 年的 116 篇增加到 2023 年的超过 34,000 篇,其中 2023 年发表的论文数量占总数的 45% 以上。这表明,GenAI 技术的进步引发了大量研究活动,并吸引了众多企业和研究机构的参与。
(二)主要专利拥有者
在 GenAI 专利数量方面,中国企业占据领先地位,其中腾讯、平安保险集团和百度位列前三。腾讯利用其 LLM“混元”将 AI 能力集成到其核心产品中,例如微信,以提升用户体验。平安保险则专注于开发用于保险核保和风险评估的 GenAI 模型。百度是 GenAI 领域的早期参与者,最近推出了基于 LLM 的 AI 聊天机器人 ERNIE 4.0。中国其他科技巨头,如阿里巴巴和字节跳动,也位列 GenAI 专利拥有者前十名。
美国企业在 GenAI 专利数量方面同样占据重要地位,其中 IBM、谷歌和微软位居前列。IBM 开发了 GenAI 平台 watsonx,使企业能够部署和定制 LLM,并专注于数据安全和合规性。谷歌的 AI 子公司 DeepMind 最近发布了最新的 LLM 模型 Gemini,并将其逐渐整合到谷歌的产品和服务中。微软也是 GenAI 的重要参与者,并投资了 OpenAI。
(三)主要发明者所在地
中国是 GenAI 专利数量最多的国家,2014 年至 2023 年期间,中国发明者负责了超过 38,000 个专利家族。美国是 GenAI 研究的第二大国家,拥有约 6,300 个专利家族。韩国、日本、印度、英国和德国等亚洲国家和欧洲国家也是 GenAI 研究的重要中心。
(四)主要专利申请地
中国不仅是 GenAI 专利数量最多的发明者所在地,也是 GenAI 专利申请最多的国家。2014 年至 2023 年期间,中国在 GenAI 领域申请了超过 40,000 个专利家族。美国是 GenAI 专利申请的第二大国,拥有超过 10,700 个专利家族。WIPO(PCT)和欧洲专利局(EP)也是 GenAI 发明者寻求专利保护的重要途径。
三、GenAI 模型专利趋势
GenAI 模型种类繁多,每种模型都有其独特的特点和优势。GAN 专利数量最多,但增长速度有所放缓,而 LLM 和扩散模型专利增长速度明显加快。中国和美国在 GenAI 模型专利方面占据领先地位,亚洲国家和欧洲国家也积极参与其中。随着 GenAI 技术的不断发展,我们可以期待更多新的模型和应用的出现。
(一)主要 GenAI 模型
生成对抗网络(GAN):GAN 由生成器和判别器组成,两者相互竞争以生成更逼真的图像。GAN 在图像生成、图像编辑、图像风格转换等任务中表现出色。
基于解码器的大型语言模型(LLM):LLM 能够生成连贯、上下文相关的文本,并应用于各种自然语言处理任务,例如文本生成、文本摘要、机器翻译、对话系统等。近年来,LLM 的性能取得了显著提升,例如 GPT-3 和 ChatGPT 等模型的推出。
变分自编码器(VAE):VAE 能够将输入数据压缩为低维表示,并用于生成新的数据样本。VAE 在图像生成、图像风格转换、数据压缩等任务中表现出色。
扩散模型:扩散模型通过逐步去除噪声来生成新的图像或音频。扩散模型在图像生成、音频生成、视频生成等任务中表现出色。
自回归模型:自回归模型通过预测序列中的下一个元素来生成新的数据样本。自回归模型在文本生成、语音生成、音乐生成等任务中表现出色。
(二)专利数量和增长趋势
GAN:GAN 专利数量最多,2014 年至 2023 年期间,GAN 专利家族数量从 2,400 个增长到 9,700 个,增长最为强劲。然而,近年来 GAN 专利增长速度有所放缓。
VAE:VAE 专利数量位居第二,2014 年至 2023 年期间,VAE 专利家族数量从 800 个增长到 1,800 个。
LLM:LLM 专利数量位居第三,2014 年至 2023 年期间,LLM 专利家族数量从 500 个增长到 1,300 个。近年来,LLM 专利增长速度明显加快,这得益于 ChatGPT 等聊天机器人的成功。
扩散模型:扩散模型专利数量增长迅速,2020 年至 2023 年期间,扩散模型专利家族数量从 18 个增长到 441 个。
自回归模型:自回归模型专利增长速度相对较慢,2014 年至 2023 年期间,自回归模型专利家族数量从 500 个增长到 1,000 个。
(三)主要专利拥有者
腾讯:在 LLM 专利方面位居全球第一,在 GAN 和扩散模型专利方面也处于领先地位。
平安保险集团:拥有全面的 GenAI 专利组合,涵盖了 GAN、LLM、VAE、扩散模型和自回归模型等。
百度:在 LLM 和扩散模型专利方面处于领先地位,在 GAN 专利方面也拥有大量专利。
IBM:在 VAE 专利方面位居全球第一,在 GAN 专利方面也处于领先地位。
谷歌:在 LLM 专利方面增长迅速,在 VAE 专利方面也处于领先地位。
(四)主要发明者所在地
中国:在所有 GenAI 模型专利方面都占据领先地位,其中 GAN、VAE 和自回归模型专利数量最多。
美国:在 VAE 和 LLM 专利方面处于领先地位,在 GAN 和扩散模型专利方面也拥有大量专利。
韩国:在 GAN 专利方面处于领先地位。
日本:在 GAN 和 VAE 专利方面拥有大量专利,但在 LLM 专利方面相对较少。
印度:在 GAN 专利方面相对较多。
四、GenAI 模式专利趋势
GenAI 模式种类繁多,每种模式都有其独特的特点和优势。图像/视频模式是 GenAI 专利数量最多的模式,分子/基因/蛋白质模式专利增长最快,这表明 GenAI 在图像生成、药物发现等领域的应用潜力巨大。中国和美国在 GenAI 模式专利方面占据领先地位,亚洲国家和欧洲国家也积极参与其中。随着 GenAI 技术的不断发展,我们可以期待更多新的模式和应用的出现。
(一)主要 GenAI 模式
图像/视频:图像/视频模式是 GenAI 专利数量最多的模式,2014 年至 2023 年期间,图像/视频模式专利家族数量从 5,000 个增长到 18,000 个。GAN 模型在图像/视频模式下应用最为广泛,用于图像生成、图像编辑、图像风格转换等任务。
文本:文本模式是 GenAI 专利数量第三多的模式,2014 年至 2023 年期间,文本模式专利家族数量从 4,000 个增长到 13,500 个。LLM 模型在文本模式下应用最为广泛,用于文本生成、文本摘要、机器翻译、对话系统等任务。
语音/声音/音乐:语音/声音/音乐模式是 GenAI 专利数量第四多的模式,2014 年至 2023 年期间,语音/声音/音乐模式专利家族数量从 4,000 个增长到 13,500 个。LLM 和扩散模型在语音/声音/音乐模式下应用最为广泛,用于语音合成、音乐生成、音频编辑等任务。
代码:代码模式是 GenAI 专利数量第五多的模式,2014 年至 2023 年期间,代码模式专利家族数量从 2,000 个增长到 3,000 个。LLM 模型在代码模式下应用最为广泛,用于代码生成、代码补全、代码理解等任务。
3D 图像模型:3D 图像模型模式专利数量相对较少,2014 年至 2023 年期间,3D 图像模型模式专利家族数量从 100 个增长到 500 个。NeRF 模型在 3D 图像模型模式下应用最为广泛,用于 3D 场景生成、虚拟现实等任务。
分子/基因/蛋白质:分子/基因/蛋白质模式专利数量相对较少,2014 年至 2023 年期间,分子/基因/蛋白质模式专利家族数量从 100 个增长到 500 个。GAN 和 VAE 模型在分子/基因/蛋白质模式下应用最为广泛,用于药物发现、蛋白质结构预测等任务。
(二)专利数量和增长趋势
图像/视频:图像/视频模式专利数量最多,且增长速度最快,这表明图像/视频生成和应用是 GenAI 领域的热点。
分子/基因/蛋白质:分子/基因/蛋白质模式专利数量增长最快,这表明 GenAI 在生命科学领域的应用潜力巨大。
语音/声音/音乐:语音/声音/音乐模式专利数量增长相对较慢,这表明 GenAI 在音频生成和应用方面的进展相对较慢。
(三)主要专利拥有者
腾讯:在图像/视频、文本、语音/声音/音乐和其他模式专利方面都处于领先地位。
平安保险集团:在图像/视频、文本、语音/声音/音乐和其他模式专利方面都拥有大量专利。
百度:在图像/视频、文本、语音/声音/音乐和其他模式专利方面都拥有大量专利。
IBM:在文本、代码和其他模式专利方面处于领先地位。
谷歌:在文本、代码和其他模式专利方面拥有大量专利。
(四)主要发明者所在地
中国:在所有 GenAI 模式专利方面都占据领先地位,其中图像/视频模式专利数量最多。
美国:在语音/声音/音乐、代码和其他模式专利方面处于领先地位。
韩国:在语音/声音/音乐和图像/视频模式专利方面相对较多。
日本:在图像/视频模式专利方面相对较多。
印度:在语音/声音/音乐和文本模式专利方面相对较多。
五、GenAI 应用专利趋势
GenAI 技术的应用领域非常广泛,涵盖了各个行业和领域。软件和其他应用领域是 GenAI 专利数量最多的领域,生命科学、文档管理/发布、商业解决方案和工业和制造等领域也取得了显著进展。中国和美国在 GenAI 应用领域专利方面占据领先地位,亚洲国家和欧洲国家也积极参与其中。随着 GenAI 技术的不断发展,我们可以期待其在各个领域产生更大的影响。
(一)主要 GenAI 应用领域
软件和其他应用:软件和其他应用领域是 GenAI 专利数量最多的领域,2014 年至 2023 年期间,软件和其他应用领域专利家族数量从 20,000 个增长到 29,900 个。LLM 和 GAN 模型在软件和其他应用领域应用最为广泛,用于代码生成、代码补全、文本生成、图像生成等任务。
生命科学:生命科学领域是 GenAI 专利数量第二多的领域,2014 年至 2023 年期间,生命科学领域专利家族数量从 3,000 个增长到 5,346 个。GAN 和 VAE 模型在生命科学领域应用最为广泛,用于药物发现、蛋白质结构预测、个性化医疗等任务。
文档管理/发布:文档管理/发布领域是 GenAI 专利数量第三多的领域,2014 年至 2023 年期间,文档管理/发布领域专利家族数量从 3,000 个增长到 4,976 个。LLM 模型在文档管理/发布领域应用最为广泛,用于文档生成、文档摘要、文档理解等任务。
商业解决方案:商业解决方案领域是 GenAI 专利数量第四多的领域,2014 年至 2023 年期间,商业解决方案领域专利家族数量从 2,000 个增长到 4,801 个。LLM 模型在商业解决方案领域应用最为广泛,用于客户服务聊天机器人、零售辅助系统、员工知识检索等任务。
工业和制造:工业和制造领域是 GenAI 专利数量第五多的领域,2014 年至 2023 年期间,工业和制造领域专利家族数量从 2,000 个增长到 2,522 个。GAN 和 VAE 模型在工业和制造领域应用最为广泛,用于产品设计优化、数字孪生编程等任务。
(二)专利数量和增长趋势
软件和其他应用:软件和其他应用领域专利数量最多,且增长速度最快,这表明 GenAI 在软件开发和应用的方面具有巨大的潜力。
生命科学:生命科学领域专利数量增长迅速,这表明 GenAI 在医疗保健和生物技术领域的应用潜力巨大。
文档管理/发布:文档管理/发布领域专利数量增长迅速,这表明 GenAI 在内容创作和信息处理方面的应用潜力巨大。
工业和制造:工业和制造领域专利数量增长迅速,这表明 GenAI 在制造业和工业自动化方面的应用潜力巨大。
(三)主要专利拥有者
腾讯:在软件和其他应用、文档管理/发布、个人设备、娱乐、安全和艺术和人文学科等领域都处于领先地位。
平安保险集团:在商业解决方案、生命和医疗科学、银行和金融、政府计算、知识产权/法律/社会和行为科学、教育、网络和智能城市等领域都处于领先地位。
百度:在物理科学和工程、艺术和人文学科、软件和其他应用、文档管理/发布和交通等领域都处于领先地位。
IBM:在软件和其他应用、文档管理/发布、商业解决方案、生命和医疗科学等领域都处于领先地位。
阿里巴巴:在软件和其他应用、文档管理/发布、商业解决方案、艺术和人文学科等领域都处于领先地位。
(四)主要发明者所在地
中国:在所有 GenAI 应用领域都占据领先地位,其中软件和其他应用领域专利数量最多。
美国:在物理科学和工程、生命和医疗科学、军事、农业、娱乐和教育等领域都处于领先地位。
韩国:在商业解决方案、教育和农业等领域相对较多。
日本:在娱乐和艺术和人文学科等领域相对较多。
印度:在网络和智能城市领域相对较多。
六、进一步的考虑
GenAI 技术的发展前景广阔,但也需要我们谨慎应对其带来的挑战。通过制定合理的监管政策和负责任的 AI 发展策略,我们可以更好地利用 GenAI 的潜力,推动社会进步。
(一)劳动力市场的影响:
担忧与机遇并存:一些担忧认为 GenAI 会取代大量工作岗位,导致失业率上升。然而,另一些人认为 GenAI 会像其他自动化技术一样,创造新的工作机会,并提升现有工作的效率和质量。
转型与再培训:GenAI 的出现将迫使某些职业进行转型,并对从业者进行再培训,以适应新的工作环境。
高薪职位的风险:与以往自动化技术主要影响中低收入职位不同,GenAI 的风险扩展到某些高薪职位,例如数据分析师、市场研究人员等。
(二)版权与知识产权保护:
侵权担忧:GenAI 生成的文本、图像和代码可能与现有作品相似,引发版权侵权问题。
AI 发明的可专利性:人工智能辅助的人类发明的可专利性引发了争议。目前,美国联邦巡回法院认为完全由 AI 发生的发明不可专利,而人类辅助 AI 发生的发明则可专利。
深度伪造与训练偏差:GenAI 可能会被用于生成深度伪造图像或视频,造成虚假信息传播。此外,训练数据中的偏差也可能导致 GenAI 产生歧视性结果。
(三)AI 发展的未来:
通用AI的潜力与风险:尽管 GenAI 已经展现出强大的能力,但它距离通用AI(AGI)仍有很长的路要走。AGI 的出现可能会带来巨大的机遇,但也伴随着潜在的风险和挑战。
监管与责任AI:各国正在积极制定 GenAI 监管法规,旨在确保其负责任地发展,并最大化其益处,同时降低风险。责任AI (Responsible AI) 的概念强调了透明度、可解释性、避免偏见、人类在回路、监控和弹性等方面的最佳实践。
(四)专利分析的局限性:
方法变革:由于 GenAI 的快速发展,传统的专利分析方法面临着挑战。需要开发新的工具和技术,以更有效地识别和评估 GenAI 相关的专利。
专利趋势的可视化:由于专利申请和公布的滞后性,目前难以准确预测 GenAI 专利的趋势。未来需要持续关注 GenAI 专利的发布情况,并进行更深入的分析。