“欧米伽未来研究所”关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。(关于欧米伽理论)
报告《人工智能中的创造力:进展与挑战》(Creativity in AI: Progresses and Challenges)由瑞士洛桑联邦理工学院(EPFL)等研究机构的学者共同撰写,全面审视了人工智能(AI)在创造力方面的研究进展、存在的挑战以及未来发展方向。以下是该报告的详细介绍:
基于这一背景,报告的主要目标包括三个方面:
首先,全面回顾人工智能在语言创造力(如故事、诗歌创作)、艺术创造力(如视觉艺术和音乐创作)以及科学创造力(如科学知识发现和公式推导)等领域取得的进展。
其次,分析当前AI在创造力方面的局限性,特别是生成内容缺乏多样性与原创性、抽象推理能力薄弱、以及长距离语言或艺术表达的一致性和连贯性不足等核心挑战。
最后,报告从认知科学和心理学的角度,提出了未来改进AI创造力的研究方向,强调模拟人类灵感和思维过程的重要性,为开发更具创新能力的AI系统奠定理论基础。这不仅为学术研究提供指导,也为AI应用于文化创意、科学创新等领域指明了方向。
报告引用了被广泛接受的“标准定义”来描述创造力,这一定义强调了创造力必须具备三要素:新颖性(novelty)、价值性(value)和惊奇性(surprise)。
其中,新颖性是指创造的成果需要在某种程度上是独一无二的或前所未有的,价值性则确保生成物具有意义和效用,而惊奇性则是衡量其超出预期或令人耳目一新的能力。三者共同构成了对创造力的基本评判标准。
创造力不仅体现在个体的创新行为中,即所谓的个人创造力(P-creativity),也包括对整个人类历史具有深远影响的历史创造力(H-creativity)。前者如个人在日常生活中解决问题的创造性想法,后者如爱因斯坦的相对论或达尔文的进化论,其新颖性和价值性跨越了个体范围,对整个人类历史具有标志性意义。
评估创造力是一个高度复杂且具有挑战性的任务,主要因为其内在的主观性。一项创作是否被认为是“创造性的”,在很大程度上取决于评估者的文化背景、知识结构和个体偏好。因此,报告提出了一系列用于评估创造力的指标与方法。人类手动评估是最常用的方式,评估维度包括流畅性(fluency,生成有意义的想法数量)、灵活性(flexibility,不同类别想法的数量)、独创性(originality,想法的独特性或稀缺性)以及细节丰富性(elaboration,创作的细节程度)。
然而,手动评估需要耗费大量人力资源且易受主观偏见影响,为此,报告还探讨了自动化评估方法。这些方法通常基于量化指标,如通过语义距离衡量生成文本的新颖性,或通过对生成结果的统计分析评估其多样性与一致性。尽管自动化方法在效率上具有显著优势,但它们在捕捉创作的情感与深层价值上仍显不足。
总的来说,报告通过对创造力定义与评估方法的梳理,为更全面地理解和衡量人工智能的创造力奠定了理论基础,同时也突出了这一领域的复杂性和多样性。
语言创造力是人工智能领域的重要研究方向,指通过语言生成新颖、独特且有意义的表达方式。这包括幽默、比喻、双关、隐喻、讽刺以及新词汇的创造。这种创造力对人类交流和艺术表现至关重要,因此成为衡量AI语言生成能力的重要维度。
报告总结了当前生成式人工智能(尤其是大型语言模型,LLMs)在语言创造力上的显著进展。例如,这些模型能够创作结构优美的诗歌、叙事流畅的故事,并生成风格化的文学内容。LLMs 展现出一定的幽默感,能够生成有趣的对话或双关语;在比喻和隐喻生成方面也有突破,如通过上下文捕捉语义关联并生成具有一定创造性的表达。此外,多语言支持的语言模型能够跨文化生成幽默,展现了全球化视角下的语言灵活性。
尽管如此,模型在生成过程中也面临诸多挑战。首先,其输出常缺乏情感共鸣和深层意义,难以与人类创作者的思想深度相匹敌。其次,幽默和隐喻的生成存在一致性和多样性问题——模型可能重复某些模式或语义关联,难以达到真正的原创性。此外,跨文化幽默生成还需考虑语言背景和文化习俗的复杂性,模型在处理这些细腻差异时仍显力不从心。
报告还提到了一些代表性研究。如幽默检测和多语言幽默生成任务,通过自动化评估幽默表达的新颖性和语境适配性;比喻和隐喻生成则聚焦于如何利用语义嵌入和语境模型生成贴切的语言表达;新词汇创造任务探索AI在语言演化中的潜力,尤其是在构建新概念或术语时的表现。
未来,改进AI的语言创造力需要进一步研究人类语言的认知机制,尤其是情感表达、文化适配性和跨语境理解,这将有助于开发出更具创造力和人类共鸣的语言生成系统。
创意问题解决是人工智能研究的关键方向之一,专注于将常识推理、抽象推理和类比能力应用于具体问题的解决。与人类类似,AI需要通过发散性和收敛性思维在复杂任务中表现创造性。这一领域的研究不仅是对AI智能能力的考验,也是推动AI应用于真实世界问题的重要环节。
发散性与收敛性思维
在创意问题解决中,发散性思维注重提出多种可能性,探索广泛的解决方案空间,而收敛性思维则强调从多种选择中找出最优解。AI模型展现了一定的这两种能力,例如在任务中生成多样化的潜在答案并筛选出最佳方案。然而,报告指出,AI在面对非传统解决方案时仍显不足,往往局限于其训练数据中的模式,缺乏跳出框架的创新性。
报告列举了一些常用于评估AI创意问题解决能力的任务:
(1)谜语解决(RAT测试):RAT测试需要AI在表面无关的提示词中找到深层关联,这考验了AI的类比推理能力。尽管AI在简单任务中表现良好,但对于复杂的关联推理,其能力仍有限。
(2)抽象推理测试(ARC):ARC要求AI理解抽象模式并推导出规则,表现其在图案和逻辑推理中的能力。模型在明确规则的任务上表现不错,但对于隐含规则或需要发散思维的问题,完成度较低。
(3)非传统物品用途:这一任务要求AI提出日常物品的新用途,例如“砖块的其他用途是什么”。尽管AI能够生成多样化的答案,但其创新性和实用性往往不及人类,体现出对已有知识的依赖。
报告指出,AI在创意问题解决上的主要挑战包括功能固着效应和缺乏抽象推理能力。功能固着效应使AI难以突破训练数据中常见方法的限制,尤其在需要深度类比或重新定义问题边界时表现不佳。此外,当前模型缺乏长距离逻辑推理能力,对任务的复杂性和连贯性处理不够完善。
尽管面临这些局限性,报告认为,通过引入认知科学中的灵感生成机制以及结合多模态学习,未来可以显著提升AI在创意问题解决中的表现,从而更接近人类的创新水平。
艺术创造力是人工智能的一大亮点,报告对AI在故事创作、诗歌创作、视觉艺术和音乐创作等方面的表现进行了详细分析。这些领域体现了AI模型在艺术表达中的潜力与不足。
(1)故事生成
AI能够生成语言流畅且语法正确的短篇故事,尤其是在模仿特定风格或主题时展现了较强能力。然而,报告指出,AI在处理复杂叙事任务时存在显著不足,尤其是在需要长距离连贯性、深层次角色发展以及复杂情节构建时,生成的故事往往显得单薄或缺乏逻辑一致性。
(2)诗歌创作
AI在诗歌创作方面表现出色,能够生成押韵和结构良好的诗句。特别是在模仿不同语言或诗歌体裁时,AI的能力令人印象深刻。然而,尽管形式完美,其内容通常缺乏深刻的思想性和情感共鸣,难以触动人心。此外,AI在创作隐喻或表达复杂情感时,仍面临较大挑战。
(3)视觉艺术
通过生成对抗网络(GAN)和扩散模型(Diffusion Models),AI能够创作出高质量的图像、插画甚至短视频。这些生成内容在风格化艺术表现中表现卓越。然而,在复杂场景中的对象关系处理以及对常识性物理规律的理解方面,AI仍存在不足。例如,生成内容可能存在比例失调或不符合现实逻辑的问题。
(4)音乐创作
AI生成的音乐作品结构完整,多声部和谐统一,能够展现一定的创作技巧。例如,通过学习特定风格的音乐,AI可以生成类似巴赫风格的古典乐曲。然而,这些作品往往缺乏情感连贯性,难以符合听众的情感偏好,表现出创作过程中过于模式化的问题。
报告认为,尽管AI在艺术创作中已经展现了显著能力,但在长距离连贯性、深层情感表达以及现实逻辑的理解和应用上仍需进一步提升。未来的研究方向包括引入认知科学中的艺术灵感生成机制,以及结合多模态学习方法,开发更加丰富和真实的艺术表现能力。
科学创造力是人工智能研究的前沿领域,关注AI在发现新理论、新假设和新知识中的能力。这一领域代表了AI从“工具”向“协作者”转变的潜力,并对科学研究的未来产生深远影响。
(1)符号回归与公式发现
AI已经在符号回归和公式发现领域取得了显著进展。例如,AlphaFold 的突破性研究通过预测蛋白质的三维结构,极大地推进了生物学研究。在物理学中,AI通过分析实验数据生成新的数学公式或物理定律,为复杂系统建模提供了新的可能。这种能力不仅加速了科学发现过程,也提升了科学研究的效率和精准性。
(2)科学知识生成
AI在生成科学知识方面表现突出,包括生成数学猜想、自动证明定理以及预测化学和生物分子结构。例如,AI可以在数学领域自动生成新的猜想,或帮助解决长期未解的问题。在化学领域,AI能够设计新的分子结构或药物化合物,为材料科学和药物研发开辟新的路径。这些能力展示了AI在拓展科学认知边界上的潜力。
(3)挑战与局限
尽管取得了显著进展,AI在科学研究的完整流程自动化上仍处于初期阶段。特别是在实验设计、数据分析和结果解释等环节,AI的能力尚未成熟。科学研究通常需要结合领域知识、创造性思维和严谨的逻辑推理,而AI当前的能力主要集中在数据驱动的推断上,缺乏主动探索能力。此外,AI在生成知识时的可解释性和可靠性仍然是重要挑战。
科学创造力是人工智能实现自主创新的核心方向之一。未来的研究需要将AI的符号推理能力与人类的创造性思维相结合,开发能够设计实验、验证假设并自主发现新知识的系统,从而推动科学研究进入全新的阶段。
报告深入分析了人工智能在创造力领域面临的主要挑战,并提出了未来可能的研究方向,为AI的进一步发展提供了指导。
主要挑战
(1)生成内容的多样性与原创性不足
(2)长距离一致性与逻辑连贯性问题
生成式AI在处理复杂叙事、长文本或多步骤任务时,常常无法保持全局一致性,容易出现逻辑跳跃、语义冲突或结构松散的情况,这严重影响了生成内容的整体质量。
(3)记忆与插值效应的限制
模型训练过程中,AI倾向于在训练数据的分布范围内进行插值,而不是外推。这种现象导致AI难以突破已知领域的约束,限制了其在真正未见任务上的创造力和适应性。
未来研究方向
报告建议开发一种关注创作过程的多维度评估框架,而不仅仅关注最终生成结果。这种框架可以包括多样性、连贯性、创新性等维度,并通过捕捉AI在创作过程中的变化来评估其创造性能力。
AI未来的创新方向之一是模拟人类的发散性思维和灵感生成机制,例如如何快速联想到新的概念或跨领域联系。引入认知科学中的启发式方法和心理学中的灵感理论,有助于提升AI的创造性思维能力。
在科学与艺术的交叉点上寻找突破,是未来发展的关键。例如,通过结合科学推理与艺术表达,AI可以创造出既具功能性又具美感的成果。这种跨领域的创造力也有助于推动科学发现和文化创意产业的融合。
AI的创造力发展需要突破现有的技术限制,不仅关注生成结果,更需探索创作过程中的多维度特性。未来通过引入认知科学的灵感启发和跨领域协作,将有望进一步释放AI在创造性领域的潜力,从而推动科学与艺术的双向进步。
人工智能的创造力发展正处于快速进步与关键挑战并存的阶段。尽管AI在语言生成、艺术创作和科学发现等领域展现出显著能力,其创造性仍受限于训练数据的约束和模型内在的逻辑机制。要实现真正的突破,AI的发展需要超越仅关注生成结果的范畴,更深入地研究创作过程中的多维度特性,包括发散性、连贯性和原创性。
阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”
截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告
上下滑动查看更多