祖冲之利用刘徽的割圆术,将圆周率π的近似计算精确到小数点后七位,这不仅是数学史上的一项重要突破,也是对无理数逼近问题的早期探索。在现代人工智能中同样能观察到数值逼近的思想,例如模型的训练通常依赖随机优化算法等数值方法,此方法对函数近似求解的精度有很高要求。
刘徽提出的割圆术是一种递归(或称为迭代)算法,通过不断增加圆的内接正多边形的边数来逼近圆周长,从而求得更精确的π值。这种算法设计思想与现代计算机科学中的递归算法、迭代算法以及近似算法等有直接对应关系。在人工智能领域,许多机器学习算法(如梯度下降法等)都基于迭代方法来优化模型参数。
祖冲之与刘徽的研究方法和成果对后世人工智能的发展有着重要启示。今天,人工智能的AIGC技术让他们与千年后的我们在2024年世界人工智能大会上相遇。
此次,为了“复活”两位数学家,华院计算技术(上海)股份有限公司(以下简称“华院计算”)发挥了其在人工智能领域的深厚积累和创新能力,应用了多种人工智能技术。为了还原两位古人的“形”,即计算机视觉方面,华院计算先通过公开材料找到祖冲之和刘徽的肖像图片,然后应用扩散模型、GAN等方法,生成他们的高清写实肖像画。经过反复比对后,华院计算通过AI技术对演员进行定妆。在声音方面,华院计算邀请了声优为两位先贤配音,在收集音频素材后,利用仅需秒级别的音频数据作为提示的MegaTTS等大型预训练zero-shot语音复刻模型,通过VQ模块提取音色、韵律等特征,以生成专属AI声音,高度还原目标声音。由此,能说会动的祖冲之和刘徽的数字形象就诞生了。
目前的数智人技术,在应用层面都已经实现了易用性和普惠性,一张照片、一段3分钟的视频、一句语音就可以1:1复刻高仿真的数智人,市面上已经可以轻松找到这些消费级的应用。然而,在今年的世界人工智能大会上我们会发现,数智人相比以往感官更加灵动,姿态动作更加丰富,部分已经实现了情感理解和情感表达的能力。
2024年,数智人的另一大亮点是“智慧升级”,交互式数智人所依赖的多模态理解与生成技术日臻成熟。在智能问答方面,大模型的出现大大降低了人工准备FAQ的时间。华院计算通过运用RAG(Retrieval-Augmented Generation,检索增强生成)技术,利用外部大规模知识库改进模型的推理能力和事实性,生成更准确且符合语境的回答。通过动态检索最新的信息,适应知识的更新和变化,与仅依赖于预训练知识的模型相比,可反馈更准确和实时的信息。此次亮相的祖冲之和刘徽两位数学家交互式数智人的“智慧”,就使用了RAG技术。
人工智能的底层逻辑离不开数学,华院计算希望通过这次的互动体验,让观众近距离感受到不同时期这三位数学家的智慧碰撞,以及我们与三位数学家跨越了千年的科学技术的嬗变。探索科学发展的道路其修远兮,我辈应继承历代先贤之成果,矢志不渝上下而求索。
华院计算数智人体验平台入口(电脑端登录网页):https://aigc.unidt.com/dolly/base/next/#/login