1月20日上午和1月23日下午,自动化系“A星探行·通韵杭城”支队成员员分别前往阿里达摩院和阿里云计算进行参访交流。同为阿里巴巴旗下的机构,它们在 AI 领域分别取得了哪些成果?接下来请跟随支队员们的脚步,一同了解它们的AI产业。
首先工作人员带领支队成员参观了达摩院的实验室展厅,分别为他们介绍了计算技术、语言技术、视觉技术、视频技术、决策智能、智慧育种、医疗AI等实验室的研究方向和具体成果。从 AI 发展最基本的算力问题,到最终 AI 如何落地到实际生产生活中,达摩院团队都给出了很好的解决方案。
实验室展厅参观结束后,达摩院的技术人员就其目前正在研究的 AI for Science(驱动科学发展的人工智能,以下简称AI4S)与支队成员进行了座谈。
技术人员介绍道,语言是人类知识的经验总结,AI在语言领域的成功为科学领域提供了借鉴。科学数据中可能蕴含类似语言的“科学语言”。因此,科学家们产生了AI4S 的想法。
关于目前 AI4S 取得的成果,技术人员提到,目前最成功,也是最鼓舞大家的,应该是 AlphaFold 在蛋白质结构预测领域展现的强大功能。除此之外,最近微软研发的 MatterGen 在材料设计方面的表现也令人震惊,AI在科学研究领域展现出了前所未有的潜能。不过 AI4S 目前取得的成果也主要是代替一些计算类软件,进行信息的预测,提高科研工作者的工作效率,在模型的准确性和可解释性方面仍然有很长的路要走。
技术人员表示,AI4S 目前存在的一个困难是关于“科学语言”的数据不足,例如目前关于各种材料不同属性参数的数据库规模仍然较小,只能通过优化模型结构来提升模型的性能。未来如果有足够的数据支撑,或许可以借鉴语言模型中的一些高效的架构进行 AI4S 的研究。
首先工作人员带领支队成员参观了阿里云的产品展厅,并为他们介绍了阿里云目前的基本情况。在移动互联网的黄金十年里,阿里云计算推动互联网技术创新,始终走在科技前沿。目前,阿里云计算是六大云基础设施服务提供商中唯一一家中国厂商。
迄今为止,阿里云计算已经做出了许多瞩目的成果。数据库方面,开发DMS多模数据管理平台;在大模型领域,研发通义千问(AI聊天机器人)、通义万象(文生图,文生视频模型)等众多产品。
阿里云计算的成果也已有广泛的应用。AI云教室可以让教师更加关注教学本身;绿色数据中心可以减排优化水电分配,提高资源利用效率;弹性伸缩技术能根据设定的策略自动调整计算资源数量,帮助应对业务流量波动的同时,提高资源利用率。
在工作人员的介绍过后,阿里云也请了相应的技术人员与支队员们进行交流。
greenAI的具体方案有哪些,已经取得了哪些成效,未来还有哪些规划?
清洁能源数据中心:阿里云在河北省张北县建设的数据中心,充分利用当地的风能和太阳能资源,实现了较高的能源利用率。
液冷技术:通过液冷技术为服务器降温,相比传统风冷技术,可以大幅降低能耗。
高效的调度技术:通过削峰填谷、计算资源的高效调度(比如GPU卡的调度)实现能源的更加高效的利用。
如何看待LLM和AGI的关系?LLM是否是 AGI的必由之路?
LLM打开了AGI之门,让人们意识到了AGI可能会加速到来,就像当年深度学习打开了更强大的人工智能之门一样,但是未来也一定会有某个演进的技术,替代LLM,成为AGI不同历史阶段的关键技术。LLM自身现在的发展也有很多需要亟待解决的问题,只是迈向AGI的重要一步,但它只是一个起点,而不是终点。
达摩院与阿里云都有研究如何解决 AI 发展的算力问题,有所不同的是,达摩院更多地从硬件技术层面提高计算的速度,而阿里云侧重从软件层面优化计算资源分配。
对于 AI 技术的应用,阿里云开发的通义千问等模型非常具有竞争力,但目前还仅限于文本和图像的生成工作,还未落地到实际生产中;而达摩院则借助 AI 分析医学影像、基因序列来促进医学、农业等其他行业的发展,同时其正在进行的 AI4S 的研究也有望进一步提高未来科研工作的效率。
从专业性角度看,阿里云做的非常出色;从实用性角度看,达摩院的探索也非常成功。两所阿里巴巴旗下的机构在 AI 领域都取得了初步的成功,但是在提升模型性能和准确性方面,目前人们仍然还有很长的路要走。
结束两所机构的参访后,支队员们都有哪些感想?
张益炜:本次实践我们走访了阿里巴巴集团下的阿里达摩院和阿里云计算两大企业,在达摩院的参观中我们看到了AI赋能科研的成果,进一步了解AI-for-science。阿里云致力于构建数字世界的基础设施,通过云计算、物联网和人工智能等技术连接和驱动各个行业的数字化转型和创新。这种数字化和智能化的趋势将为人们的生活带来更多便利和机会。
李锦:这是第一次和AI for Science的科研人员进行正面的交流,了解了AI4S产生思路,发展过程以及当前的形式。AI逐步进入人们的生活,也开始帮助提高科研的效率。科研人员提到,现在正在追求建立小尺度与大尺度之间统一的模型,或许这也是一种科学界的通用人工智能。兴许万物都存在一个“大一统模型”,等待着我们的发现。
孟特拉:“云计算”感觉是个经常听见,但又非常模糊的概念。当今互联网极度发达,全世界的人都生活在一张相互连通的网里,好像头顶有共同的一片云照看着一切。算力原来也可以“云”。印象最深刻的是“无影”云电脑,小小的一个设备用云计算就可以运行3A游戏大作。对于云计算的理解,这是一个开始。
供稿 | “A星探行·通韵杭城”支队
责编 | 刘烁 肖一翃 巫莹莹 倪苗