欢迎来到第10期《算力产业半月报》!我们精心筛选并汇总了9月16日至9月30日这两周内,算力产业内的最新资讯及深入分析文章,您可通过本文快速获取内容摘要。
产业动态
北京市算力互联互通和运行服务平台正式上线
9月19日,2024北京互联网大会在京举办,汇集算力资源达5.6万P的北京市算力互联互通和运行服务平台于当日正式上线并实现首日“开单”。北京市通信管理局党组书记、局长苏少林介绍,目前平台汇集29家算力服务商、算力资源达5.6万P,其中京津冀区域2.8万P。下一步将加快开展《北京市算力服务业务健康有序发展试点管理办法(暂行)》《北京市算力服务等级协议》等配套文件编制工作,为标准化、规范化算力交易提供有效支撑,促进更多优质算力资源向平台汇集。(来源于:财联社)
冲刺三千亿级先进计算产业集群!2024世界计算大会今日开幕
2024世界计算大会9月24日至25日在长沙举行。截至2023年底,长沙先进计算产业产值达1800余亿元,平均增长率超6%。而从集群维度来看,新一代自主安全计算系统产业集群跻身“国家队”,且是其中唯一一个以“计算”命名的集群。产业一路狂飙,长沙目标清晰:“做优长沙方案,打造湖南模式,抢占全国市场,形成‘世界计算·中国方案’”——以四步走的发展路径,冲刺三千亿级先进计算产业集群。(来源于:长沙晚报掌上长沙)
湖南省算力调度和综合管理平台发布 助力算力资源灵活调度
近日,湖南省算力调度和综合管理平台在2024世界计算大会算力创新应用主题研讨会上发布。该平台由湖南省工信厅委托湖南大学牵头研发,平台以实现全省算力资源优化配置和用户需求高效对接为建设目标,建立了云资源接入和一体化算力协同机制,以云服务方式提供算力资源,实现算力与数据的灵活调度,降低算力使用成本和门槛;通过多级集群调度器级联构建的跨域工作流引擎,实现跨中心的实时数据流和业务流。目前,平台已接入国家超算长沙中心、长沙智算中心、运营商云中心、东江湖数据中心以及长沙云谷、湘谷科技等算力和数据中心共计超800PF计算资源,初步构建了全省可调度的算力资源池。此外,平台还搭建了算力市场、AI社区、算力运营等核心功能模块,实现“计算资源一站式接入”“数据任务一键式提交”。(来源于:中国新闻网)
邬江兴院士:算力需求矛盾凸显,用电力拼算力的范式不可持续
9月24日,全国高性能计算学术年会在武汉召开。被誉为“中国大容量程控数字交换机之父”的中国工程院院士邬江兴在大会上表示,智能时代的算力必然是绿色、智能与安全的计算。但计算性能增长与算力需求的矛盾凸显,算力的极限不应该是电力,电力支持不了算力的持续发展。他谈到困境之一是性能增长与算力需求的矛盾凸显,面临算不完、存不完、传不完的难题。与此同时,刚性计算架构造成总体效率低下,尤其是刚性计算系统为支持多应用场景导入了过多虚拟化技术,造成性能损失超过30%。存储程序控制机理也存在安全矛盾,这是娘胎里带来的基因缺陷。此外,用电力拼算力的发展范式不可持续。这一切的核心问题在于计算架构单一性与算力需求多样性的矛盾。邬江兴表示,必要多样性是破解多样化算力需求下计算系统结构性失配的根本路径,必要多样性+超稳定机制才能产生适应不确定性场景的能力。(来源于:澎湃新闻科技频道)
2024中国算力大会举行,开幕式协议签约总额达231.2亿元
9月27日至29日,以“聚智向新 算领未来”为主题的2024中国算力大会在河南郑州举行。开幕式上,中国算力服务平台(河南)正式启动。另外,8个框架协议、9个合作协议、5个战略协议集中签约,总金额达231.2亿元。
据介绍,在算力领域,全国在用算力中心机架总规模超过830万标准机架,算力总规模达246 EFLOPS,位居世界前列;城域算力节点间1ms时延保障能力逐渐形成,区域集群到周边主要城市间5ms时延保障能力广泛覆盖,国家枢纽节点间20ms时延保障能力全面实现;全国算力中心平均电能利用效率(PUE)降至1.47,创建国家绿色数据中心246个;工业、教育、医疗、能源等多个领域算力应用项目超过1.3万个。(来源于:新京报)
2024中国算力大会丨总规模100亿元 河南设立算力产业基金
9月28日,2024中国算力大会现场,河南算力产业基金正式发布。据了解,河南算力产业基金总规模100亿元,由河南投资集团有限公司作为基石出资人,联合国家级基金、地市平台、产业龙头企业和知名机构共同发起设立,由自主管理直投基金、专项并购基金和产业母基金等基金群构成,重点投向数字基础设施、算力软硬件、算力运营、大模型和垂类应用、具身智能机器人等前沿科技领域。(来源于:大河网-河南日报)
模型之争最终是算力之争?专家:目前一半以上算力被浪费了
9 月,在百度智能云举办的媒体技术沙龙上,百度杰出系统架构师、百度智能云 AI 计算部负责人王雁鹏表示,大家在大模型训练时遇到了一个共性问题,那就是算力利用率很低。目前企业训练大模型的算力有效利用率不足 50%,这意味着,一半以上的算力被浪费了。在算力短缺且昂贵的当下,这无疑是一种巨大的浪费。王雁鹏指出,算力有效利用率 = 能耗有效率×单卡算力有效率×并行扩展有效率×有效训练时间×资源利用率,其中每一项都是乘积关系,任何一项的表现有细微偏差,都会对整体算力利用率产生系统性影响。然而,目前一个行业共识的难点是,提升任意一项都绝非易事,系统性提升更是难上加难。(来源于:InfoQ)
国家信息中心与华为联合发布《城市算力网:网络直连篇研究报告》
9月20日,2024华为全联接大会期间,国家信息中心与华为联合政产学研用领域10余家单位共同发布了《城市算力网:网络直连篇研究报告》(简称《报告》),分析了城市算力专网建设的必要性,提出政府牵头、统筹规划、集约化建设是城市算力专网落地的重要驱动力。《报告》阐述了城市算力专网的总体架构、运作机制和演进路径,总结了深圳、济南等城市算力专网建设的创新探索,为城市算力网发展提供建设性参考,以网强算,激发算力澎湃动力,助力数字经济高质量发展。(来源于:国家信息中心)
来源:国家信息中心
OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
OpenAI的新模型o1,开启了Scaling Law的新篇章——随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1在逻辑推理能力上已经达到了目前天花板级别。尤其是在北大给出的一项评测中,o1-mini模型的跑分比o1-preview还要高。这就展示一种新的思路和可能性——小模型专门加强推理能力,放弃在参数中存储大量世界知识。但与此同时,也出现了另一个问题:若是想让AI同时掌握高阶推理能力和大量知识的任务应该怎么办?于是乎,技术再次对焦到了大模型和RAG的组合。具体而言,向量数据库让大模型能够快速有效地检索和处理大量的向量数据,为大模型提供了更丰富和准确的信息,从而增强了模型的整体性能和应用范围。可以说是让大模型有了“好记忆”,减少出现答非所问的情况。(来源于:量子位)
来源:量子位
Nature:探秘世界最快超算 Frontier 的一天
Frontier 配备的是 AMD 的 CPU 和 GPU,有 5 万个处理器(其中包含 3.8 万个 GPU),运算速度为 1.102 exaFLOPS,即每秒 1.102 百亿亿(10(18))次浮点运算。Frontier 十分擅长创建模拟,并能同时捕捉到大尺度的模式和小尺度的细节,比如微小的云滴如何影响气候变暖的速度。如今,研究人员们从世界各地登录 Frontier,创建从亚原子粒子到星系的一切尖端模型,包括模拟蛋白质进行药物发现和涉及、模拟湍流以改进飞机发动机,以及训练能和谷歌、OpenAI 竞争的开源 LLM。根据 2023 年的统计,Frontier 共有 1744 个用户,遍布 18 个国家,贡献的计算和数据支撑了至少 500 篇已经公开发表的论文。(来源于:新智元)
来源:新智元
美国白宫宣布成立「智算中心基础设施特别工作组」
近日,美国白宫宣布,将成立智算中心基础设施特别工作组(Task Force on AI Datacenter Infrastructure;AI Datacenter,国内一般指智算中心),以协调政府各部门政策。该工作组将由国家经济委员会、国家安全委员会和白宫副幕僚长办公室领导。此外,美国能源部还将创建智算中心合作团队,利用各种项目来支持智算中心的发展。(来源于:数据观综合自网络)
几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
近日,谷歌DeepMind推出名为AlphaChip的AI系统。谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。AlphaChip设计芯片,用的是强化学习的原理。也就是说,芯片布局设计对它来说是一种游戏,就像AlphaGo一样,它在游戏中,学习如何设计出最好的芯片布局。几小时内,它就能生成超出人类水平,或是与人类专家相当的芯片布局了。现在,它已经用于设计多代TPU芯片(TPU v5e、TPU v5p和Trillium)。而且跟人类专家相比,AlphaChip放置的块数越来越多,线长也减少了许多。(来源于:新智元)
来源:新智元
THE END
扫码关注我们