从“可用”到“好用”,百度智能云如何做大模型的“超级工厂”?

科技   2024-09-25 17:01   北京  


如果说,过去两三年大模型处于造锤子阶段,那么今年,更多的则是考验钉钉子的能力,面对各类业务场景大模型是否能够有的放矢、一击必中,为千行百业深度赋能。
当前市场上,已经有200多把这样的锤子在疯狂找钉子。但从实际应用来看,大模型在文生文、文生图以及扮演初级的工作助理等方面还算合格,但要是真正落地到一线场景,解决业务痛点,提升生产和服务效率,还需要下更多功夫。
从最近几个月的风向看,也不乏有人提出质疑,如此之多的大模型,其实用性到底有几分?这里面是不是也存在着不小的“泡沫”?无须讳言,“泡沫”一定是有,为了大模型而大模型的企业甚至不在少数。
但不可否认是,业内也有以百度智能云为代表的实干者在持续探索大模型的实际价值,不断推出可应用、可落地、可产生效益的大模型产品和解决方案,通过AI原生应用推动企业以及行业的创造力和生产力全面提升。
9月25日,2024百度云智大会正式举行。本届会议不仅围绕基础设施、大模型、开发工具链、AI原生应用等方面进行了多项全新发布,还为业界带来了大模型产业落地的最佳实践。
“云智一体”战略牵引
为大模型铺路筑基

当各行各业拥抱大模型之后,都会有一个共识,MaaS将是一种新的应用开发范式。在云计算时代,是基于PaaS做SaaS,再提供给用户;智能化时代,则回归到MaaS底座上,再结合千行百业的场景,打造智能化应用,提供用户所需要的业务价值。
在“百模大战”的行业大环境下,百度智能云事业群总裁沈抖曾表示,过去一年是大模型从技术变革走向产业变革的关键一年,而大模型和云计算紧密结合,正在成为新型的基础设施。从1834年第一台现代发电机诞生,到1882年美国建成全球第一座电厂,再到电力成为全球的能源基础设施,每一次升级都能带来生产力的巨大跃迁。而且一次比一次速度更快,影响更大。
面对AI浪潮席卷全球,百度智能云希望更多的创业者、企业用户能够繁荣大模型生态。
去年10月,百度智能云将战略升级为“AI原生时代的云智一体”,围绕“云智一体,深入产业,生态繁荣,AI普惠”理念,聚焦更高效的算力基础设施、更好用的一站式大模型平台和AI原生应用开发平台,以及更丰富的AI原生应用样板间和行业解决方案,去满足客户在大模型时代的不同业务需求。
在“云智一体”战略框架下,百度智能云自下而上推出一整套AI原生技术栈,包括异构算力基础设施“百度·百舸AI异构计算平台”、一站式大模型平台“千帆ModelBuilder”和AI原生应用开发平台“千帆AppBuilder”、AI生成式产品“文心大模型”,以及数字人、智能客服、超级助理、生成式BI等丰富的AI原生应用和行业解决方案,满足各行各业在AI原生时代的不同业务需求,全力赋能千行百业,加速推进产业智能化。
百度智能云事业群总裁 沈抖
在IDC近日发布的《中国大模型平台市场份额,2023:大模型元年——初局》报告中,百度智能云以19.9%的市场份额居中国大模型平台市场第一。
从应用角度看,百度智能云能够连续多年保持领先优势主要得益于三方面的原因:一是布局全栈AI技术,形成端到端的AI优化机制;二是在生成式AI、多模态、大模型应用场景、OCR、对话式AI等AI软件方面具备明显优势;三是拥有最大的AI及大模型产业落地规模,广泛覆盖金融、制造、能源、互联网等行业。
作为AI时代的新型生产力,数据、算力和算法成为关键资源。在大规模前端产品落地后,算力建设能否及时跟上,成为AI大模型向各领域进一步渗透的关键因素。
面对大模型高昂的计算成本和算力资源供应短缺的问题,如何在大模型训练推理上高效使用算力、扩大算力来源是业务的核心考验。

沈抖指出,过去一年的最深感受就是大模型训练的需求越来越大,需要的集群规模也越来越大。与此同时,行业对推理的成本下降的预期也越来越高。这些都对GPU管理的稳定性和有效性提出了更高的要求。此次,百度智能云对百舸做了大幅升级。

目前,百度百舸AI异构算力平台能够对不同地点、规模、集群的智能算力进行统一管理,并基于芯片性能优化、自动芯片选型、潮汐混部等技术,大幅提升智能算力效能,万卡集群上的模型有效训练时长占比超过99.5%。相同的大模型任务,百舸能够帮助客户将资源成本降低一半。
为了解决算力不足问题,“一云多芯”是中国企业的必然选择。百舸已经攻克了同一智算集群中混合使用不同厂商芯片的业界难题,帮助企业摆脱单一芯片依赖,打造更有性价比、更安全、更具弹性的供应链体系。
百舸能够在兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片的同时,最大限度屏蔽硬件之间的差异,在多芯混合训练任务中百卡规模性能损失不超过3%,万卡规模性能损失不超过5%,均为业界最高水平。
基于强有力的算力平台,百度智能云搭建起一站式企业级大模型平台——千帆。该平台不仅提供包括文心大模型4.0、4.0 Turbo和3.5三款旗舰模型、主流开源大模型在内的近80款大模型服务,还提供覆盖开发大模型、AI原生应用全生命周期的工具链。
同时,为进一步实现AI技术普惠,平台还预置了ERNIE Speed、ERNIE Lite、ERNIE Tiny三款性价比较高的主力模型,帮助开发者和企业降低大模型使用门槛和试错成本,加速业务创新。
沈抖指出,行业大模型本质上是一个多模型的行业解决方案,由一个通用大模型和多个行业模型组合而成。这些行业模型往往由小模型精调而成,在特定领域具有很强的能力。
但企业应用场景十分复杂,如果只是用一个个“孤立”的行业模型去解决特定场景的问题,那么整套工程将会非常复杂,和传统的AI开发没有区别,开发效率极低。
因此,为了进一步降低行业大模型的开发门槛,百度智能云推出了千帆·行业增强版,将通用大模型的理解、生成、逻辑、记忆能力,与行业模型的专业能力相结合,搭配体系化的工具和组件,支持从资源管理、大模型服务到应用开发的全过程,把企业定制化的部分从“最后一公里”缩短至“最后一百米”,让行业的应用开发事半功倍。
目前,百度智能云的各类大模型产品已广泛覆盖交通、政务、教育、金融、制造、能源、互联网等行业,并深入到“研、产、供、销、服”的每个环节中,取得了显著成效。
截至2024年Q2,千帆大模型平台的日调用量超过7亿次,累计开发出了超过70万个AI应用。
小切口大纵深
 从实践中来到实践中去

大模型商业化应用的核心在于能否真正解决用户问题。
在经历了“百模大战”的锤炼之后,企业们的技术能力正变得越发强劲,大模型开始走向商业化落地。今年以来,中国10亿参数规模以上的大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式,赋能千行百业。
随着技术迭代曲线放缓、基础大模型赛道的竞争格局企稳,生成式AI市场的性质正在发生变化,更多的创新和价值创造正在向应用层汇聚。沈抖曾表示,企业有多少业务场景,未来就有多少AI原生应用。
这也印证了百度智能云正在通过对产业痛点的深入洞察和理解,将大模型与实体经济及行业应用全域融合,在服务产业的过程中,也进一步完善和提升了大模型的行业能力,形成互为反哺、相互促进的正向循环。
沿着这一逻辑,大模型一个最为前景的应用场景,就是垂直领域专业服务。越是复杂的问题,越是专业的领域,越能孕育出更具价值的商业化应用。最典型者如金融、政务、交通等行业。
在教育领域,教育龙头企业好未来运用百度百舸·AI异构计算平台,为其自研九章大模型(MathGPT)提供关键支撑。九章大模型在成功内测推出后,已经成功在智能硬件学习机xPad实现了业务上线。
九章大模型的“数学随时问”功能可以实现对80%的数学题即问即答,暂时不能回答的最快可在一小时内上传真人讲解视频、20分钟内生成AI视频解析。
此外,好未来AI辅导工具xPad2 Pro系列还上线了自研的新功能“AI对话学”,该功能基于九章大模型的解题和讲题能力,通过与学生进行启发式的对话交流,打开题目的黑盒,快速分析出学生的薄弱点,从而使教育更具针对性。
面对快速增长的电动汽车智能座舱需求,蔚来汽车基于千帆平台,在文心大模型的基础上通过提示词工程打造出了业内首家纯端侧部署的多模态感知大模型——NOMI GPT,助力客户座舱场景体验创新。
NOMI能够自然地与用户互动,成为一个更懂用户、更聪明的座舱AI小助手。通过文心大模型,NOMI能够对用户的用车问题解答,还能实时监测车况,支持用户口语化模糊查找。比如用户说出目的地城市,NOMI就能帮助用户推荐景点游玩攻略、景点推介、食宿推荐等;用户给出关键词,NOMI可以给出理解并调整氛围灯色调。
此外,NOMI还能自定义角色陪聊,具备儿童百科问答、学习解惑、语言游戏等多种功能。目前,NOMI已经陪伴了近20万车主家庭,已经成为有温度的情感陪伴和移动的生活空间。
在港航领域,百度智能云与山东日照港联合探索大模型港口应用场景,推动大模型试点应用,赋能港航领域产业链上下游企业和生态企业智能化转型升级。
2023年,日照港口货物吞吐量达到5.93亿吨,跃居全国第六、世界第七;全市临港产业产值占规上工业总产值的比重达85%以上。和一般码头有点不一样的是,这里专做件杂货。
件杂货,是对论件计数、形状各异、大小不一的货物的统称。这类货物的包装形式、类别各不相同,无法使用集装箱运输,还存在不同的存放需求和上船时间要求,装卸工具和方案各异,装卸工艺流程复杂、人机交互频繁。
相比集装箱码头,件杂货码头实现自动化和智能化的难度更高。由于件杂货的独特属性,码头需要可靠、准确的图像分析和智能算法,对货物进行有效识别、定位并进行智能配载。
百度智能云运用人工智能技术,打造智能化系统,为件杂货码头自动化、智能化升级探索可行路径。通过百度智能云OCR视觉识别技术,在货物即将进港时,工作人员就可识别货单信息,将具象化的货物实体转化为算法支持的数学逻辑,从而避免人工录入造成的失误,提升数据录入的准确性,降低货运代理数据录入工作量。
智能化系统可对整个港口的堆场进行厘米级的地理信息采集,实现人员、车辆、设备、货物、场地、船舶等要素精准定位,形成一张“综合地图”。数字化堆场系统会从TOS系统(Terminal Operating System,码头智能生产管理控制系统)中获取各生产要素的实时信息,并在高精地图中进行实时展示,助力业务人员远程作业。
在实现多维生产要素和生产流程的数学建模的同时,智能化系统基于调度数据优化大模型的调度算法,提供包括智能堆场计划、智能泊位计划和智能配载计划等调度计划策略,再通过实时的人员排班调度、港机作业调度和水平运输车辆调度等,实现件杂货码头自动化、智能化运转。
此外,调度优化大模型还可以提高码头作业全流程的人机协同效率,将人工智能算法下沉到各类机械的调度和控制中,大大降低码头的整体运转控制难度,提高控制精度,实现港口智能化再升级。
依托百度智能云打造的智能化系统,山东日照港件杂货码头整体运转效率提升10%,设备利用率提升20%,堆场周转率提升20%,堆场利用率提升15%,并实现大模型在港航领域的成功应用。
从“可用”到“好用”,从“潮玩”到“普适”,大模型在千行百业的场景落地是结合场景定义、训练、调优、运维等多个步骤的螺旋式上升过程。作为AI时代的底座建设者,百度智能云正结合软硬件能力,赋能开发者和生态伙伴,进一步释放AI的创新潜能。



将技术普惠进行到底,百度智能云云原生数据库GaiaDB来啦!

从百度智能云的探索,看懂边缘云的过去和未来

GPT-4、百度文心一言摆擂,AI大模型将掀起新一轮AIGC军备竞赛?

【科技云报道原创】

转载请注明“科技云报道”并附本文链接


科技云报到
云计算、网络安全、人工智能、大数据、区块链领域垂直新媒体,专注原创的企业级IT内容行家
 最新文章