今年下半年,大模型落地再度向前迈进,仅两个半月内,市场上公开可统计的大模型相关中标项目数,已超过上半年六个月的中标项目总数。单月中标项目也已进入上百个阶段。大模型正加速在各行各业全面开花。其中,尤以能源、金融、教育、互联网等行业极为活跃。
01
央国企们,又往前迈了一大步
1.国网湖南电科院:配网视觉大模型
近期,国网湖南电力二级领军专家肖剑发布了电科院自主研发的10亿节点配网视觉大模型。结合自监督学习和混合专家微调技术,电科院已完成10亿节点视觉大模型的自主研发,可以支撑十多种细分专业、几十个配网场景的使用。目前视觉大模型已经在无人机巡检、通道可视化等取得显著成效,顺利完成30万公里巡检,平均识别效率比主流视觉模型提升了10%。
配网环境复杂多变,包括各种气象条件、设备类型、运行状态等,对现场作业有极高的适应性要求。同时配网数据的标注和预处理是模型训练的关键步骤之一。一般的小模型由于表征能力和学习能力相对较弱,会出现精度低、通用性低的问题。
这次发布的配网视觉大模型完美的解决了这些痛点。
配网专业视觉大模型是一种利用深度学习技术来进行配电网图像或视频处理的算法模型。它基于神经网络,通过大规模的训练数据集和高性能的计算硬件,实现对配电网图像信息的高效处理和理解。
2.国网-百度·文心大模型
早在2022年5月20日举办的“深度学习开发者峰会”上,百度与国家电网就联合研发了行业大模型——国网-百度·文心大模型。
基于通用文心大模型,在海量数据中挖掘了电力行业数据,百度与国网专家们一起,引入电力业务积累的样本数据和特有知识,并且在训练中,结合双方在预训练算法和电力领域业务与算法的经验,设计电力领域实体判别、电力领域文档判别等算法作为预训练任务,让文心大模型深入学习电力专业知识,在国网场景任务应用效果提升。
3.国网信通继远软件:电力安监知识增强大模型
2023年10月11日,国网信通股份继远软件自主研发的电力安监知识增强大模型正式上线运行。
大模型涵盖了电力生产中的规章制度、行业标准、技术方案、综合案例等海量业务数据。通过对数据的深度挖掘和分析,实现为企业提供实时、准确的安全生产决策辅助分析与风险预警。目前,大模型提供了现场勘察报告辅助编制、工作票质量规范校验、违章行为智能分析、安规交互问答等十余项智能微应用。
模型中的违章属性智能分析助手已在国网安徽电力风控系统综合风险督查、违章查处等功能模块中应用,可有效提升违章行为判定的效率、正确性与覆盖率。
4.国网首个“大模型”技术领域发明专利授权
2024年2月18日,信通公司快速预审发明专利“一种知识大模型预测用户侧负荷方法、装置及设备”成功获得国家知识产权局授权,仅用时59个工作日,成为国家电网公司首个“大模型”技术领域发明专利授权。
该专利依据天气的综合变量及多个时间尺度的用户侧储能负荷数据,建立用户侧负荷预测知识“大模型”。利用这一“大模型”技术,改进了窗口神经网络进行用户侧负荷预测,大幅提升了预测算法的精度、稳定性和适用范围,解决了现有技术中无法有效应对用户侧储能负荷变化不确定性因素及深度学习算法适用范围受限的问题。
5.国网山东:常见缺陷智能识别模型
近年来,无人机广泛应用于电网巡检,而大量飞行照片仍需要人工逐一验看,影响了故障排查效率。国网山东电力组织由业务骨干和业内互联网专家构成的科研团队,探索人工智能大模型技术在无人机巡检缺陷排查方向的多层次应用,现已开发出杆塔异物、绝缘子破裂等10个常见缺陷的智能识别模型。
这一系列模型在一线班组试点应用后,设备缺陷识别准确率由原来的85%上升到92%,照片误检情况大幅减少。
6.国网聊城:大语言模型应用于供电服务指挥
“110千伏开发区站全站失电如何处置?”2023年8月17日,国网聊城供电公司供电服务指挥中心的工作人员孙凯通过提问的方式向人工智能ChatSGM(电网大语言模型)询问事故处理方案。
“事故影响:开发站全站失电,造成xx条10千伏线路停电。其中xx个二级用户xx、xx…停电。负荷恢复按以下方式处理:开发区站10千伏聊城I线倒至110千伏聊城站10千伏聊城II线……”按下回车,ChatSGM立即输出了开发区站全站失电后的故障处置方案。孙凯和同事经过仔细比对,发现输出方案和他们预想的一样,证明ChatSGM已成功部署并可完美应用于供电服务指挥工作。
聊城公司借鉴ChatGPT的实现模式,利用上万条电网专业数据,对国产开源大语言模型进行“投喂”训练,创新性采用“离线式、本地化”部署方式,既避免了因违规外联导致数据安全问题,同时强化了大语言模型对电力相关数据的理解、总结、归纳和推理能力,最终打造出适用于电网,尤其是供电指挥领域应用的ChatSGM。
ChatSGM的部署实施,不仅提高了配网调度员的工作效率,也改变了传统意义上的调度方式。以往需要几个小时甚至几天时间,还需查询不同系统才可制定的方案,现在可以“毫秒级”输出,从根本上提高了配网调控的智能化水平。
1.南网电力大模型——大瓦特
2023年9月26日,南方电网人工智能公司正式发布了电力行业人工智能创新平台及自主可控电力大模型,并命名为“大瓦特”。
它是电力行业首个跨NLP/CV模态大模型产品,实现了算力、算法、应用全过程的自主可控。这意味着“大瓦特”不仅在技术上具有先进性,而且在应用上也更加灵活和自主。
“大瓦特”还具备多种能力,如意图识别、多轮对话、总结提炼、自动生成巡检报告、可视化数据服务、知识增强以及跨模态交互等。这些能力使得“大瓦特”在智能客服、输变配、电力调度和安监等垂直领域得到了广泛应用,成为业务人员的重要助手。
值得注意的是,“大瓦特”的训练数据主要来自于电力行业基础知识、电力业务制度规范以及电力行业研究报告等,参数量达百亿。这使得“大瓦特”具备电力系统内多专业领域工程师的知识和经验,从而能够更好地服务于电力行业。
2.南网“驭电”智能仿真大模型
随着新能源大规模并网,电力系统规划和运行面临高度不确定性、高度可变性、海量调度单元、多目标和多约束决策等重大技术挑战。在这种情况下,既要保证电力系统安全,又要最大限度利用好新能源,系统仿真分析很关键。
过去的仿真工具,主要将电力系统建立数学模型,求解高阶微分代数方程,面对大规模新能源带来的维数灾难,传统仿真的计算能力和效率已面临瓶颈。
与传统仿真相比,“驭电”智能仿真大模型是典型的数据驱动,它从基础模型开始就自主开发,没有采用类GPT通用大模型作基础,而且在底层算子和训练机制中嵌入电力系统规律,使得它能够非常高效地完成电力系统分析的各种高级功能,可广泛用于电力规划优化、系统安全分析、运行方式安排、电力市场运作等场景,支撑新型电力系统演进规律研究等。
南方电网北京研究院高级技术专家陈亦平介绍:“现在完成的是300节点级电网拓扑的训练,能够实现电网运行方式智能生成和系统潮流安全分析功能。我们正在策划2000节点系统的训练,以适用更大规模电网,并支持小扰动稳定分析和暂态稳定分析等下游任务。”
3.南网:首个自主可控的配网AI大模型
近日,南方电网公司首个自主可控的配网人工智能大模型(以下简称配网AI大模型)在广东电网公司广州供电局发布上线并投入实体化应用,这是南方电网公司发布电力“大瓦特”(人工智能模型)以来聚焦配网领域智能巡视场景下的首次工程化实践应用。
配网AI大模型应用于配网生产运行支持系统(边侧),首次将配电AI大模型深度嵌入至巡视业务流程与操作步骤,进一步深化人工智能技术在设备状态评价、缺陷隐患诊断、外力破坏防范等方面的应用。人员层层上报巡视结果的传统模式将逐步转变为兼具规模化、精细化、少人化等特征的智能巡视新模式,为一线生产人员减负增效赋能。以单条10千伏馈线巡视工作为例,传统模式下的平均巡视工作量为现场巡视的8人·工时,在新模式下预计减少至后台人工复核的0.2人·工时,巡视时长减少97.5%,显著提高配网巡视效率。
据了解,配网AI大模型基于南方电网公司“大瓦特”L1级30亿个参数底座,广州供电局在研发过程中深度聚焦样本供给、算力建设、模型优化等。
截至4月30日,广州越秀局、海珠局、黄埔局、南沙局、番禺局等区局已上线试用配网AI大模型,累计开展6项巡视任务,整体对积水渗漏、小动物侵扰等异常识别率达80%以上。此外,配网AI大模型还能高效识别出鸟巢、飘挂物、瓷质绝缘子破损以及绑扎带缺失等6项配网典型缺陷隐患,为配网“机巡替代人巡”提供更优质、更可靠、更便捷的人工智能技术支持。
4.全国首个电力生产应用场景大模型“大瓦特CV”
基于南方电网“大瓦特”底座,2024年1月17日,南方电网广西电网公司在南宁发布广西输电人工智能大模型——大瓦特CV。这标志着全国首个全栈自主可控电力生产应用场景大模型在广西落地,它是国内电力行业生产域首个在生产环境上线的应用大模型。
和传统小模型相比,输电人工智能大模型在准确率、泛化能力、识别效率等方面表现优越。首先是参数量从百万级提升到亿级;其次是缺陷隐患识别效率提升了5倍,准确率提升15%,能够更加精准地表述缺陷隐患类型和位置,解决模型碎片化问题,更好地处理未见过的电力业务场景缺陷。
在新的电力生产场景下,输电人工智能大模型对鸟巢、绝缘子自爆等典型缺陷的识别精度,基本实现了对人工的替代。目前,广西电网机巡管理平台和输电运行支持系统已实现与输电大模型的对接调用,平均缺陷识别率为91.24%,达到电力行业领先水平。
5.电力行业首个多模态预训练大模型“祝融2.0”
2023年9月,深圳供电局电力行业首个多模态预训练大模型——“祝融2.0”上线,它让传统的电网AI技术拥有了类似ChatGPT的逻辑推理能力、文字表达能力,电力巡检系统不仅会看、会记录分析、会预警,更能看得懂、会推理、会表达,电网安全隐患告警有效率提升了6倍。
基于该技术,深圳供电局已完成输电山火烟雾、外破隐患、安监违章行为等大模型研发,预计每年可减少无效告警30万条,节省125人天。深圳供电局还与云南电网信息中心、昆明供电局联合开展输电山火烟雾模型验证工作,并初步将该技术用于两地输变电山火烟雾、外破隐患等巡检任务,识别准确率高达98%。
深圳供电局与云南电网还建立了联合攻关合作机制,跨区域组建创新联合体,加快“祝融2.0”在输变配、安监、营销等领域的有效落地,并计划研发能辨别声音的“祝融”,为外力破坏等隐患的排查工作增添新的助力,推动电网户外复杂环境下数字化巡检效率的提升。
2024年,南方电网已完成了多个大模型相关项目的招采工作,如“南网总调电力系统AI基础训练设施关键技术项目-电力系统NLP大模型技术研究与应用”、“ 南网科研院2024年面向电力行业大模型的安全训练及推理功能集设计研究与组件开发”等。相关团队正联合百度智能云进行联合创新。
在金融行业,某大型国有银行,去年还只是在客服助手、柜台助手场景,展开几千人的小范围试点,今年已将这些功能正式上线全国几大客服中心,并面向全国一线柜台员工推广,大模型的日活达到数万。
在汽车领域,吉利研究院人士在近期一场大会上坦言,“现在车企出去卖车,车上没有搭载大模型,都不好意思卖自己的产品”。大模型在卷智能座舱、自动驾驶,也赋能数字营销、用户运营等场景,最近已开始为吉利旗下所有公司做赋能。
在政务市场,各地政府结合当地产业都做了大模型规划。“先做智算中心建设,今年底到明年Q1,智算中心将规模落地,之后将开启大模型和地方产业的结合。”一位政务人士谈及市场进度。而科教文卫已开始应用落地。“一些三甲医院,甚至已投资数千万,做场景尝试。”一位医疗人士称,院长们关注的是病例生成、人财物的管理、科研这些与服务水平、管理和科研水平紧密相关的场景。
港口这个进出口贸易大通路,也已探索和布局。“我们看到,很多客户把大模型写进了未来三年的IT规划。”百度智能云物流运输解决方案总经理扈维告诉数智前线,不同于过去几轮技术变迁,这一轮里“观望的少,上手试的多”。
比如,货物吞吐量全球第一的山东港,目前已完成大模型在智能问答和智能问数的试点探索,这两项功能已面向全体员工上线。
在化工行业,中化信息和百度智能云一起,探索利用大模型进行新材料的研发,知识助手“化小易”能够通过自然语言提问,检索回答分子特性、分子合成路线等专业知识。目前,特定分子的检索效率提升5倍以上,研发工作效率得到极大提高。
这种热烈情绪,也反映在招投标市场。公开数据显示,今年1-8月,国内大模型中标项目数量已经达到2023年全年数量的5倍,中标金额达到去年全年的2倍。其中,头部大模型厂商在拿单上依然占据主导。百度在大模型中标项目数量、中标金额、覆盖行业以及覆盖央国企数量,四个关键指标上排名第一。
而据数智前线不完全统计,7月1日至9月15日,仅两个半月内,大模型相关中标项目总数至少有286个,成功赶超上半年6个月的项目总数。
采购方中,运营商、能源、教育、政务、金融等,依然出单最多。一个明显迹象是,一些企业提出更多更细分的需求,数据采集和治理、大模型安全、人才培育等采购都在大幅增加。
比如南方电网,在7月至9月中旬的两个半月内,完成了至少15个大模型相关项目的招采工作,国家电网也在Q3有多个大模型相关项目完成招投标。
百度智能云能源电力行业总经理李超说,南网早在去年9月,就发布了自主可控大模型——“大瓦特” 。其中,百度智能云千帆大模型平台为电力调度场景提供了技术支持。今年Q3,南网完成了最核心业务部门——南网总调的大语言模型选型工作,百度成功入选技术服务方。
1.国家能源集团:能源通道大模型
2024年7月4日,国家能源集团数智科技公司自主研发的能源通道大模型(基石大模型),首次在世界人工智能大会亮相展出。
国家能源集团利用煤电化路港航各产业生产运营过程中的设备、货物、物流、销售、气象等数据,对通用大模型进行强化训练,建立具备增强知识潜能的能源通道行业大模型。以该模型认知能力为核心引擎,可构建以煤炭、电力、铁路、港口、航运、化工、销售生产运营计划为驱动的模型体系,形成智能查询与问答、智能平衡与调控、智能预警与通知、智慧分析与决策四大核心能力,全面支持集团实现“全景、共振、变易”的一体化运营调度,显著提高集团煤电化运一体化运营决策效率和运营能力。
与通用大模型相比,该模型融合了产业特定数据与通用数据,具有“更高产业属性、更优专业性能、更强安全保障”的优势,致力于深入能源生产、运输、销售、储存、使用等全流程场景,解决真实的产业问题,为推动能源行业数字化转型、智能化发展提供了坚实的技术支撑,展示出国产人工智能技术通过数据分析和智能决策,推动能源高效生产管控与可持续发展的创新实践。该模型于6月20日成功入选工信部遴选行业大模型优秀成果案例。
2.火电领域首个电厂AI助手
2024年1月29日,国家能源集团国电电力应用国产开源大模型技术进行电厂智能化系统升级,依托上海庙公司构建了火电领域首个燃煤电厂专属的“智能大脑”——AI助手,为电厂智能化发展提供了全新的解决方案。
“智能大脑”与现有智慧管理平台体系及历史知识数据对接,在实践过程中实现了AI助手智能问答、智能检索、知识生成等功能应用,辅助生产和管理人员科学决策。通过对消缺记录、缺陷分析、检修记录等多方面数据的全面利用,在消缺决策建议、安措危险提示、设备智能检索等多个业务中为员工提供直接帮助,也使员工能够方便、快捷地获得所需知识和答案。
1.中核集团核工业“龙吟”大模型2.0
2023年9月7日,中核八所自主研发的中核集团核工业“龙吟”大模型2.0版正式亮相。
得益于模型参数和训练方式的提升,“龙吟”2.0在核工业公共知识和特有知识领域的表现上,相较1.0版提升了1.7倍,语言能力提升了1.2倍,不仅在业内主流benchmark(C-EVAL/CMMLU/SUPERCLUE)表现优异,更是在核工业领域benchmark Nu-EVAL上取得最佳成绩!
中核八所与秦山核电合作研发的核反应堆控制保护数字工程师在“龙吟”2.0的基础上同样进行了升级。在自助式知识库的加持下,数字工程师能够更加准确地辅助现场工程师,让问答有理有据,解决大模型幻觉问题,让大模型的能力与核安全文化落在实处。
其他能源行业大模型:
1.中能拾贝:拾贝云能源大模型
拾贝云能源大模型通过精心设计的五大应用模块,为能源电力行业提供了一站式的智能化解决方案:
巡检大模型:整合巡检规程、运行规程等,通过智能对话问答系统,提供基于自然语言模型技术的高效巡检支持。
技术监督大模型:利用自然语言处理技术,将非结构化数据转换为规则和模型,自动化生成技术监督报告,极大提升工作效率。
检修大模型:涵盖设备检修全周期知识,自动生成检修计划,为检修人员提供决策支持,确保设备运行的高效和安全。
作业风险大模型:通过针对性的知识微调训练,增强大模型在作业风险管理领域的应用能力,提升风险管理的智慧化水平。
两票大模型:结合设备状态实时数据,自动校验设备运行状态,提高工作票和操作票的准确性和可靠性。
2.羚羊能源大模型
2024年6月27日,羚羊能源大模型在京发布。该大模型以讯飞星火大模型的通用能力为核心技术底座,结合能源行业场景实际需求,打造能源内容生成、能源知识问答、能源理解计算、能源任务规划、能源多模态5大核心能力,涵盖设备运检、电力问数、电力营销客服、辅助电力交易、新能源功率预测、安全生产等6大“大模型+能源”场景应用。
羚羊能源大模型具备五大核心能力。其中能源内容生成能力,可以生成安全培训检修报告、两票辅助生成行业报告;能源知识问答能力可以对设备维修知识问答,提供故障诊断和工艺辅助;能源理解计算能力针对智能问数进行数据解读,实现图表生成和参数优化;能源任务规划能力可以对任务规划进行插件调用,实现系统交互和设备控制;能源多模态能力可以完成光伏缺陷检测、安全隐患识别、基于语义指令的图像理解等能源场景任务。
羚羊能源大模型通过六大核心场景应用,为能源行业带来全面焕新。在设备运检上,它成为电力场站的“数字化运营大脑”,提供精准事故研判和智能决策支持;在电力问数领域,它简化了数据获取流程,提高台区经理工作效率;在电力营销客服中,利用大语言模型技术,实现咨询与业务办理的自动化,提升用户满意度;在辅助电力交易方面,通过时序预测能力,实现电力供需的动态匹配,优化交易决策;新能源功率预测则通过综合建模,提高预测准确性,保障电网稳定;而在安全生产上,羚羊能源大模型引入AI技术,强化安全要素检查,确保电力生产安全。目前,科大讯飞、羚羊已经和国家能源集团、中国石油等展开相关合作。
3.气象大模型“伏羲”2.0
2024年6月3日,在上海科学智能研究院和复旦大学联合举办的“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式上,面向产业应用的伏羲系列气象大模型2.0发布。
“伏羲”是人工智能驱动的次季节尺度气象大模型,可提供42天时长的预测,单次预测推理时间小于10秒,曾亮相第28届联合国气候变化大会(COP28)。
相较于去年推出的1.0系列,“伏羲”2.0的中期天气预报大模型和次季节大模型,面向新能源、航空运输等行业取得进展。相当于为风电场和太阳能电站装上智能导航系统,能带来更准确的风速、辐照和发电能力预测,优化风电和太阳能发电的效率、平衡电网负荷、减少弃风弃光等。
上海科学智能研究院地球科学负责人、复旦大学研究员李昊介绍,“在面向气象导航对伏羲大模型进行优化的过程中,我们提高时空分辨率,实现未来15天0.1度逐小时气象预测;构建海气耦合模型,纳入风浪、涌浪、海温等要素,提升全球风、浪、流、能见度等预测精度;进行极端天气优化,提升台风、极端降水等更多灾害性场景的预测精度。”多层次焕然升级的“伏羲”2.0,有望助力解决远洋气象导航长期依赖国外服务厂商问题,落实“国船国导”。
此外,升级后的“伏羲”2.0相对数值模式计算速度有千倍以上的提升。这种突破不仅提升了预报的精度和时效性,也能为相关产业带来显著的经济效益。
4.江行智能:新能源智能运维解决方案「源问大模型」
再在7月4-6日举行的2024世界人工智能大会暨人工智能全球治理高级别会议上,江行智能“基于复合大模型的新能源智能运维解决方案”「源问大模型」成功入选AI赋能新型工业化创新应用优秀案例。
江行智能将「源问大模型」定义为电力能源领域的垂直大模型。针对发电功率预测、设备故障识别、负荷精准预测等业务需求及行业知识管理与可信问答需求,创新性提出面向垂直领域业务需求的大模型总体架构和方案。
该大模型不仅能够实现电力系统环境风险因素实时监测、识别分析人员违规行为,还能通过数据分析和模型预测实现设备故障的早期预警和处理。通过自动细化和调整模型参数,模型可以持续进化,灵活适应外界需求,加速能源电力领域智能化进程,助推行业技术创新。
目前,江行智能「源问大模型」可与现有业务系统无缝对接,提供智能化业务支持,解决方案不仅适用于传统火力发电,也兼容水力、风能和太阳能等可再生能源的发电方式,并涵盖电网调度、发电智能巡视、发电功率预测、负荷预测和设备维护等多个环节,实现全方位赋能电力生命周期管理。
5.龙源电力:新能源行业首个人工智能模型训练
开发、推理与效果性能测评一体化平台正式
2024年6月,由龙源电力研发打造的新能源行业首个人工智能模型训练开发、推理与效果性能测评一体化平台正式上线投用。该平台首次实现训练素材导入、计算资源整合、AI模型训练、模型推理、效果测试、性能测试的一体化,满足视频、图片、数据等新能源业务模型的开发、迭代、测评,为新能源行业数字化转型升级、AI辅助业务决策提供新质生产力。
该平台部署于数台训练、推理、存储服务器构建主分节点的稳定型服务器集群,具有素材上传调用便利、算力按需自由选择、测评程序自主可控等特点,全面实现了AI模型全链路、自主化、标准化开发。
技术人员将标注图片上传至平台,存储于平台指定位置作为训练或测评素材;随后根据需求选择训练算力资源,在全代码环境下调用训练素材进行模型训练;最终提交模型至推理环境下识别分析,并基于可自由调整的测评程序,以分数形式确定训练模型的识别效果、性能及准确率。目前,该平台已正式运用于龙源电力新能源智能算法竞赛,针对参赛团队的模型进行数值化评定,同时对生产环境下已运行模型与参赛优秀模型进行优劣对比,以数值形式对模型优化工作进行效果判定,跟踪模型升级部署后的实际效果。
6.龙源电力:风电机组功率曲线图像识别AI模型
2023年8月7日,国家能源集团龙源电力工程技术公司上线国内首个风电机组功率曲线图像识别AI模型,率先实现风电机组功率曲线特性分析筛查的自动化和智能化,填补了行业空白。
风电机组功率曲线是考核风电机组性能、评估机组发电能力的一项重要指标,功率曲线异常不仅会导致电量损失,也会降低设备发电效率、缩短部件运行周期。功率曲线筛查的常规方法依赖专业人员个人经验,容易效率不足、准确度参差不齐。
为解决上述问题,龙源电力收集标注上万张典型功率曲线异常图片,依托主流图像识别模型自主训练AI模型,通过不断优化模型算法,使模型的正样本分配策略达到最优,实现了针对不同机型风电机组功率曲线8类典型问题的识别。经过场站3个月运行数据的实验验证,该模型在近14000台风电机组中检测出异常机组数量1860台,准确率超过80%,工作效率提升3倍以上。
7.光伏行业首个“人工智能+”产品“爱管家”
随着光伏发电的普及应用,用户对于光伏电站管理的智能化需求也日益提升。
爱士惟基于阿里云通义大模型,打造出 “爱管家”这样一款智能助手。“爱管家”支持多模态多语言的输入和内容输出,用户可以通过文字、语音、图像等方式与之对话,而它则可以根据用户的自然语言提供疑问解答,包括行业信息、产品数据、故障技术支持等。
“爱管家”具备强大的数据整合能力,不仅能够对光伏电站的数据进行智能分析,还能够根据用户习惯和对话内容,生成不同的电站状态和收益报表,并以可视化的方式进行呈现,帮助用户更加轻松地掌握电站的运行情况,大大提高了电站运维的透明度。生成式AI+三亿多条的物联网运行数据,使得“爱管家”不仅能够精准地预测电站发电量,还能够根据动态电价和用户的用电需求,制定最佳用电方案。相比传统的能源管理系统,“爱管家”通过独有的能源管理算法可以更加智能地预判储能电池等设备的最佳充放电时机,从而更加极致地实现削峰填谷、进一步降低用电成本。根据平均实验数据显示,使用“爱管家”的光伏储能系统可以比传统能源管理控制的光伏储能系统多节省约15%—25%的用电成本。
8.宁德核电:全球参数量最大的核工业大模型
2024年3月,中国广核集团福建宁德核电有限公司(以下简称“宁德核电”)发布了自主训练的大模型「锦书」,这是专为核工业领域打造的大语言模型,其参数规模达到 720 亿。「锦书」拥有中国最大的核工业大模型语料库,训练语料超过 20 亿 token,涵盖了核运行、核物理、核燃料、水化学十余类通用核工业语料以及规程、系统设计书、经验反馈单等十余种工作文件语料。基于“锦书”大模型,宁德核电进一步开发出了国内首个核工业大语言模型应用平台——“云中锦书”。该平台集成了智能培训系统、个人岗位晋升系统等多个应用,为核电行业的智能化发展提供了强大的支持。
此外,“云中锦书”还构建了核工业首个企业级大规模智能知识管理系统。这个系统整合了海量的核工业知识资源,支持个人知识库的构建和使用。通过智能知识管理系统,工程师们可以方便地获取所需的知识和信息,提高工作效率和质量。同时,该系统还打破了各工种之间的数据孤岛,实现了技术平权,让每一个工程师都能够充分发挥自己的潜力。
9.我国核能领域首个大模型智能审查系统
2024年2月,上海核工院自主研发的我国核能领域首个大模型智能审查系统上线。
智能审查系统采用了国际先进的大模型人工智能技术,参数规模超过130亿,具备自主学习能力,并能理解核电设计领域的法律法规。在多专业、多学科的智能审查库构建基础上,能够快速、准确地识别设计文件中的潜在错误和瑕疵,同时还能有效解决设计文件审查过程中高度依赖资深工程师经验、设计文件复杂、安全要求高等问题。
值得注意的是,相较于传统的人工审核模式,智能审查系统审核速度可提高约百倍,单项目可节约成本超过1000万元。
02
大企业们,讲求“顺势而为”
这轮最早向大模型跃迁的企业,原来几乎都有小模型的底子。如工行在2021年前后已立项,想用“更大的模型”搭建OCR等业务应用。“ChatGPT来了之后,他们顺势把大模型项目立了起来。”一位金融人士告诉数智前线。
安全生产市场受到政策监管,对央国企而言几乎是一个底线。此前,国家能源集团最大的风电二级公司龙源电力,采用传统小模型安全方案,纳管了旗下200多个风场、1万多台风机,形成生产现场从安全监视、分析、告警到处理的闭环。今年二季度,百度中标了该项目升级版,将结合CV大模型的泛化、识别更准确的特点,以及大语言模型的能力,让之前大量采集的信息真正用起来。
什么是原来小模型不能干、现在大模型可以发挥价值的?扈维举例说,港口里的调度,人员排班、泊位、堆场等,以前都用小模型分别做过,效果也不错,像堆场计划,其实是一个数学算法问题,小模型非常合适。但是,将这些合到一起做“一体化调度”,小模型实现不了跨数据集、跨设备之间的大规模协同计算、协同统筹。“我们特别希望大模型能够解决,挑战是港口里的数据汇聚,要花时间。”
在工业行业,传统CV小模型在遇到小样本时,识别率比较低。而借助CV大模型,可以提升小样本数据的识别率。
不少企业也缺少知识管理、沉淀和应用平台。现在借助大模型和知识检索,企业可以形成知识管理的平台能力,完成隐性知识的显性化、显性知识的结构化、结构知识的关联化、关联知识的流动化这些工作。
很多企业定期要召开生产经营会,对齐数据是一个非常困难的事。而借助大语言模型,可以更快、更准地去汇总、抽取结果,完成初步分析,对用户来说价值非常高。
03
走入核心业务,要找到“手和脚”
李超观察,过去两年,大模型的应用还属于起步期,集中在办公、客服这些助手场景里。这与投资达数千万、上亿甚至百亿规模的央国企管理层的期待,是完全不一致的。现在,大模型要深入企业的核心业务。
“在能源行业,我们在投入一个方向——仿真优化。”李超说。在行业里,有大量的工作任务与机理、科学计算相关,这是大语言模型或CV大模型没办法做的。“这些问题不解决,我们所畅想的未来——以大模型为能力中心,提供一个完整的Agent服务,是无法实现的。”李超说,未来一定是大模型结合专业领域的小模型,才能深入到客户核心业务场景里去。
“过去几年,我们在这个方向上打了一些基础。”李超说,百度提供仿真优化引擎,与行业伙伴一起进入电网调度、石油石化炼化、油气勘探场景,探索电网调度的电网潮流稳态分析、石油石化的空能岛运行优化、脱硫脱硝等与机理模型相关的实际项目落地。今年9月,百度也参与了国家管网智能调度的投标。
“这些都是客户非常关注的核心生产方向。而且,我们认为这些方向是未来以大模型为调度中枢,整体构建一些智能体的服务时,必不可少的这个‘手和脚’。”李超说,他们将特别投入精力,来规划这些“手和脚”。大模型是大脑,有了这些“手和脚(专业的API)”,才能真正实现核心场景服务。
“在港口,我们先通过问答和问数,让客户看到,原来大模型是靠谱的,然后再逐步切入核心业务系统。”扈维说,“我们在山东港口集团已在规划下一期,会更多深入到业务场景。”港口是一个复杂的交通枢纽,最核心的就是货、人、卡车、龙门吊等的调度。此前,港口引入的TOS系统(码头操作系统),逐步加入了AI算法。而大模型能进一步解决更多元数据接入的问题。
随着大模型走向生产核心系统,全球大模型核心比拼的一项能力是逻辑推理。“我们在客户现场做的测试中发现,不同大模型对于复杂问题的逻辑推理,差距比较大。”另外,以前港口里布置的大量摄像头产生的视频资源,其实没有用起来。现在的一个方向,就是把这些原有的硬件和图像资源,利用多模态大模型做整合,从而达到一个更好的全局协同。“这是我们在探索的一个方向。”
04
74%的AI工作负载都在云上
大模型落地是个复杂的系统工程,随着企业进入深水区,一些落地的门道和路径,正在加速浮上水面。
“我们去对接客户时,第一件事,是要帮他们摸清大模型的边界。”扈维告诉数智前线,为避免认知不统一而导致后期出现交付不了或离客户预期太远的局面,他们现在基本每个项目,都会经过“轻咨询+落地实施”的完整过程。
在智算算力的搭建上,IDC的数据显示,74%的AI工作负载都在云上。但今天智算的技术范式已发生变化。在CPU云时代,大家最关注弹性和极致性价比,而GPU云则是能不能发挥一个大集群的算力能力。这样的集群不仅成本高昂,也有一定的技术门槛,因此,云厂商仍然是一个主要角色。
除了算力,数据的重要性在不断显现。据数智前线不完全统计发现,2024年Q3,数据购买、采集、治理等相关的采购正大幅增加。
在数据层面,比如港口客户的数据都存在各码头公司的服务器里,扈维建议客户成立专门的数据小组。
谈到数据,还有更深层次的问题。“现在业界谈大模型必谈数据,但坦率来讲,很多都是空谈。”一位行业人士坦言。
“大模型时代,数据到底要怎么准备,怎么治理,怎么把不同的数据应用到大模型训练的不同阶段里,绝大部分人都还是在盲人摸象。”李超表示,百度也在这个过程中踩过不少坑。
比如,当基于通用模型训练行业模型时,数据该怎么配比就有技术门道。喂给大模型少了,效果不明显;喂多了,模型又不容易收敛,甚至可能导致模型的通用能力下降……这些踩过的坑,后来都被沉淀了下来,形成了一套工具和方法论,通过千帆平台和专门的技术服务团队,对外输出。
大模型技术和应用之间也容易出现断层,很多“用户单位不了解AI,AI的单位不了解行业”。李超介绍,为解决断层,他们除了配备具有行业背景的解决方案架构师外,也会在伙伴挑选时有所侧重。“能源行业合作伙伴,我们基本只选两类,一类是客户产业单位,一类是在客户产业公司里做人力外包服务的公司。”李超告诉数智前线,他们的共同特点是,既深度参与和理解客户业务,又了解IT行业。
此外,大模型在具体场景的落地过程中,还需要做很多工程化工作。比如大模型习惯以“总分总”形式输出答案,回答每次也有所不同,但有些客户更习惯“先分后总”的方式,并且希望回答能实现“复现”。“即便只有语序、语法的微小变化,有些港口领导也是不能接受的”,扈维举例说,这就要求他们做很多工程化工作,保证大模型的输出符合客户预期。
从企业落地整体情况来看,客户的需求维度是360度的。有趣的是,目前所有云公司都在从云的合作伙伴,转向AI转型战略伙伴,围绕AI基础设施、算法模型、数据、部署调优以及定制化等,进行整体技术能力升级。
05
人的因素
一位科技企业CIO在大模型建设和应用推广中,遇到了不小的阻力:一线员工和部门不配合,哪怕是领导说了也没用。当公司上了代码助手后,综合效率提升了1/3。“虽然我们很少谈论减人,但确实意味着写代码的人,要往开发的前端或后端转岗。”一线员工担心被裁员,一些业务部门有地盘意识,这都是现实问题。
在很多传统行业大企业,最大的阻力来自工作惯性。很多一线员工都是老师傅,现在让他用上设备检修助手,他会说,“有事情还不如我自己倒腾试一下,或者我给老张打个电话,一辈子就是我们仨一块干的”。
“大模型是个一把手工程。”一位金融业人士观察,需要从上到下推进。高层领导在公开场合支持标杆项目。“有时不反对也是一种支持。”
“在前期把业务部门拉进来,一起参与到建设和最后采纳推广中。”爱分析创始人CEO金建华说。像维修助手,可能集团有集团的想法,子公司有子公司的想法,一线员工有一线员工的想法,怎么把大家的收益预期对齐?这是一个有关平衡的问题。比如,有些知识图谱建设由二级公司老专家来做,让大家为共同目标推进。
企业也需要定期披露标杆项目运行情况和业务收益,公开予以激励。“比如给员工一些积分,并与一些制度挂钩,兑换一些礼品。”扈维观察。“我们会与绩效、奖金直接挂钩。”一家科技企业CIO说,“虽然有些简单粗暴,但确实有效果。”这需要管理层的配合,以及调动HR资源。
第一次使用的留存率也很重要。要想办法把改版迭代后员工第一次登录的体验做好,比如入口做得足够清楚,以前不准的现在准了,企业员工就会持续使用。
从业务部门视角,设计有感染力、有画面感的故事,让一些老师傅现身说法,可能会有感染性。项目的日活、月活等数据同样重要。这些都是培养企业的AI文化。
大模型的落地浪潮还在持续汹涌。激流之下,产业链上各路玩家,都在持续加码, 推动更多企业实现数智跃迁。