企业落地大模型最关心的问题,何解?

时事   2024-09-19 13:49   北京  

去年,海内外巨头与“独角兽”不断刷屏,争相推出自家大模型的“史诗级更新”。大模型也被寄予厚望,“错失恐惧”情绪从大模型厂商传递到每一家有想法和资源的企业身上。


今年,“大模型泡沫论”甚嚣尘上,以高盛6月份发布的《生成式AI:投入过多,收益过少?》报告为例,其中提到,未来几年科技巨头、企业和公共部门将在生成式AI上投入约一万亿美元的资金,但目前来看,这些投资似乎并没有带来预期的回报。


AI会不会陷入新的低谷?成为行业的共性担忧。自从1956年的达特茅斯会议之后,人工智能技术和产业经历了三起三落,少有一类技术能够跨越如此之长的周期,既不归于沉寂也尚未实现规模爆发。


曼哈顿研究所高级研究员Mark P. Mills认为,正如汽车、无线电、互联网等革命性技术,新技术在改变世界之前,都会经历漫长的蛰伏期,绕不过发明创造、商业可行、大规模推向市场三个阶段。


“颠覆性创新”通常每个阶段持续20年左右。例如在汽车发明(1886年)之后多年,T型车设计才出现(1908年),到了20世纪20年代末,美国汽车渗透率上升到20%。


有时创新发生得也会快一点,从“分组交换”的想法到创建互联网不到10年,万维网公开商业化花了20年时间,但只用了10 年时间就看到了显著的市场渗透。


AI技术为时代创造了一个极限弯道赛段,在探索未知的过程中,隐藏在背后的迷雾和暗礁若隐若现。仅就目前来看,企业落地大模型的共性难题,包括场景、数据、成本、IT架构、实践等方面,相互交织又相互联系。


场景之困境:如何找到大模型落地场景


人工智能和机器学习领域的知名学者吴恩达认为,大模型在众多场景中具有巨大的潜力,但也需要与领域知识相结合。


目前学术界与产业界已经达成共识,大模型不是“万能药”,只有把大模型置于具体的场景中,才能兑现技术价值,避免陷入“拿着锤子找钉子”的窠臼。


此前大模型厂商竞争参数和数量,千亿参数、万亿参数的大模型,代表了大模型厂商的硬实力,但在很多业务场景中,百亿级别参数大模型已经足够,十亿级参数大模型也应用颇多。


如果说以前企业更多看到了炫目的大模型,那么现在更关注的是,如何将已有的模型应用到实际场景中,解决自己的具体问题,并且持续评估某个具体场景的前景。如此,企业也从前期探索大模型时的试验性质,转而关注实实在在的指标,可以是降本、增效、以及新体验。


识别大模型落地场景大致可以分为三大方向,商业价值决定了是否值得做,场景成熟度决定是否能做,持续运营空间决定了是否可进化。


数据之难题:如何为大模型做好数据治理


大模型有多依赖数据?在中国科学院院士梅宏看来,现阶段AI的成功源于深度学习,这只是AI研究的一个子领域,其本质是数据驱动的智能、计算实现的智能,即“数据为体、智能为用”,犹如燃料与火焰的关系,燃料越多,火焰越大,燃料越纯,火焰越漂亮。


在深度学习算法没有出现原理变革的前提下,大模型对数据的依赖越来越严重,对算力的消耗也越来越巨大。在这种情况下,数据规模和质量就成为影响大模型落地的关键因素。


值得一提的是,大模型需要的数据,是全场景、全流程、全方位的知识数据。对于企业而言,企业原有数据库和大数据平台中的数据,并不能直接为大模型使用,需要将数据加工为大模型能使用的知识。现实是企业往往不具备相应的数据治理能力,部分企业积累了数据却没做面向AI的数据治理,部分企业只是简单储存了数据,还有更多的企业缺少足够的数据。


企业数据可能存在缺失值、噪声数据、重复数据等质量问题,需要进行数据清洗。数据加工也是常见的需求,这可能涉及到数据的转换、编码、特征提取等操作。例如将文本数据转换为向量表示,以便大模型能够进行处理和学习。


成本之考量:如何在有限成本下探索大模型


成本,贯穿大模型从研发到落地再到持续运营的全过程,早期的算力供给就是一个典型问题,大模型的训练和推理需要大量的算力支持,这就意味着企业需要投入巨额资金来建设和维护强大的算力基础设施。


构建一个大型语言模型可能需要耗费数百万美元甚至更多的资金用于购买高性能的GPU和NPU等计算芯片,以及支付高昂的电力费用和数据中心运营成本。即便企业采取云服务的方式,也需要考量成本。数据的收集、清洗和标注也需要投入大量的时间和金钱,构建一个高质量的数据集可能需要数千小时的人工工作。


企业应用大模型不仅需要评估启动成本,更要考虑运营成本。研究公司Gartner表示,将AI直接部署到公司的系统中,成本可在500万至2000万美元之间,预计到2025年底,30%的生成式 AI项目将因为这些高昂的费用而被放弃。


除此之外,在推动大模型落地的过程中,企业还需要关注IT架构、场景成长路径、人才培养和组织变革等问题,例如沿着大模型的边界构建跨部门协作机制,以便更好地利用大模型技术进行数据分析和决策支持。同时建立一个能够快速响应市场变化和客户需求,减少层级和冗余的敏捷组织结构,对于早期的大模型探索,速度决定生死。


大模型要实现规模落地,仰仗于形成新共识。当所有企业都在寻找新时代的取胜之匙,大模型落地才有业务价值。


9月19日,华为云AI用户峰会举办,众多大咖嘉宾聚而论道,围绕大模型如何与行业深度融合,关于技术和非技术的实践难题,企业的共性需求和个性要求如何满足,大会试图回答专属于这代人的时代叩问。也许,答案就藏在华为云这1000多家AI用户落地人工智能场景的心声和华为云沉淀400多人工智能行业场景的方法论中。


责编|张素玲     编辑|行家玮
本文为广告信息

人民网
权威、实力,源自人民。
 最新文章