中国企业对于生成式AI应用场景的了解都来自于ChatGPT的传说,但中国企业能使用的GenAI资源与ChatGPT却没有关系。直截了当地说,中国企业目前能够使用的GenAI资源都比GPT-4要差很多,注意不是“有差距”,而是“差很多”,这是中国企业考虑生成式AI问题的基本前提。
但是,另一方面,GenAI技术在快速发展,等到海外公开放出Llama3或Mistral2这样更强大的模型,国内公司“自主创新”后,中国企业就可以开始使用与GPT-4差距更小一点的模型。所以,详细了解ChatGPT等的应用场景,还是非常有必要的,因为这是中国企业目前可以想象的应用场景的上限,超过上限的想象就是幻想,趁早打住。了解上限在哪里,这也是中国企业考虑生成式AI问题的另外一个基本前提。
在这些前提之下,中国企业能否设想一些生成式AI的“应用场景”,投入生成式AI建设,进行概念验证和小规模试用测试。这样去推进生成式AI建设有没有问题?
如果中国企业是开放型的,可以“直接使用”现有GenAI产品,那么这个思并没有什么问题。先研究中国市场到底有哪些成熟的GenAI产品,然后选择市场最优秀的GenAI产品,先订阅或者试用,一段时间后总结应用成效,有实效就继续使用,无实效就停止使用。
但是,如果中国企业是封闭型的,对于GenAI产品只能进行“深度研发”或者“工程化适配”,这样就与“直接使用”的应用模式产生了巨大差别,此时仅仅考虑了一些“应用场景”就着手进行GenAI建设会产生非常大的问题。
原因就是,中国企业以“深度研发”或者“工程化适配”为基础的GenAI建设,对应着巨大的成本,不从业务用例和业务目的的层面把问题彻底想清楚,就动手GenAI建设,会造成巨大浪费。
以“深度研发”或者“工程化适配”GenAI建设,是包含着算力投资、数据费用、AI研发团队建设、提示词工程/RAG/精调的研发与维护、应用集成与业务整合等巨大投入的过程。
GenAI应用不是软件项目,不是“做完了”与“没做完”的问题,GenAI产品是个概率性产品,是关于有用性、准确性、合规性的综合性能问题,没有端到端的长期投入、维护和优化,实际上无法进行严肃的概念验证和小规模试用测试——“项目完成,能效不佳,等于废品,不如不做”。
因此,在GenAI建设之前,中国企业必须完全想清楚业务用例和业务目的,业务流中能不能纳入GenAI,纳入GenAI到底是为了增收还是为了节支,增收或节支能取得多少收益,增收或节支对于GenAI的性能要求是什么,GenAI建设成本和维护成本怎么规划——这个企业级的“GenAI决策模型”必须首先建立起来。
一些决策者可能对此会有疑惑,“应用场景”不就是“业务目的”吗?一个“应用场景是有益的”不就等于是“业务目的是成立的”吗?软件项目可以这样做,GenAI应用为什么不能这样做?
大部分中国企业的软件开发确实就是以“应用场景”为导向的,需求分布式提出、开发分布式交差,造成企业里充斥着数量极大的散乱小软件系统,只不过在这种分布式架构之下,浪费也是分布式,浪费在时间和空间上都被分散了,企业感受不到巨大浪费而已。
以“业务目的”为导向的软件开发,就是要从企业业务架构出发先考虑企业软件架构的问题,先有顶层业务流、数据流的设计,再有软件开发。当前生成式AI的技术发展,正从AI Copilot的第一阶段转向AI Agent的第二阶段,AI Agent则是在直接重构企业核心业务流,企业不首先理顺企业软件架构问题,未来会越来越难以回答“企业应该怎么用好AI”的问题。
大部分中国企业的实际情况是,已经充斥了以“应用场景”为导向的大量散乱小软件,这时就需要再来一次以“业务目的”为导向的软件大重组,这种软件大重组的另外一个名字就是——“数字化转型”。
但是,对于企业GenAI应用,“应用场景”为导向来开发是不可行的,先建设再转型都是不可能的。
N个“应用场景”都设计了GenAI应用,那么这N个GenAI应用互相是什么关系?N个GenAI底层的基础模型之间是什么关系?N个GenAI底层的算力池是怎么规划的?N个GenAI所依赖的数据基础建立了没有(这不是技术问题,是管理问题)?N个GenAI依赖的AI研发团队建设与工程化适配技术能力是怎么规划的?这些问题都是企业软件架构层面的问题,企业GenAI的技术特点实际上在逼迫企业必须先考虑好企业软件架构。
中国企业在根本没有想清楚“企业应该怎么用好AI”、“业务应该怎么与AI结合”的时候,最好不要急着去凑生成式AI的热闹,不要急着去当AI科研试验品,免得出现巨大浪费后不了了之。