虽然ChatGPT带来的大语言模型热潮已经进入冷却期,但我觉得这只是因为它刚出世时太过惊艳、导致了人们过高的期待。其实GPT、Gemini以及国内的文心一言等等大模型,一年多来始终都在稳定的进步。特别是ChatGPT,去年底融合了图像智能模块Dalle、又增加了语音输入功能之后,“多模态”理解能力明显上了一个台阶 —— 能够看懂图片、听懂人声、思考推理,语音输出。
所以前几天杨老师趁着闲暇,编写了一个Python程序,通过调用 ChatGpt-4o 的上述功能,让它完全接管我的电脑,帮我在Excel里进行财务报表分析,然后完成高亮数据、画统计图等操作。至于杨老师本人,只需要通过麦克风发号施令,提前享受未来办公模式。(视频提示:开头为基本操作、0:22 —1:10为自动财务分析、1:11 — 1:44 为自动高亮和自动绘图)
需要说明一点:现在的ChatGPT仍然不够稳定。有时会误解我的命令 —— 比如把“高亮第四季度” 理解成 “高亮第4行” ,有时会在分析数据时犯下明显的低级错误 —— 比如把现金流量第二名硬说成第一名。因此并非每次试验都能成功,上面的视频是我多次试验后选出的最佳效果。
尽管如此,杨老师还是感到很震撼,相信看过视频的朋友也会同感。当年在同济做科技创新研究时,我曾经做过北京大学路风老师的教学秘书,跟随路老师研读了一些技术创新案例的历史脉络。让我感触很深的一点(也是路风老师反复提点的地方)就是:人类历史上所有重大创新虽然看上去似乎是突然爆发、一夜成名,但其实没有任何一个是偶然产生的。在它之前一定会有长期的、来自各个方面的技术积累,逐渐发展和汇聚在一起,又赶上市场需求或技术轨道的变化,最终形成一个爆发的奇点。
我想今天的人工智能也是如此。也许几年之后,上面视频中的效果会成为稳定的常态,届时生产和办公的模式、企业组织模式乃至更宏观的社会组织模式,又会变成怎样呢?