开工大吉!送上这份大模型时代下的《 AI 规划指南》

财富   其他   2024-02-20 20:37   安徽  


结束了欢乐美好的新年假期,“AI 圈”却早已风起云涌。OpenAI 和谷歌同天打擂,正月初七双双发布消息,也算是贴心地让大家过了个好年。


眺望前方是雄关漫道,还是通天福地,且看今朝。双手奉上这份大模型时代下的《 2024 年 AI 规划指南》,与君同观。


遇事不慌,处事有方。本次《指南》从心态认知行动3个方面,和大家聊一聊规划思路,文中也会有一些真实心得分享,欢迎感兴趣的伙伴一起加入讨论!


心态上:

人在过年,机器在卷。

跟着机器的节奏,轻松卷~

Sora

会是“世界模型的雏形”吗?

北京时间 2月 16 日凌晨,OpenAI 发布了文生视频模型 Sora,首次由 AI 生成了长达 60 秒的多镜头长视频,视频呈现高模拟度画面、精细画质、多镜头拍摄、多角度运镜,表明其对人类物理世界的理解和观察。

Gemini 1.5 Pro

MOE 架构,100 万上下文。

与 OpenAI 发布 Sora 同天,谷歌推出 Gemini 1.5 Pro,表示最高可支持100万个 token 超长上下文,相当于可以处理四五十万字的超长汉字文档、数万行代码和 1 小时左右的视频文件。


Goody-2

一个“什么问题都回答不了”的 AI ?

在文本、图表等指标上均取得了“零”的成绩…… 但可靠性得分(PRUDE-QA)高达 99.8%,秒杀 GPT-4。问它“2+2=?”它不会告诉你正确答案,拒绝回答的原因是怕“代码信息泄露”。可以说很“安全”了,道德标准极高。(笑)


这一波波“炸弹”,大家又开始担忧 AI 会不会取代人类工作。恐惧来源于未知,人工智能作为一个提高效率的工具,我们要做的是学会使用它、掌握它。

"

世界上只有一种英雄主义,就是在认清人类必将被机器干掉的真相之后依然热爱生活。

"


认知上:

放弃高举高打,小步快走。


我们要学的不是表面效果或形式,通过技术思路触类旁通地启发自己相关业务能力革新。怎么学?用全面拥抱的态度,落地到真正实用的场景。


脚踏实地

不能脱离了真正的应用场景

例如当初的 OWL2 就是个典型的脱离了应用场景的项目。他们最终工作组成员的构成一部分是大学研究人员,另外一部分是大公司做企业级应用的,大部分是远离场景的,最终设计出来的产品(OWL2 语言)也就脱离了真正想去服务的那个场景。

OWL2 最终写出来有 600 页纸,这是一个非常复杂的语言。事实上,也就是在一些少量的企业级应用里面被用到了,在真正的日常应用当中,成功的案例几乎没有。所以这个项目,花了很多钱,最终有没有达到真实想要的目标。


小步快跑

不能使用过于领先的架构

Twine 在 2007 年是个明星企业,但在 2010 年关门了,为什么?

Twine 的 CEO Nova Spivack 说自己试图在太多的地方进行革新,而且使用了一种非常超前的架构( RDF 数据库),导致追求的目标太大,无法达到。像 Twine 这样失败的例子是不罕见的,例如,你的产品只是一个在线应用,可以先把离线的运维工作搞清楚,然后再上线,也可以先用一个小数据集先试一试。

总之,步子不要太大。


……

做一个项目,要从小到大,循序渐进。最后把所有的东西抽象到更高层面上,我自己总结为一个理论,叫 场景跃迁理论

这个理论的核心,是说一个人工智能的公司需要多次的产品市场匹配,就是Product-Market Fit。如果提供了一个产品,市场恰恰需要,而这个市场恰恰很大,就说得到了一个产品市场匹配。

经典的互联网创业,通常做一次产品的市场匹配,就可以成功了。但人工智能往往要做好几次,互联网公司和人工智能公司很不一样。

一个称为养鸡场模式,一个称为养小孩模式。

互联网公司是一种养鸡场模式,它是一个大规模的复杂系统Complex system,关键是可扩展性。我养了一只鸡,我发现这只鸡不错,我养1万只鸡,这就是养鸡场模式。核心就是如何能养一万只鸡,这就叫可扩展性。

人工智能应用是另外一种类型的复杂系统,叫Complicated system,它是有非常多的组件,通常是上百种奇奇怪怪的组件组合在一起。它的核心并不是养一万只鸡,更多像养小孩一样,生完孩子,从小给他换尿布,给他喂奶,教他走路,教他说话,逗他玩,小学、中学、大学,一路把他养大,每一个阶段所面临的主要任务都不一样。你如何能够让这小孩成长,我们把它称为可演进性,这才是 AI 公司最核心的因素。

……

全文阅读:《确保搞砸人工智能项目的十种方法》


行动上:干!

实战出发,注重工程落地。


01
从实战出发
首先需要积累足量的实战经验,优先考虑运用在自己深耕多年的场景。了解实际场景深层业务逻辑和技术需求后,运用对于技术的了解和把握,快速落地场景应用。例如文因在大模型技术的运用与落地中,优先考虑在积累过丰富经验的金融领域,重塑细分场景应用,实现与多位头部机构共同探索实战落地


02
专业性

比如说规则系统,一个人都可以写10条正则表达式,没有问题。但是如果能够写好100条正则表达式,那你一定是一个非常优秀的工程人员,软件工程能力很过硬。如果能够管理好1,000条正则表达式,那你一定是一个科班出身的,有专业级知识管理训练的人。如果你能够真正地管理好10,000条正则表达式,那你一定是一个有非常丰富规则管理经验的人。


当然我说的并不是 copy paste 10,000次,改其中几个字,那个不算。

人工智能的很多事情,困难就在这儿。到网上去拿一个什么开源包啥的,把它做到80%,都很容易做得到。但
难度就在于最后的20%。在实际运用中通常可能需要98%、99%的正确率,才能够满足用户的需求。如果专业性不够,想实现最后这些是非常难的。


03
匹配的工程能力

一个人工智能的技术能不能做得好,核心往往不仅仅是算法,而是底下的架构,还有系统。

工程是解决人工智能的核心钥匙。如果代码能力不行,架构能力不行,工程能力不行,在这个情况下,根本就不应该去谈算法。优先应该
把工程能力补起来,然后再谈算法


从学术界的研究到工业界的实践,有一个非常巨大的差异。为什么呢?

因为在发表论文的时候,完全不需要考虑现实中所会遇到的那些约束条件。所以当决定一个工程问题技术路线的时候,不一定要按照最新的论文趋势来做这件事情,甚至这论文和十年之后的技术都不一定有相关性。

一定要根据现实的情况和约束,来决定技术路线。这份《 AI 规划指南》,我们会继续更新,一起学好知识,摆正心态,加油干!























文因互联是一家 AI 大模型系统应用商,以大模型技术为基座,结合 NLP、提示工程、知识图谱等技术,通过多年行业实践积累,实现对业务文本进行文档解析、智能信息提取、智能内容生成、深度语义理解与关联分析,致力于企业知识的深度挖掘与有序传承,进而助力企业实现提高工作效率,沉淀知识工程。


自成立以来,已服务过金融、建筑、媒体、医疗、航空、通讯等多领域各细分场景,落地上百项目,获得IDC Fintech50、CB Insights Fintech50、毕马威Fintech50等权威机构认证。


文因互联
领域大模型实践者
 最新文章