开工大吉！送上这份大模型时代下的《 AI 规划指南》

财富其他 2024-02-20 20:37 安徽

结束了欢乐美好的新年假期，“AI 圈”却早已风起云涌。OpenAI 和谷歌同天打擂，正月初七双双发布消息，也算是贴心地让大家过了个好年。

眺望前方是雄关漫道，还是通天福地，且看今朝。双手奉上这份大模型时代下的《 2024 年 AI 规划指南》，与君同观。

遇事不慌，处事有方。本次《指南》从心态、认知、行动3个方面，和大家聊一聊规划思路，文中也会有一些真实心得分享，欢迎感兴趣的伙伴一起加入讨论！

心态上：

人在过年，机器在卷。

跟着机器的节奏，轻松卷~

Sora

会是“世界模型的雏形”吗？

北京时间 2月 16 日凌晨，OpenAI 发布了文生视频模型 Sora，首次由 AI 生成了长达 60 秒的多镜头长视频，视频呈现高模拟度画面、精细画质、多镜头拍摄、多角度运镜，表明其对人类物理世界的理解和观察。

Gemini 1.5 Pro

MOE 架构，100 万上下文。

与 OpenAI 发布 Sora 同天，谷歌推出 Gemini 1.5 Pro，表示最高可支持100万个 token 超长上下文，相当于可以处理四五十万字的超长汉字文档、数万行代码和 1 小时左右的视频文件。

Goody-2

一个“什么问题都回答不了”的 AI ？

在文本、图表等指标上均取得了“零”的成绩…… 但可靠性得分（PRUDE-QA）高达 99.8%，秒杀 GPT-4。问它“2+2=？”它不会告诉你正确答案，拒绝回答的原因是怕“代码信息泄露”。可以说很“安全”了，道德标准极高。（笑）

这一波波“炸弹”，大家又开始担忧 AI 会不会取代人类工作。恐惧来源于未知，人工智能作为一个提高效率的工具，我们要做的是学会使用它、掌握它。

世界上只有一种英雄主义，就是在认清人类必将被机器干掉的真相之后依然热爱生活。

认知上：

放弃高举高打，小步快走。

我们要学的不是表面效果或形式，通过技术思路触类旁通地启发自己相关业务能力革新。怎么学？用全面拥抱的态度，落地到真正实用的场景。

脚踏实地

不能脱离了真正的应用场景

例如当初的 OWL2 就是个典型的脱离了应用场景的项目。他们最终工作组成员的构成一部分是大学研究人员，另外一部分是大公司做企业级应用的，大部分是远离场景的，最终设计出来的产品（OWL2 语言）也就脱离了真正想去服务的那个场景。

OWL2 最终写出来有 600 页纸，这是一个非常复杂的语言。事实上，也就是在一些少量的企业级应用里面被用到了，在真正的日常应用当中，成功的案例几乎没有。所以这个项目，花了很多钱，最终有没有达到真实想要的目标。

小步快跑

不能使用过于领先的架构

Twine 在 2007 年是个明星企业，但在 2010 年关门了，为什么？

Twine 的 CEO Nova Spivack 说自己试图在太多的地方进行革新，而且使用了一种非常超前的架构（ RDF 数据库），导致追求的目标太大，无法达到。像 Twine 这样失败的例子是不罕见的，例如，你的产品只是一个在线应用，可以先把离线的运维工作搞清楚，然后再上线，也可以先用一个小数据集先试一试。

总之，步子不要太大。

……

做一个项目，要从小到大，循序渐进。最后把所有的东西抽象到更高层面上，我自己总结为一个理论，叫 场景跃迁理论。

这个理论的核心，是说一个人工智能的公司需要多次的产品市场匹配，就是Product-Market Fit。如果提供了一个产品，市场恰恰需要，而这个市场恰恰很大，就说得到了一个产品市场匹配。

经典的互联网创业，通常做一次产品的市场匹配，就可以成功了。但人工智能往往要做好几次，互联网公司和人工智能公司很不一样。

一个称为养鸡场模式，一个称为养小孩模式。

互联网公司是一种养鸡场模式，它是一个大规模的复杂系统Complex system，关键是可扩展性。我养了一只鸡，我发现这只鸡不错，我养1万只鸡，这就是养鸡场模式。核心就是如何能养一万只鸡，这就叫可扩展性。

人工智能应用是另外一种类型的复杂系统，叫Complicated system，它是有非常多的组件，通常是上百种奇奇怪怪的组件组合在一起。它的核心并不是养一万只鸡，更多像养小孩一样，生完孩子，从小给他换尿布，给他喂奶，教他走路，教他说话，逗他玩，小学、中学、大学，一路把他养大，每一个阶段所面临的主要任务都不一样。你如何能够让这小孩成长，我们把它称为可演进性，这才是 AI 公司最核心的因素。

……

全文阅读：《确保搞砸人工智能项目的十种方法》

行动上：干！

实战出发，注重工程落地。

从实战出发

首先需要积累足量的实战经验，优先考虑运用在自己深耕多年的场景。了解实际场景深层业务逻辑和技术需求后，运用对于技术的了解和把握，快速落地场景应用。例如文因在大模型技术的运用与落地中，优先考虑在积累过丰富经验的金融领域，重塑细分场景应用，实现与多位头部机构共同探索实战落地。

专业性

比如说规则系统，一个人都可以写10条正则表达式，没有问题。但是如果能够写好100条正则表达式，那你一定是一个非常优秀的工程人员，软件工程能力很过硬。如果能够管理好1,000条正则表达式，那你一定是一个科班出身的，有专业级知识管理训练的人。如果你能够真正地管理好10,000条正则表达式，那你一定是一个有非常丰富规则管理经验的人。

当然我说的并不是 copy paste 10,000次，改其中几个字，那个不算。

人工智能的很多事情，困难就在这儿。到网上去拿一个什么开源包啥的，把它做到80%，都很容易做得到。但难度就在于最后的20%。在实际运用中通常可能需要98%、99%的正确率，才能够满足用户的需求。如果专业性不够，想实现最后这些是非常难的。

匹配的工程能力

一个人工智能的技术能不能做得好，核心往往不仅仅是算法，而是底下的架构，还有系统。

工程是解决人工智能的核心钥匙。如果代码能力不行，架构能力不行，工程能力不行，在这个情况下，根本就不应该去谈算法。优先应该把工程能力补起来，然后再谈算法。

从学术界的研究到工业界的实践，有一个非常巨大的差异。为什么呢？

因为在发表论文的时候，完全不需要考虑现实中所会遇到的那些约束条件。所以当决定一个工程问题技术路线的时候，不一定要按照最新的论文趋势来做这件事情，甚至这论文和十年之后的技术都不一定有相关性。

一定要根据现实的情况和约束，来决定技术路线。这份《 AI 规划指南》，我们会继续更新，一起学好知识，摆正心态，加油干！

文因互联是一家 AI 大模型系统应用商，以大模型技术为基座，结合 NLP、提示工程、知识图谱等技术，通过多年行业实践积累，实现对业务文本进行文档解析、智能信息提取、智能内容生成、深度语义理解与关联分析，致力于企业知识的深度挖掘与有序传承，进而助力企业实现提高工作效率，沉淀知识工程。

自成立以来，已服务过金融、建筑、媒体、医疗、航空、通讯等多领域各细分场景，落地上百项目，获得IDC Fintech50、CB Insights Fintech50、毕马威Fintech50等权威机构认证。

文因互联

领域大模型实践者

最新文章

入选 | 「文因互联」荣获瞪羚培育企业、雏鹰企业认定

获奖 | 文因互联获第五届长三角金融科技创新与应用全球大赛“2024 年度金融科技·新锐企业奖 ”

官宣 |「图谱智能」获2024年度安徽省“专精特新”企业称号

提示工程实战笔记（二）：比AI工具更重要的是工作流建立

发布！文因互联参编《上海全球资产管理中心建设资产管理大模型应用实践与指南》

AI 这么牛了，为什么还有人工在做枯燥的审核啊？

合作 | 文因互联牵手安徽通服，探索财务票据处理智能平台建设

合作 | 文因互联牵手安徽征信，探索财务数据解析智能平台建设

提示工程实战笔记：银行AIGC业务理解与新工作流搭建

文因互联如何构建航空专家系统

一点点语义要走很长的路——我眼中的「语义网之父」James Hendler

上榜 | 我们的Agent场景落地成果上榜《Al Agent厂商全景地图》

倒计时10天！我在深圳国际人工智能展（GAIE）7C14 展位等你~

行业故事 | 证券公司电脑部的“昨天、今天、明天”

倒计时9天！2024年 FCon 全球金融科技大会即将开幕

用大模型写金融文档？我们是专业的

入选 | 文因互联入选2024未来医疗科技引领者《闪耀100》榜单

对话InfoQ | 文因互联鲍捷：场景融合与ROI考量，金融大模型落地的困境破局

安徽省科协高级研修班一行参访文因互联，交流通用人工智能领域的场景应用

企业专家智能体，从数据到知识（2）| “JIT”——企业内部知识管理的新范式

行业标准 | 文因互联参编中国信通院发布的“金融智能体”相关标准

联合发布 | 人工智能语料主题论坛举行，文因互联参与发布《高质量金融语料技术白皮书》、语料数据产品

就在明天！大咖云集，“语料筑基、智生时代”语料主题论坛欢迎您的莅临

官方认证 | 文因互联入选“北京市通用人工智能产业创新伙伴计划”模型伙伴

【合作】宁波银行续签文因互联 | 构建债券文档 AI 核查系统（二期）

腾讯TVP专访文因互联鲍捷：大模型时代里的「盲目自信」与「人间清醒」

活动邀请 | 世界人工智能大会WAIC“语料筑基，智趋 AI 新质力”专题论坛

【合作】文因互联携手宏利基金，探索智能数字化平台建设与应用创新

文因互联入选 InfoQ【中国技术力量之 AIGC 先锋榜】

数字员工真的能成为“企业智囊团”吗？｜使用说明&实战分享

Agent 标准 | 文因互联参与中国信通院可信 AI 智能体（Agent）标准编制

RAG标准 | 文因互联参与中国信通院可信AI检索增强生成（RAG）标准编制

实战精要：大语言模型信息抽取面临的5个挑战（5/N）

企业专家智能体 | “从数据到知识”，大模型时代的知识库建设

文因互联首席科学家宋劼：Turn On The“文因LED”——企业专家智能体的精益迭代

合作！文因互联携手广发证券，探索大模型时代的智能抽取

还在写一堆规则吗？大模型+抽取：智能数据治理“新姿势”

财报季减压副驾驶 | 大模型时代的智能撰写平台

优秀！携手广发证券“智能投行”课题报告，获评中证协2023年重点课题研究优秀课题报告

合作 | 携手昆明航空，基于业务分析智能体发展探索飞机性能数据管理

大模型创造未来的“亚历山大图书馆” ：一个精细管理的艺术

合作 | 携手中国民航大学，建设大模型时代的航空领域知识图谱

大模型+航空 | LOSA 数字化解决方案

文因互联正式加入四川信创产业联盟

大模型开启智能财务数据管理，用知识管理赋能自动化数据核查！

开工大吉！送上这份大模型时代下的《 AI 规划指南》

荣誉资质 | 文因互联大模型知识管理 AI 平台与华为昇腾 AI 完成兼容性测试认证

高可控，真灵活！银行文档智能撰写场景实战汇报

文因互联入选 “2024 中国大模型先锋案例 TOP30”

大模型+不良资产 | 文因互联携手银河金控探索“不良资产+互联网”场景落地

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉