如果你还不知道豆包,那你可能已经落后,并错过了半个未来

文摘   2025-01-08 00:07   广东  
关注我的你,是最善良的!
只为苍生说话,用笔杆子道明事态原委、丈量人间温情。





如果你还不知道豆包





豆包APP是字节跳动于2023年6月推出的AI对话助手。目前在苹果APP Store和各大安卓应用市场,豆包APP的下载量在AIGC类应用中排名第一。


01
那你可能已经落后
用了一段时间的豆包,虽然和GPT还有不小的差距,但已经有基本框架了。现在豆包的下载量达到1.6亿,日活跃账户80万人,成为了全球AI运用下载量的第二名,全国第一名,相信在不久的将来 豆包会普及到每个人的手机里,成为继微信后必备的APP。因为它太好用了,几乎无所不知,虽然在逻辑上有点欠缺,还带点立场,但在知识类的解答上,比老师还专业,
因为它所有的数据都摘自网络,
知识库完整丰富。
而且不懂的地方可以继续追问,它还能根据需要把知识进行简化处理,让学习者更容易接受吸收。
除了问答环节,它可以帮人写作,给用户对文章进行分析评估改进,制作图片,生成音乐,还能创立自定义语音智能体,豆包还有模拟外教功能,可以帮助学生更好地练习口语等等。就是不能像GPT那样把公司年报文件发给他让它帮客户解读。
这是一个颠覆性的科技革命,同时也进一步挤压人类生存空间。如果这东西普及了,那意味着知识已经很容易获取,老师的作用就不大了,因为自己不懂题目可以自己问,它解答得比老师专业耐心,而且不用花钱,校外培训以及外教行业要受很大的影响。
我记得我在义乌做跨境电商的时候,看到那些公司开始运用GPT做工作了,就是把产品参数发给它,它会生成很专业的英文版介绍,同时,把报价信息发给它,它会自动生成报价邮件回复给客户询盘。虽然快捷,
但是也隐含了很大的风险,
这样做,
那么平台以后可能就不需要业务员了,老板一个人做就够了,甚至不懂英语的也可以做,只需一个月支付两三百块钱的会员费用即可,比用几千招业务员还省钱,也不用支付提成,节约了很大的营业成本。
同时,它能运用到法律上,不懂法的人问问即可,还能生成合同文案,撰写法律文件等等。还能帮你读财报,指出财报中的漏洞。同时,把财务数据发给它,它可以自动生成财务报表,毕竟是人工智能,相对于人工,减少了人为疏漏和错误,一个公司的会计,自此显得多余了。
想想挺悲哀的,辛辛苦苦读了二十多年的书,一毕业出来,发现自己所学的东西既然比不过这么一个玩意。身边人告诉我,他们公司因为GPT裁了不少人,对此我感觉很难过。
人类前三次工业革命都发生了不同程度世界动荡,虽然淘汰了一批人的同时,也创造了新的就业岗位。可是第四次,会创造什么出新的工作岗位呢?目前没看到,只看到了不停地裁员,连流水线都开始自动化智能化了,不仅如此,当下还在大力研究人形机器人,这东西出来,又要淘汰一大批人。
豆包有以下一些特点使其成为非常优秀的语言相关 AI 产品
豆包经过大量文本的训练,涵盖了众多领域的知识,包括但不限于历史、科学、技术、文学、艺术、体育等。无论是询问古代文明的兴衰,如罗马帝国的历史变迁,还是现代科技的最新进展,如量子计算的原理,豆包都能够提供相关的信息。
例如,在历史方面,它可以详细讲述从旧石器时代人类的起源,到各个朝代的政治、经济、文化等多方面的内容。对于科学领域,能够解释从基础的物理定律,如牛顿运动定律,到复杂的生物进化理论等知识。深度的知识理解(在一定程度上)
豆包不仅仅是简单地罗列事实,还能对知识进行一定程度的分析。比如在文学作品分析中,它可以阐述一部小说的主题、人物形象塑造、写作风格等。以《红楼梦》为例,豆包能够分析贾宝玉、林黛玉等主要人物的性格特点,以及他们之间复杂的情感关系,还能探讨曹雪芹写作手法的精妙之处,如伏笔的运用、诗词在文中的作用等。
豆包能够根据用户的问题准确地理解意图,并生成清晰、有条理的回答。在回答复杂的问题时,会合理地组织语言结构,使用恰当的词汇和句式。例如,当用户询问 “如何撰写一份市场调研报告” 时,豆包会详细地列出步骤,包括确定调研目的、选择调研方法(如问卷调查、访谈等)、收集和分析数据,以及撰写报告的各个部分(如摘要、正文、结论等),并且会对每个步骤进行必要的解释。多种语言支持
可以为不同语言背景的用户服务。它支持多种语言,如英语、法语、德语、日语等众多语言的提问和回答。这使得全球范围内的用户都能够利用豆包来获取知识或者解决语言相关的问题,比如翻译句子、解释外语词汇的用法等。
豆包可以通过网页浏览器、手机应用等多种方式访问。用户界面简洁明了,方便用户快速提问和获取答案。无论是在电脑上还是在移动设备上,操作都很方便,用户可以随时随地使用。持续学习和更新
开发团队会不断地对豆包进行优化和更新,以适应新的知识、语言变化和用户需求。这意味着豆包能够与时俱进,为用户提供更准确、更符合当下实际情况的信息。例如,随着新的科学研究成果的发布,豆包会逐渐将这些新知识融入到回答中。
不过,不同用户有不同的需求,有些用户可能更倾向于其他具有特定功能的 AI 产品,如专门用于图像识别的 AI 或者侧重于数据挖掘的 AI 等,所以说 “最好” 因用户的具体使用场景和需求而异。
这场革命,究竟要把人类引向何方,是马克思理想的乌托邦社会吗?并非每个人都有艺术细胞,如果没工作也能活下去,我认为很多人会失去人生的意义,开始胡思乱想,就像挪威那样,虽然人均都很富裕,但是太闲了找不到人生意义,所以自杀率很高。让每个人都有份工作,不管好坏,不管工资高低,便没有多余时间胡思乱想,也能使自己作息规律,接触到世间百态,这才是生活之道。
这场革命,不会被淘汰的应该有销售,导游,服务行业吧。但这些行业,也会受需求端的影响,那么多人没有工作,没有收入,谁还会去旅游,购物,下馆子呢?
我能想到唯一不受影响的是金融业吧,因为玩金融要懂人性,这东西不通人性,来玩也会被收割。可是金融业是和风险打交道,对个人风险承受能力要求很高。
12月18日的火山引擎Force冬季大会上,月初接入豆包APP及PC端的视觉理解模型正式发布,一并亮相的还有围绕AI视觉理解能力打造的诸多产品应用。以及,豆包家族其余模型的大量升级,图文、代码、音视频都在射程范围。视觉理解模型,通过各AI应用具象成用户手边能看见并理解万物的助理,也成为豆包此次升级最核心的变化。
研究表明,人类接受的所有信息中,有超过80%的部分来自我们的眼睛——来自视觉。同理,对于旨在无限趋近于人类、成为工作和生活帮手的Agent来说,视觉理解能力也能极大拓展AI技术的应用边界。随着AI与我们的眼睛完成信息对齐,人与AI交互的门槛会将会进一步降低,解锁更为丰富的应用场景:只要能看见,都可以问AI。
先说下大会开场给的一段测试案例,场景为火山引擎公司办公区。这次测试预先载入了火山引擎企业知识库,相当于给模型圈定了一个大概的考试范围,即问答题目大多会是公司相关内容。而视觉理解模型,就是要通过理解摄像头所看到的内容,查找并调用这个企业知识库信息,给出回答。比如,画面中这个公司logo摆件散了,怎么拼回去。
模型准确理解了三维空间中前后左右等等位置信息,和摆件之前的物理状态,最终给出了具体的组装方案。以此类推,载入火山引擎知识库能拼摆件,载入家具品牌知识库理论上就能决绝动手能力不足群体看不懂说明书、拼不上家具的问题。
还能,读懂体检报告再给出生活建议;还能,读懂代码并提出修改意见;再比如,通过图片了解到用户此刻正在火山引擎大楼,从这里到北京南站要40分钟车程。倘若这项功能可以与具体城市、地区的高精地图联动,显然就会是路痴人群福音,被动导航从此升级为主动导航。
火山引擎总裁谭待在采访中表示,推出视觉理解模型相当于解锁了一个很大的场景,同过去只有文字对话形式的AI相比,聊天功能与深度推理的、图像视觉理解等能力的融合,能让模型有能力处理好真实世界大量综合性的信息,辅助人类完成一系列复杂工作。
“语言是来描述世界的,首先你理解这个事情得靠视觉。就像我们今天坐在一起聊一些事情,都得是你看得到它、感觉得到它,说出它的信息再来交互。”由功能增强带来的应用拓展,也会对大模型的调用量和场景带来大幅提升。
前段时间,坊间曾传出“字节已经提升了剪映即梦业务的产品优先级,计划后续把更多资源向更多模态的产品形态转移到该业务”的流言。本次大会,剪映业务负责人张楠同样登台演讲,内容基本围绕即梦展开。即梦,是张楠由抖音集团CEO改任剪映团队一号位之后推出的AI创作工具和社区,于2024年5月上线,包括智能画布、文生图/图生图、对口型、运镜调节等大量AI技术已在其图片、视频创作功能中落地。得益于底层模型多模态,尤其是视觉能力的升级,即梦后续的发展空间显然会进一步拓展。
会上,张楠分享了两位即梦创作者用AI创作的短片,一部借聚光灯下大荧幕女明星的奇幻故事还原了从默片到有声时代、从黑白到彩色的电影发展史;另一部来自今年7月在抖音上线的科幻短剧《觉醒》。据称,该科幻短剧一经上线就吸引了许多关注与讨论,也成为抖音上首部单日点赞破40万的AI短剧。
如果说抖音是记录和分享“真实世界”的相机,那么即梦就是呈现“想象力的相机”。产品的灵感来自OpenAI先前发布的DALL-E 2模型,张楠希望用户“只需要输入某一刻的想法,借助 GenAI 的技术,画面就可以瞬间被呈现在眼前。”
基于字节自研的豆包·文生图模型、豆包·视频生成模型,即梦AI近期上线了三款各具特色的视频生成模型,并接入了最新的豆包·文生图模型,业内首创了“一句话P图”、“一键海报”和“动态海报”能力,并大幅提升了困扰行业多时的文字生成准确率难题,灵活且精准的图片创作编辑从此成为现实。不管是画面的完成度,还是文字生成的质量,可以说这就是目前国产大模型的t0,中文文字生成的标杆。
横向比较,豆包在整个大模型赛道可以算姗姗来迟,今年5月才正式发布。但,第一个特点就是后来居上:发布之初的模型日均tokens是1200亿。7月份涨到了5000亿,9月份达到1.3万亿;而截止到上周日,12月15号,豆包大模型的日均tokens数已经突破了4万亿,在7个月的时间里增长超过33倍。
第二个特点,则是整顿行业定价:豆包发布之初,捅破地板的模型价格把行业定价降低了99%,也掀起了第一轮大模型集体降价潮,用谭待的话说,是“降低到一个合理水平,让企业可以放心大胆的去做大模型应用创新。”
这次上架视觉理解模型,豆包又一次当起了价格屠夫:目前,Claude的价格是每千token 两分一里钱;GPT-4o的价格,是每千Tokens 一分七厘。阿里的通义千问的价格,是每千Tokens 2分钱。
而豆包,把这个价格杀到了“每千tokens 3厘钱”,再次比行业平均价格降低85%。相当于一块钱可以处理284张720P的图片。
视觉理解模型赛道也被豆包带入了厘时代,“好模型就是要让每家企业都用得起”。现在来看,大模型或许会是一个比手机、比新能源更加“赢者通吃”,所以更需要所谓“终局思维”的赛道:scaling law路线下不断扩大的是模型能力,也是训练成本,只有产品力足够强,客源足够多,且有资源撑到最后的极少数玩家才能幸存。
豆包,显然是最够拼,目前也足够强:综合目前行业数据,豆包在国内目前以接近900万的DAU遥遥领先于第二名的Kimi(300万);甚至,在全球范围内,豆包约6000万的月活也仅次于OpenAI的ChatGPT,居全球第二。并且,视觉理解等模型下一步的应用场景也在打开:会上演示的模型理解案例中,豆包大模型在接收到高跟鞋推荐相关问题后,自动连接到了似乎是抖音电商的相关购物推荐界面。
这种连接和传统广告营销的“硬塞”完全不同,AI做的是理解并回应用户需求。何况,豆包能理解的场景不只局限于是电商,毕竟字节旗下还有内容平台,还有教育等等。足够丰富的内部生态、足够多的优质数据和应用场景,且都全面接入AI并相互打通,才是豆包成为行业“卷王”的秘诀。
你是豆包大模型的用户吗?
体验如何?咱们评论区聊聊~

数字化转型室
只为苍生说话,用笔杆子道明事态原委、丈量人间温情。
 最新文章