说说字节这个豆包视觉理解模型

创业 2024-12-19 16:46 浙江

看到消息说，苹果正在和腾讯和字节跳动洽谈，将两家公司的人工智能模型整合到在中国市场销售的 iPhone 中。当然这个谈判还在早期阶段，不排除还会有变数。‍‍

有的网友难免会问，苹果选来选去的，是要比较哪家最强么，还是有什么标准？‍‍‍‍‍‍‍‍‍‍‍‍‍

要我说，苹果未必会看中一个大模型参数更多或是评分指标有多高，而是要看交付的总体质量，尤其是交付体验和最终用户体验。而这两点，腾讯和字节确实都更适合苹果一些。当然最后花落谁家，现在无法确定。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

国内的大模型追赶的速度比我之前预期还要快一些，之前有些能力还不具备，但现在，几乎都已经开始对齐。

在刚结束的 2024 冬季火山引擎 FORCE 原动力大会上，字节跳动宣布了一系列让人目不暇接的产品发布和能力升级：豆包视觉理解模型发布、豆包 3D 生成模型首次亮相。豆包通用模型、音乐模型、文生图模型等在内的豆包大模型多款产品能力进行了更新。

两天的会议看下来，重头戏是豆包视觉理解模型。

宣传视频我看了几遍，豆包视觉理解模型已经具备强大的内容识别与理解能力，覆盖图像、动作、文字、逻辑推理等多个维度，并支持细节描述、指令遵循和多文体创作等功能。国产大模型的一旦补上某项能力，后续的迭代改进速度就会更快，用不了多久，追平业界最好能力并非不可能。有的人说，我们追赶的这段时间里，人家不也发展么？并不一定，领跑者有时候会走弯路。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

视觉理解能力在前些天已经下发到个人用户，豆包 App 和 PC 端产品都可以用了。普通用户随时可在豆包应用中体验这些能力。第三方最新数据显示，11 月的 AI 产品全球月活跃排行榜上，豆包的 MAU 已经接近 6000 万，仅次于 ChatGPT。字节团队做用户增长，还是有绝活儿，不服还真不行。

对个人用户来说，别整天担心被 AI 取代，你先把工具用好，让工具帮你更好的处理工作，解决生活中遇到的问题，先从中获益再说。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

企业用户能以极具性价比的价格使用视觉理解模型：处理千个 token 的费用仅为 0.003 元，比行业平均价格低 85%，价格上极具优势，足以满足绝大多数企业的预算需求。

这次发布会把很大篇幅放在 MaaS、扣子这些平台的工作上，讲怎么更容易的把模型用起来。对于企业用户而言，这意味着更好的使用体验，而开发者也能够借助平台优化工作流程。值得一提的是，优秀的使用体验是平台型产品的重要竞争力，但却常常被忽视。

至于企业是否能够真正用好大模型？我的观点是，对于绝大多数行业企业而言，关键在于如何将大模型能力应用到实际业务中。重要的是先尝试使用，通过优化或解决具体业务场景中的问题，逐步实现模型的适配与迭代。如果自己做不来，就找团队协助自己完成这一步。在此过程中，企业不仅能享受到模型能力升级的红利，为客户创造价值，也能提升自身的竞争力，推动行业发展。

视觉理解模型在教育、电商、旅游、门店管理、金融、医疗等多个领域都很有想象力，比如医疗领域，对于手写病历的识别和理解在过去是个难题，现在不一定是了，这就是个合适的场景。前 AI 时代的应用场景和边界，尤其值得我们公司这样规模的团队积极探索，给出更好的解决方案。

在生物进化中，眼睛的形成是物种多样化与生态系统发展的关键推动因素，为生命的繁荣与物种爆发奠定了基础。字节这么重视视频理解模型的发布，一步到位给出大家都能用得起的价格，应该是非常看好多模态交互，想吸引更多开发者把应用做起来。

多模态交互已成为大模型发展的必然，每家大模型参与者都得跨过这一步，也都能跨过去。有理由期待，在这个过程中还会有更多令人惊叹的创新应用出现。

机会对所有人，所有企业，都还存在。

小众消息

价值的信息通常从小众开始传播，最终被大众接受。本公众号原名「小道消息」，为减少误解，更名为现在的「小众消息」。

最新文章

严重了，大家极限存钱吧，从 2025 开始

甲流·玛巴洛沙韦的常见问题

我的 2024 年个人总结

提醒：近期流感增多

理想的系统界面文字能不能好好排个版？

有效控糖的「减半法则」

看病不知道挂什么科？这个超实用的挂号工具你得知道

搜狗输入法的 AI 搜索，有点丝滑

现在要起个合适的产品名字，真是很难呐

说说字节这个豆包视觉理解模型

号外，微信小店可以送礼物了

TikTok 的命运

如何睡个好觉的极简建议

家用 Mesh 路由器有线回程组网折腾记

搜狗输入法的 AI 搜索，有点丝滑

为农村免除新农合自费费用之可行性

是的，无码科技并不是一个合适的公司名字

现在形势很严峻，大家做好准备吧

拼多多百亿补贴又让我消费升级了

商家的流量，多多的策略

如何找到自己喜欢的事，并且发展成自己的工作？

拼多多里的好物推荐

线上商家的流量问题和逆向思维

选择的智慧（好物推荐版）

老舅年轻时没遇到像老舅这样的老舅

无码科技八周年

有多少人在缴纳个人所得税？（修订版）

当失业的程序员想转行去做产品经理

做好准备，不要倒在黎明之前

关于 iPhone 15 到 iPhone 16 数据迁移的全部要点

拼多多又搞了个「百亿减免」

拼多多把「补贴」执行到底

囗囗囗，总有人在厕所抽烟

你要是最近没事儿干？学学英语吧

希音（Shein）是哪国的公司？

今年无码科技就不送中秋礼品了

苹果对中国开发者最为苛刻

痛风了，怎么办？

热衷喝汤是个坏饮食习惯

维生素 D3，都谁需要补？

讲真的，我很难同情 35 岁没准备的人

哪些药不能一起吃？

腾讯财报里的 QQ

提醒：应对新冠病毒感染的药物和错误认识

提醒：准备一点对乙酰氨基酚和布洛芬

企业微信群的功能设想

小红书现在是我的搜索引擎

等待和希望

我这么看「仅退款」

如何清理微信联系人

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉