Ola Friend:字节试水 AI 智能体耳机,豆包能否打破硬件魔咒?

文摘   2024-10-10 17:40   广东  






前言


字节跳动豆包于 10 月 10 日发布首款 AI 智能体耳机 Ola Friend。Ola Friend接入豆包大模型,与豆包 APP 深度结合,用户戴上耳机后,无需打开手机,便能通过语音唤起豆包进行对话。目前,Ola Friend 已经在各大电商平台开启预售,将于 10 月 17 日正式发货,售价 1199 元。







01

 “在你需要的时候,TA 都在你耳边”

Ola Friend是一款OWS开放式耳机,单耳仅重6.6克,设计上简洁而美观,拥有多种配色和充电仓选择。同时还搭载了 5 核音频芯片,支持专业声音解析和智能降噪算法,保证耳机本身的优秀音质。


此外正如字节官方一直强调的名字中包含的“智能体”,这款耳机的最大亮点在于其强大的AI功能。不需多说,自然在软件配置以及功能层面都是围绕字节旗下自家大模型「豆包」来进行的。


目前官方的宣传视频视频中,耳机可以帮助用户进行信息查询、英语学习、情感交流等,让科技与日常生活紧密结合。比如,用户可以通过耳机进行英语口语练习或随时获取百科知识,Ola Friend就像一位随身的助手,这也与豆包本身的能力一致,即随时进行各种话题的讲解和知识分享。


此外,相比智能音箱等产品,耳机也接入了字节豆包大模型的Seed-ASR(语音识别)技术模型。该模型可以高精度识别中英文、口音,甚至能通过上下文,“聪明”地识别各类信息。同时,Ola Friend还做了诸多优化,让用户能够像和朋友聊天一样与AI交流,能够提供情感支持,倾听用户的心情并给出正向引导;根据部分已经体验过耳机的用户反馈,Ola Friend更像是一个全知全能、随时能够回应的AI朋友,耳机能带来的陪伴感觉远超手机。


不过现在Ola Friend的功能并不算特别完善,比如对于是否支持豆包的语音聊天模式以及是否拥有转录、纪要等功能,官方并没有展示。当然,这些功能其实都可以通过OTA进行升级,对于这款产品未来功能的拓展可以充满想象。比如,深度结合豆包APP使得用户无需打开手机,只需呼唤“豆包豆包”或触摸耳机,即可通过语音激活豆包APP;比如未来或许能够和飞书打通,届时在会议上耳机可以开启录音并联动飞书妙计输出会议纪要;又或者在教育市场继续发挥想象空间,和豆包爱学(此前名为河马爱学)APP联动,将AI教育能力内置于耳机中,拓宽青少年市场。


或许未来真的如字节跳动产品与战略副总裁朱骏所展望的可以“离用户很近,随时伴随用户,嵌入用户的不同使用环境”。


02

那么,什么是 AI 智能体耳机呢?

作为字节的首款AI硬件产品,无论是对字节在AI硬件领域的尝试,还是对豆包大模型在边缘设备的落地,OlaFriend都具有很强的战略意义。这样一款重要的产品,字节给出的产品定义是“AI智能体耳机”,而不仅仅是“AI耳机”。


什么是智能体呢?


智能体实际上就是Agent,即能够感知环境、进行决策和执行动作的智能实体。相较于普通的AI大模型,Agent更接近一个助理,或者说一个人的角色。字节的官方宣传片也强调了Ola Friend在英语陪练、情感交流等场景的功能,在这些场景下,OlaFriend不仅仅是提供信息检索、智能点歌服务的AI,而更像是能够提供情绪价值与陪伴属性的AI朋友,并根据不同场景扮演不同的角色。


因此,无论是从AI智能体的产品定义还是从宣传的各个功能,都可以看到字节在产品设计中,对于Ola Friend中Friend一词的重视。豆包相关的负责人表示:“希望Ola Friend能成为随时陪伴用户耳边的朋友。”


03

为什么叫Ola Friend?Ola是什么?

Ola Friend中Friend一词的含义已经得到解释,那么Ola又是什么意思?Ola一词的含义,还得从五个月前说起。


2024年5月,字节跳动以5000万美元的价格收购深圳市大十未来科技有限公司100%的股权。大十未来成立于2022年8月,由前BOSE高管李浩乾与多位BOSE工程师共同创立,自创立伊始,就专注于开放式耳机的研发。而大十未来还有另一个源于欧拉公式的名字,也是其品牌名,Oladance。结合Ola的名字与开放式的设计,可以猜测,Ola Friend耳机的硬件部分很可能就是由Oladance团队负责。

    


此前,Oladance的最大特色即是其自主研发的OWS技术,即开放式穿戴立体声技术,使得开放式耳机也能拥有音响级别的音质。Oladance是一家Born Global的出海企业,OWS Pro等产品凭借无感佩戴、音响级声效和超长续航的特点,在日本、泰国、西班牙、美国等众多海外市场大受欢迎。


字节为什么选择收购Olddance呢?实际上,耳机是可穿戴设备中最适合与AI结合的硬件之一,轻便、便捷、易于交互。而相较于入耳式耳机,开放式耳机的设计为更大电池和多传感器的集成提供了空间,在智能化方向上拥有更多的可能性。向来以算法见长的字节,无疑是在看到开放式耳机与AI结合的可能性后,瞄上了Oladance这家开放式耳机的细分龙头,以补足自己在硬件开发方面的短板。


04

从AI眼镜到AI耳机,AI硬件时代到来了吗?

2024年,在大模型的发展下,沉寂已久的硬件市场再一次迎来热潮。而国内硬件创新的上一次浪潮,似乎还要追溯到2014年。彼时,小米生态链崛起下,跑出了石头、九号、华米、云米等多家上市公司。


从2014年到2024年,恰好十年时间。十年过去,2024年会是新的AI硬件元年吗?


实际上,AI硬件最早爆火的产品,是2023年底美国Humane公司在世界移动通信大会上发布的AI Pin。用户将其别在衣服上,将画面投影在手掌上,用语音进行控制。AI Pin定价699美元,发布一个月内,预定量就超过了450万台。然而, AI Pin的实际效果却不尽如人意,存在反应慢、交互体验差、续航差等诸多问题,很快跌落神坛,产品退货量甚至超过发货量。



与AI Pin类似的还有曾在百度智能硬件负责人吕聘创立公司Rabbit推出的R1,用户只需要通过和巴掌大小的R1进行语音交流,即可调用手机上所有APP。产品定价199美元,发布一周,预售量达4万台,几个月内销售量破10万台。然而,R1很快也受到套壳安卓、续航差、基础功能缺失、幻觉严重等质疑。根据今年10月吕聘的采访可以推断,Rabbit R1正常的双日活仅有5206,相较于销量并不理想。


AI Pin和Rabbit R1均采用了全新的硬件形态,也可以被称为是AI Native的硬件产品。全新的形态虽然在初期极大吸引了消费者的兴趣,但一旦出现Over Promise和Under Deliver的问题,很快就会被消费者抛弃。


在这一点上,Meta则选择了不同的解法。2023年9月,Meta与 Ray-Ban联手推出智能眼镜Ray-Ban Meta,用户可以通过眼镜拍摄照片与视频、接听电话以及播放音乐,并可以通过语音和简单的手势来控制设备。Ray-Ban Meta起售价为299美元,相较于Ray-Ban的传统眼镜产品并不昂贵。仅2023年第四季度,Ray-Ban Meta出货量就超过30万副,直到目前累计出货量已超百万。而今年9月份Meta发布的与视觉AI模型相结合的AR眼镜Meta Orion则再度引爆舆论,以至于很多人纷纷认为眼镜将是AI硬件的最佳形态。



类似Ray-Ban Meta,Ola Friend走的也是AI技术赋能传统产品形态的路径,且耳机和眼镜也都具备轻便与可穿戴的特征,从这一点看,Ola Friend似乎也具备成为类似Ray-Ban Meta的爆款的潜力。


其实在Ola Friend发布之前,字节的硬件产品之路走的并不顺利。2019 年字节收购锤子科技,2021年,字节即宣布停止手机品类研发,同年字节以90亿元收购头显厂商 Pico,2023年,Pico OS团队被并进产品研发和工程架构中台,而市场、游戏、视频部门则大规模裁员,仅剩余部分硬件研发人员。


据媒体报道,收购Oladance后,字节内部成立了两条产品线,除了负责Ola Friend的”D线“以外,还有一个跨组织产品线”O线“,与字节的AI应用团队Flow合作,探索手持类AI硬件设备。因此,可以预见的是,未来字节还会有更多在AI硬件方面的动作。


这次Ola Friend也是字节再一次进军硬件领域,能否摆脱”没有做硬件的基因“的名号,或许就要看Ola Friend在10月17日后的市场反馈了。但无论如何,AI硬件的浪潮才刚刚到来,AI+硬件的最终形态是什么,AI手机、AI眼镜、AI耳机、AI戒指,抑或是其他AI Native的产品形态,或许得等到5年后才能知晓。而当下,我们需要的是耐心,不着急,慢慢来。

关于LitGate

大家好,我是LitGate,一个专注于AI创作的游戏社区。我们的新版官网已经上线✨你可以在里面找到各种AI创作的实操案例,以及已经沉淀的AI游戏创意demo,相信一定能让你大开眼界!


我们还有一个讨论群📣,如果你对AI创作感兴趣,或者有什么问题想要咨询,欢迎加入我们的讨论群,和大家一起交流学习!(PS:目前群内人数较多,为了有一个优质的讨论环境,请各位添加社区管理员企业微信账号邀请入群


更多精彩活动和功能筹备上线中,敬请期待~


关注我们,一起探索AI创作的无限可能吧!


新版官网地址:www.litgate.ai



LitGate
AI赋能游戏开发,一站式创作者社区 http://www.litgate.ai
 最新文章