为了在AI时代做好“AI助手”,vivo做了哪些努力?

科技   2024-11-05 11:35   北京  
作者
邮箱xiaoyu@pingwest.com

在当今科技飞速发展的时代,人工智能(AI)无疑是最具变革性的力量之一。从智能语音助手到图像识别技术,AI 已经渗透到我们生活的方方面面。

在智能手机领域,AI 的应用更是成为了各大厂商竞争的焦点。

1

布局

vivo 作为一家在智能手机领域具有重要影响力的厂商,早在2017年6月就已经成立了 AI 研发中心,启动了人工智能相关研究。

在2018年3月,vivo 发布了首款搭载人工智能语音助手 Jovi 的 vivo X21,并正式成立了 vivo AI 全球研究院,副总裁周围出任研究院院长,开始了在 AI 领域的探索之旅。

vivo X21 图源:vivo

当时 vivo 判断,人工智能、芯片和 5G 通讯,是未来几十年科技创新的底层技术,vivo 想要在未来继续保持行业第一梯队的位置,就一定要在这些技术上面成为深度参与者。

vivo 迅速确立了一份3到5年的中长期发展战略规划,并将在全球范围聘请 AI 专家。研究院的成立为 vivo 汇聚了大量的 AI 人才,到2019年时,vivo 已经拥有超过1000名 AI 工程师,为后续的技术研发奠定了坚实的基础。

1

积累

在组建队伍后,vivo 开始在 AI 技术研发上加大投入。

2019年,vivo 推出了自己的“智慧”手机,周围也总结出了“三自三全” 的理念,即自学习、自建议、自索引,全交互、全场景和全连接,展示了 vivo 对 AI 在手机应用上的初步探索。

随着技术的不断发展,大模型的出现成为了 AI 领域的“奇点”。

在2023年,vivo 对外公布了自研通用大模型矩阵“蓝心大模型”,该矩阵涵盖了10亿、70亿、700亿、1300亿、1750亿等不同参数量级的模型,分别在不同场景下用于处理不同的任务,如自然语意理解、文本摘要扩写、多维度内容生成以及复杂逻辑推理等。

蓝心大模型矩阵 图源:vivo

这些模型不仅在各大专业机构的综合评分中名列前茅,更标志着 vivo 在 AI 底层技术上取得了重大突破,为其在 AI 应用层面的创新提供了强大的支撑。

1

重构

手机作为连接数字世界的桥梁,完全有机会打造成为用户的个人专属智能管家。基于这个认知,vivo 开展了一系列工作。

vivo 副总裁、OS 产品副总裁、AI 全球研究院院长周围认为,手机智能管家应具备五个特点:首先,要能感知识别用户意图;其次,要能形成共同记忆;第三,是具备部分场景下替代用户的决策能力;第四,要能像人一样懂得如何操作手机里的众多应用;第五,要能像助理一样管理日常事务。vivo 正是基于这些特点在推进手机端 AI 研发的相关工作。

2023年11月初,在 ChatGPT 3.5 正式发布的前夕,深度融合蓝心大模型的 OriginOS 4 预览版与用户见面,通过“蓝心小V”应用展示了 vivo 在 AI 大模型上的应用成果。

而前段时间刚刚发布的 OriginOS 5 则更进一步,不仅局限于在系统中增加 AI 功能点,而是将整套系统基于蓝心大模型进行重构,让 AI 在这套操作系统中变得无处不在,更好地服务用户,让手机在现实生活中发挥更高效、简单、主动、智能的作用。

图源:硅星人

这一转变体现了 vivo 从单纯的功能添加到系统级重构的进化,标志着 vivo 在 AI 应用上进入了一个新的阶段。

在未来一到三年内,vivo 将基于用户需求和应用场景,提供更多实际价值。

1

创新

从80年代到现在,每一代伟大的产品在交互上都形成了巨大的变革。

iPhone 的电容屏,让用户从用指甲盖变成用指尖去操作,多点触控也让用户在放大、缩小图片时不需要点按相应的按钮,而是使用双指张开或并拢。这些看起来微乎其微的差距,带来的其实是巨大的交互转变,后来的语音助手 Siri 亦是如此。

在 AI 技术的应用中,vivo 也十分注重构符合用户直觉的交互方式。在 OriginOS 5 中,vivo 采用大量长按、圈选、拖放的交互逻辑,构建了一种新的交互规则。

在10月30日举办的硅星人 2024 AI 创造者大会上,vivo 副总裁、OS 产品副总裁、AI 全球研究院院长周围表示:“vivo 的人工智能团队有千人左右模型,手机的软件团队也大概是1000多人在做应用和创意。2000人的团队对于我们接下来要做得这么大的工作来说还是太渺小了,所以我们肯定要和行业先进的合作伙伴共创共建。”

图源:硅星人

周围深刻的认识到,对于“让手机成为专属私人助理”这一理念来说,vivo 只靠自己是远远不够的。为了实现更好的垂类模型体验,vivo 的目标是创建一个大模型“广场”,与行业中在各自领域内的专业团队展开深度合作,目前百度、阿里、字节、智谱都是 vivo 的深度合作伙伴。

1

探索

在2024年的开发者大会上,vivo 对未来 AI Phone 应该长什么样子,做出了自己的解读,却很少对外公布大模型迭代的进度。

一年的时间里,vivo 技术团队的工作重点主要扑在搭框架、做基建,做好意图、智能体平台、感知与决策、记忆和自动执行。其实这里每一个关键词都代表着一个大团队至少做了一年的努力,但是因为目前对用户没有实际的意义和帮助,所以 vivo 对外说得比较少。

但 vivo 也对外展示了一些“小成品”。

比如为了解决传统大模型无法做到像人一样的操作手机,在2024年开发者大会上,vivo 对外展示了名为「Phone GPT」的一款全新的智能体,它可以在接到指令后像人一样的操作 App,搜索对应的商家,自动拨打客服电话,用 AI 拟人语音的形式完成订座指令,整个过程全部在前台完成,无需调用任何三方应用的接口即可实现。

PhoneGPT 图源:不客观实验室

在未来,vivo 将会围绕框架和基建持续深耕,在研发的过程中会涌现出一批类似「PhoneGPT」一样的明星级产品,为用户带来了更加便捷的体验。

1

挑战

尽管 vivo 在 AI 技术研发上取得了不少成果,但在用户需求的把握上仍然面临挑战。

AI 技术的发展带来最大的“挑战”,就是一系列伦理和隐私问题。而在探讨伦理问题时,价值观是首要考量因素。

vivo 研发蓝心大模型的愿景,就在于打造一个最能理解中国人的大模型,这就要求知识供给必须契合中国文化,并且价值观要与中国文化完全相符。基于此愿景,vivo 开展了一系列工作,包括完整的训练数据建设、数据清洗以及审核流程。

值得一提的是,vivo 在审核方面所具备的能力在行业内具有独特性。vivo 不仅自行建立了审核能力,所采用的审核模型更是达到了百亿级别,更为关键的是,vivo 将审核模型实现了端侧化。

周围表示,在全球范围内尚无其他公司能够做到这一点。“如果审核未能实现端侧化,那么所谓的端侧化就是不完整的。”

vivo 很早便察觉到这一问题的重要性,并对其怀有敬畏之心,进而开展了一系列与之相关的能力建设工作。

1

总结

从早期的战略布局伊始,历经技术沉淀积累以及模型研发探索,进而迈向系统重构与应用创新的新阶段,vivo 在 AI 领域已然斩获诸多成果。

在此过程中,vivo 并非一帆风顺,同样面临着诸如用户需求难以精准把握、技术竞争压力与日俱增、伦理和隐私问题错综复杂等一系列挑战。

尽管如此,vivo 凭借持续创新的精神、不断深化的合作伙伴关系、积极拓展的应用场景以及对行业标准制定的推动,仍然有望在AI领域维持领先优势。

这不仅将为用户呈上更为智能、便捷的手机使用体验,还会为整个手机行业的AI应用发展贡献自身的力量,开启智能手机与AI融合的新篇章,最终实现 AI Phone 成为“个人专属智能管家”并惠及所有用户的美好愿景。

点个在看,再走吧


硅星人Pro
硅(Si)是创造未来的基础,欢迎来到这个星球。
 最新文章