百度2024世界大会给出元宇宙最优解:大模型+智能体+可穿戴设备

科技   2024-11-13 00:01   上海  

百度今天召开的百度世界大会,让我有一种油然而生的想将他和Meta类比的感觉。为什么呢,很长一段时间给人留下的印象,就是它是一家互联网广告公司,这个跟Meta很像。尤其是,他今天也搞了一款智能眼镜,这就更有那似曾相识的味道了。特别有趣的是,在元宇宙概念兴起的前两年,百度也和Meta一样火热。

Meta和百度的创始人都是技术出身。所以,一个技术出身的创业者,在新的技术大潮来临时,怎么可能不上头呢。

从元宇宙到AI,从百度今天的大会来品,百度已经秉持着自己的技术基因和商业嗅觉用一套“模型+智能体+智能可穿戴设备”战略给元宇宙的最终落地给出了目前的最优解。

01 李彦宏:AI应用即将迎来群星闪耀的时刻

百度创始人李彦宏在大会上作了重磅演讲,他强调了过去两年AI行业的最大变化:大模型技术的进步已经基本消除了幻觉问题,极大地提升了AI应用的实用性和可靠性。在演讲中,李彦宏还发布了两项重要的AI技术——检索增强的文生图技术iRAG和无代码工具“秒哒”。

iRAG技术通过增强检索能力,有效解决了大模型在图片生成上的幻觉问题,而“秒哒”则通过自然语言交互,使得非技术人员也能轻松构建应用,极大地降低了技术门槛。

百度在AI大模型和智能体领域的最新进展同样引人注目。百度文心大模型的日均调用量已超过15亿次,这一数字是一年前的30倍,显示出AI技术正以惊人的速度被市场接受和应用。智能体作为AI应用的主流形态,其发展势头迅猛,预示着智能体将成为AI原生时代内容、信息和服务的新载体。李彦宏将智能体的发展比作PC时代的网站和移动时代的自媒体账号,预示着智能体将更加智能化,更像销售、客服和助理等角色。

李彦宏表示,随着基础大模型能力的就绪,AI应用即将迎来群星闪耀的时刻,智能体将成为下一个应用爆发点,为各行各业带来革命性的变化。

他说这句话的时候,元宇宙的天空在我脑海里具象化了:无数智能体闪烁着智慧的光芒,哈哈哈哈。

02 百度大模型技术的核心地位

百度文心大模型4.0 Turbo是百度在人工智能领域的重要成果,它在理解、生成、逻辑和记忆四大核心能力上实现了显著提升。相比之前的版本,文心大模型4.0在逻辑能力上提升了近3倍,记忆能力提升了2倍多,使其能够更准确地理解用户需求,生成更高质量的内容,并在复杂场景中展现出更强的逻辑推理和记忆能力。
此外,文心大模型4.0进一步创新了智能体技术,这些智能体具备理解、规划、反思和进化的能力,能够可靠执行任务,自我进化,并在一定程度上将思考过程白盒化。这种技术使得机器能够像人一样思考和行动,自主完成复杂任务,并在环境中持续学习实现自主进化。

百度文心大模型的应用场景非常广泛,不仅可以用于自然语言处理、文本生成等传统领域,还可以应用于图像识别、语音识别等多模态任务。此外,文心大模型4.0还支持多种插件和API接口,方便开发者将其集成到各种应用中,实现快速开发和部署。

本次大会百度推出的无代码工具“秒哒”是对传统软件开发模式的一次颠覆。这款工具依托大模型的强大代码自动生成能力,用户无需掌握复杂的编程技能,仅通过自然语言描述需求,即可轻松搭建系统,极大地降低了技术门槛。无代码产品“秒哒”具备无代码编程、多智能体协同、多工具调用三大核心功能,为用户提供灵活高效的操作环境。李彦宏表示,“秒哒”的推出意味着人们将迎来一个“只靠想法就能赚钱的时代”。

另一重磅发布,检索增强的文生图技术iRAG(image based RAG)是解决大模型在图片生成上的幻觉问题的关键技术。iRAG技术将百度搜索的亿级图片资源与强大的基础模型能力相结合,可以生成各种超真实的图片。这一技术的应用使得AI生成的图片不再有“AI味儿”,大大提高了图片的可用性和商业价值。iRAG技术的成功应用,展示了百度在图像生成技术领域的领先地位,为AI应用的未来发展提供了新的可能性。

03 百度智能体平台的创新应用

智能体的应用场景非常广泛,包括个人助理、企业应用和特定任务处理等。例如,在教育领域,智能体可以作为教学辅助工具,提供个性化学习体验和自动化评分。在医疗保健领域,多模态AI智能体正在改变诊断和病人护理,它们可以分析医学影像数据以及病人记录和症状,提供更全面和准确的诊断建议。在金融行业,AI智能体在风险评估、欺诈检测和个性化财务建议方面进行转型。制造业从AI智能体中受益于预测性维护、供应链优化和质量控制。零售业通过AI智能体增强客户体验,使购物助手更加直观和互动。

智能体可以分为四种类型:公司智能体、角色智能体、工具智能体和行业智能体。公司智能体通常代表企业对外的形象,提供客户服务和品牌互动;角色智能体则模拟特定的角色或人物,以提供更加个性化的体验;工具智能体专注于执行特定的任务,如自动化办公流程;行业智能体则是针对特定行业需求定制的智能体,如医疗咨询智能体或法律顾问智能体。

智能体不仅能够执行简单的任务,还能通过预设逻辑完成复杂任务,并具备学习与持续优化的能力。

智能体以其个性化服务、自动化流程、持续学习、多模态交互、广泛应用和人类协作等优势,正在成为AI应用的主流形态。

文心智能体平台(AgentBuilder)是百度基于文心大模型推出的智能体开发平台,它旨在帮助用户创建智能化的解决方案。这个平台支持开发者根据自身行业领域和应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。文心智能体平台的优势在于简单上手、流量支持、免费使用、强大的大模型能力以及多样化的方式链接用户。通过prompt编排的方式,开发者可以低成本开发智能体,同时平台还为智能体开发者提供流量分发路径,完成商业闭环。

百度文心智能体平台已经汇聚了TOP100智能体和TOP100产业应用,这一平台的建立不仅展示了百度在智能体领域的深厚积累,也体现了其在推动智能体技术商业化和普及化方面的广泛布局。

04 可穿戴设备的战略布局

4.1 小度AI眼镜

在百度世界大会上,百度不仅展示了其在大模型技术的最新进展,还发布了一款革命性的产品——小度AI眼镜。这款眼镜被誉为全球首款搭载中文大模型的原生人工智能眼镜。小度AI眼镜的发布,标志着百度文心大模型技术在实际应用中的进一步拓展,将大模型的能力从云端延伸到用户的日常生活中。

小度AI眼镜集成了百度文心大模型的多项前沿技术,为用户提供了多样化的智能体验。它不仅支持第一视角拍摄功能,让用户能够轻松记录眼前所见,还具备边走边问的特性,允许用户在移动中随时与眼镜进行语音交互,获取信息或执行指令。此外,眼镜还具备卡路里识别、识物百科、视听翻译和智能备忘等功能,为用户提供全方位的生活助手服务。

小度AI眼镜在硬件配置方面同样表现出色。眼镜重量仅为45克,佩戴轻便,不会给用户带来负担。其搭载的16MP超广角摄像头结合AI防抖算法,确保拍摄画面清晰稳定。续航方面,眼镜标称待机时间长达56小时,支持超过5小时的连续聆听,并且仅需30分钟即可充满电,满足用户长时间使用的需求。此外,眼镜还配备了四麦克风阵列,用于精准识别声音,并采用开放式防漏音扬声器设计,提升语音交互体验。

小度AI眼镜的发布,不仅展示了百度在大模型技术应用上的深度探索,也体现了百度在智能穿戴设备领域的创新能力。这款集成了中文大模型的智能眼镜,预计将于明年上半年正式上市,届时消费者将有机会亲身体验这款智能眼镜带来的便捷与乐趣。

4.2 百度在可穿戴设备上的战略布局
4.2.1 百度地图智能穿戴解决方案

百度地图智能穿戴解决方案以其全面的功能和明显的优势,满足了智能守护、运动出行等各类场景的用户需求,并成功适配了智能眼镜、智能手环等多种设备。这一解决方案的核心优势在于:

  • 全球服务:百度地图的数据覆盖全球200多个国家和地区,提供全球范围的地图、搜索、定位、导航等服务能力。

  • 个性化地图:支持地图样式定制能力,帮助开发者快速定制符合智能穿戴设备使用场景的专属业务地图。

  • 轨迹记录:高效轨迹纠偏实现用户轨迹的记录、展示和分享。

  • 室内地图与定位:覆盖全国约5000+个购物商场、机场和火车站等公共区域场所,并提供精度可达1-3m的室内精准定位服务。

  • 地理围栏:高效智能地理围栏,实时监控实现安全预警。

通过这些功能,百度地图智能穿戴解决方案不仅提升了用户体验,还为智能穿戴设备厂商提供了强有力的技术支持,助力业务飞速拓展。

4.2.2 适配多种设备,满足不同场景需求

百度地图智能穿戴解决方案通过其灵活的SDK集成,使得智能穿戴设备的开发者可以轻松实现矢量图&瓦片图加载、手势交互和地图覆盖物绘制等丰富的功能。这种轻松集成接入的能力,使得解决方案能够适配多种设备,满足不同场景的需求。例如,以智能手表为例,用户可以享受到地点搜索、路线规划、地图底图展示和独立导航功能,为用户带来便捷新体验。

4.4 AI技术与可穿戴设备的结合

AI技术与可穿戴设备的结合,极大地提升了用户体验。

首先,AI技术赋予了可穿戴设备更强的数据马太效应,通过多模态能力收集用户自身与环境的大量数据,并拥有人类层面的推理和解决问题的能力。

其次,可穿戴设备可能成为最便捷的AI入口,AI与用户之间的关系主要以AI Agent的方式出现,通过感知用户以及周围环境,帮助完成决策。

此外,为了减少对云计算的依赖,可穿戴设备正在集成更强大的本地数据处理能力,以实现实时处理和分析海量生理数据,边缘计算技术与人工智能算法被集成进设备中,能够进行即时健康预警、运动分析等,提升用户体验和健康管理的准确性。这种结合不仅提高了设备的实用性,还为用户提供了更加个性化和精准的服务,使得可穿戴设备在未来的AI应用中扮演着越来越重要的角色。

05 元宇宙的最优解

两年前,元宇宙概念爆火,但最后厂商们发现,构建元宇宙的技术无法解决内容的缺失。虚拟世界里,空空如也。构建一个丰富的虚拟空间,成本让人望之兴叹。

当2023年GPT4出来后,人们发现海量生成图文可以实现了,再到2024年,Sora的概念一出,几十个AI视频模型相继涌现,海量的视频内容也可以实现了,现在3D大模型也都在路上了。所以说,大模型时代,内容不再是元宇宙的瓶颈。

百度在2024年百度世界大会上发布了基于大模型的100大产业应用,这些应用覆盖了制造、能源、交通、政务、金融、汽车、教育和互联网等多个行业。这些应用的推出,不仅代表了百度对科技发展的认知和态度,而且体现了百度致力于帮助更多企业和个人打造出数百万级“超级有用”的应用的决心。这些应用的广泛覆盖和深入行业,为元宇宙的发展提供了坚实的基础和多样化的应用场景。

百度希壤作为百度在元宇宙领域的主要平台,已经为超过20个细分行业提供了元宇宙解决方案,落地超过170多个活动和空间,展现了百度在元宇宙领域的技术实力和产业融合能力。百度希壤元宇宙平台,整合百度地图,百度大模型以及智能体生态平台,再加上智能眼镜等可穿戴设备,就可以建构起元宇宙1.0版。

因此,在我看来,百度通过大模型、智能体和可穿戴设备的结合,为元宇宙提供了目前的最优解。以大模型为底座的百万级智能体夜以继日的执行生成任务,必将在不远的将来造就一个不朽的虚拟世界,而人们需要通过可穿戴设备和这个虚拟世界进行交互,成为一个个“头号玩家”。

由此可见,百度将继续在元宇宙领域扮演重要角色,通过技术创新和产业融合,推动元宇宙的发展,为用户提供更加丰富和多元的数字体验。随着技术的不断进步和应用的不断拓展,元宇宙有望成为连接虚拟与现实、过去与未来的重要桥梁,而百度将在这一进程中发挥关键作用。

欢迎添加勇敢姐咨询企业培训
看完敬请关注、点赞和在看@勇敢姐飙AI

勇敢姐飙AI
一起探索AI赋能千行百业的解决方案、场景和案例。
 最新文章