AI Agent为释放LLM潜力关键媒介,扮演着LLM与AGI之间的桥梁,为LLM核心算法注入强大执行能力。作为一种基于输入输出的响应系统,LLM的输出严格依赖于输入的质量和相关性。与LLM相比,AI Agent提供了更为全面的功能范围。AI Agent的能力可以定义为“大模型+记忆+主动规划+函数调用”的综合体。
基于LLM构建的AI Agent由三个主要部分组成:感知端、控制端和行动端。控制端作为核心,其大脑模块负责记忆、思考和决策制定等基础功能,而感知模块则负责接收和处理来自外部环境的多样化信息输入,如声音、文本、图像和位置数据。行动模块则通过生成文本、API调用、工具使用等方式执行任务并影响外部环境。这种结构化的分工使得AI Agent能够以高度自动化和智能化的方式响应复杂的任务和环境变化。在底层模型升级+工程化方法改进的共同推进下AI Agent的性能有望持续提升。
端侧落地百花齐放,眼镜+多模态AI为个人AI Agent最好形式之一。AI眼镜在信息输入输出的即时性方面具有显著优势。基于其硬件设计,能够支持用户长时间佩戴,从而为其提供持续的服务能力。相较于其他智能终端,由于AI眼镜与用户的面部接近,更易获取接近人类感官单元的信息,实现“看人所看”、“听人所听”的功能,收集更多的用户行为数据以供学习。
此外,AI眼镜的交互性要求其能够通过摄像头感知外部世界,通过语音与用户进行交流,并将信息直接显示在眼镜上,只有具备交互性的多模态大型模型才能满足AI眼镜的应用需求。根据VR陀螺,预计2024年Q4至2025年Q2将有大量AI眼镜产品上市,目前已公开、被披露进入AI眼镜领域的厂商高达36家(包括海外厂商),产品数量预计超过50款。受益于AI端侧应用的芯片硬件厂商最近表现不错,代表有:
AI SoC:
恒玄科技,在研芯片定位替代高通AR系列,端侧AI产品序列布局领先。
中科蓝讯,端侧AI产品价格提升。
存储:
普冉股份,端侧AI驱动NOR用量提升。
炬芯科技,布局细分专业市场,强调存算一体。
……
——END——
↓↓↓