作为作为国际领先的光学显示、AR智能硬件、AR+AI技术提供商,谷东科技受邀出席2024 CTIS同期活动——中国屏谷AI智能启航大会。该大会由环球资源和咸阳高新区管委会联合主办,ARinChina承办,旨在共同探讨AI技术在元宇宙时代的应用前景,推动科技与产业的深度融合。谷东科技未来研究院AI研发总监曹晋在大会上做了题为《AI创新与AR体验模式的融合》的演讲分享。
曹晋在演讲中介绍,为了更好地推动AR+AI落地应用,谷东科技在全国建设了四大产研中心,北京光学研发中心保证了AR光学显示技术的落地,广州软件算法中心和AI研究院在探索AR+大模型技术的深层次融合应用,杭州光电生产基地确保向用户提供好用且便宜的AR眼镜产品,深圳海外业务中心负责整机硬件研发及拓展全球市场,谷东科技四大产研中心相互协调与配合,构建了完整的AR眼镜全产业链及行业大模型平台。
他表示,目前B端主流的AR+AI交互体验主要有:语音、手势和手柄。戴上AR眼镜,用户既可看到现实也可看到增强后的信息,显示增强后,除了声音外,还有影像等更多维度的信息。轻量级交互主要是语音、手势,简单易用,用户“所见即所得”,既可解放双手在任意位置观察体验,又可体验沉浸式的漫游效果。不足的是,这些交互方式的灵活度、精准度以及对深度信息的理解有一定不足。
因此,为了弥补以上交互方式的不足,谷东科技研发了语义感知AI大模型,通过大模型赋能AR眼镜,实现更好的空间感知和更长的上下文语义理解,用户看到的任何东西、发出的任何指令,大模型都能很好地实时识别与理解,再集成视觉、语音、手势识别等技术,为用户提供第一视角、远程协作及虚实融合的高效、便捷的工作体验。
“与此同时,结合我们在B端的大量技术研发、算法落地及应用实践经验,以及大模型技术带来的碰撞思考,我们也在研究如何让C端AR眼镜实现去icon化。”曹晋表示,就是去掉所谓的APP,通过语义感知AI大模型直接调用应用和服务,让AR眼镜成为用户真正的智能伴侣,“更懂你,以用户个人的情境为基础,并实现数据脱敏,保护用户隐私。”
最后,曹晋介绍了谷东科技研发的“Ravine”大模型平台,该平台构建了从基础层、数据层、算法层到服务层、应用层和终端层的完整闭环体系,并建设了数据、开发和推理中心。可提供:场景解读、知识图谱、实时翻译、语音笔记、第一人称直播等丰富的AI功能。根据不同需求,还可以提供SaaS版和私有化版。他总结道,未来需要外围更多实质的算法的赋能,需要一个更加开放丰富的AI生态,才能进一步推动大模型技术落地,给人们的生产与生活带来更多维度的提升。
END