今年的MWC,由于疫情放开,迎来了过去几年以来中国手机厂商参展的高潮。其中小米、中兴,以及高通等公司纷纷展示了最新设计的AR眼镜。
与此同时,随着ChatGPT的爆火,有人将其和AR眼镜结合,以期打造更强大、使用范围更广的智能眼镜。比如AR技术供应商Vuzix在自家Ultralite OEM智慧眼镜平台上整合了OpenAI的ChatGPT技术,可以支持语言翻译、字幕、简讯、导航等功能。
ChatGPT的出现,被视为人工智能技术大爆发的关键节点。那么,在AI的助力下,AR眼镜会在何时迎来自己的ChatGPT时刻?
01
AR眼镜:可穿戴、可交互式AI
虽然智能手机在2007年之前就已经有所发展,但如今业内还是将乔布斯推出初代iPhone的2007年,看作是智能手机起势的时刻。因而科技圈中常常用「iPhone时刻」来定义每一款消费级产品的诞生。
ChatGPT的爆火,则让人们看到了人工智能行业的「iPhone时刻」。
去年12月,OpenAI旗下的ChatGPT横空出世后,引起一波AI使用热潮至今。ChatGPT界面简单、使用友好、功能强大,编程、写文章、创作歌曲等等,几乎无所不能,颠覆了人们对于人工智能的想象。
也因此,ChatGPT推出两个月,用户数就超过了1亿,成为史上增长最快的消费应用。在此之前,从来没有任何一款AI应用会受到如此大的关注。
英伟达创始人兼CEO黄仁勋在近期的一次演讲中,正式将「ChatGPT」视为「AI的iPhone时刻」。毫无疑问,这将是AI历史上最为浓墨重彩的一笔。
然而即便如此,OpenAI改变世界的步伐也并未停止。3月1日,OpenAI宣布推出ChatGPT和Whisper的API接口。
开放API之后,第三方企业可以在自家APP或者产品中提供与ChatGPT相同的AIGC服务。据报道,其价格为每1000个token 0.002美元,算下来就是企业大约支付2美元就可以输出75万个英文单词。
相比此前价格大幅下降,则是由于自从去年12月以来,OpenAI将ChatGPT的成本降低了九成。
如果说ChatGPT对大众开放只是其AI技术gpt-3.5-turbo模型的一个demo,那么这两大API的推出,则是这家非盈利机构力图改变世界的实干。
对此,OpenAI在其官网中表示:我们相信人工智能可以为每个人提供难以置信的机会和经济赋权,而实现这一目标的最佳方式是让每个人都可以使用它来构建应用。我们希望今天宣布的更改能够带来更多的应用程序,让每个人都可以受益。
在所有利用OpenAI技术来改变行业的应用中,尤以微软的动作最大,该公司通过大手笔投资OpenAI,整合ChatGPT推出了新版Bing搜寻引擎,使得谷歌不得不发出红色警告。
▲ChatGPT发布后,谷歌在搜索引擎的市场份额变化
而在推特上,程序员们纷纷利用OpenAI的API来接入到Siri、小爱同学等大众熟知的「智能手机人工智障」中,以期使得变得更加智能。
如今,ChatGPT的整合风潮也开始吹向AR行业。美国智慧眼镜和AR技术供应商Vuzix在MWC大会上,展示了自家Ultralite OEM智慧眼镜平台上整合OpenAI ChatGPT技术的产品。
Vuzix推出的这款结合了ChatGPT的AR眼镜Ultralite OEM,续航时间长达2天,而且眼镜重量只有38g,在机身体积方面几乎与一副我们平时佩戴的眼镜无异。
通过Vuzix的单目波导光学元件和定制的微型显示引擎协同工作,该款AR眼镜可以在佩戴者真实世界视图上创建清晰、透明的图像,无线传递用户智能手机上的所有重要信息,而无需从口袋取出手机。
ChatGPT的实力相信大家也早有耳闻,在这一技术的加持下,该眼镜几乎能够做一个接近人类水平的随身智能助理,导航、查看新闻资讯及健康报告、语言翻译、预定航班等功能,都不在话下。正因如此,或许如今我们真的可以用AR眼镜来做一些事情了。
像ChatGPT这样的人工智能聊天机器人已经席卷了科技界。除了Vuzix,英国初创公司XRAI Glass也加入了AR眼镜的竞争。
XRAI将OpenAI的ChatGPT技术集成到其应用程序和AR眼镜中,帮助耳聋或听力障碍的人更好地了解周围发生的事情,为聋哑人士和听力障碍者提供实时字幕的增强现实眼镜。
具体实现方式就是通过蓝牙连接到智能手机,并使用ChatGPT来识别和翻译不同语言的对话。
「人们可以问一些问题,比如一般知识或食谱或任何他们喜欢的东西」,该公司首席执行官Dan Scarfe说道。或者他们实际上可以提出他们的谈话问题,比如,「嘿,XRAI,你能总结一下这次谈话吗?」,亦如「嘿,XRAI,我们刚刚谈论的小镇叫什么名字?」
这些都是ChatGPT的典型Prompts。
目前ChatGPT虽然很强大,但是使用范围仍然局限在网页端。那么,未来随着增强现实技术的发展,充分配合AR眼镜,其应用空间将会被充分放大。
02
AR眼镜的「iPhone时刻」
ChatGPT的崛起,因为其强大的能力,有人觉得AI时代来临,很多工作将会被取代。这确实是现实之一。不过,对此我也赞同美国商业领袖、曾担任过IBM CEO的吉尼·罗曼提的说法:
有些人声称这种技术是人工智能,但实际上它强化的是人类自身。因此我认为,我们将增强人类的智能,而非「人工」的智能。
在增强人类智能方面,相比「机器人+AI」的组合,我更看好「AR眼镜+AI」这对搭档。
如今的智能手机、智能手表等电子产品虽然已经足够方便,但还是有不少局限的地方。比如骑行时需要导航,肯定是AR眼镜更方便。再比如上文中针对残疾人群的应用场景。
除此之外,作为一种可以将虚拟信息叠加在现实场景中的设备,配合人工智能技术,可以扩展多种应用场景,例如:
教育培训:AR眼镜可以为学习者提供更直观和互动的教学内容,例如模拟实验、历史重现、语言翻译等。
工业制造:AR眼镜可以为工作人员提供更高效和安全的指导和协作,例如维修检测、远程支持、质量控制等。
娱乐媒体:AR眼镜可以为用户提供更沉浸和创新的娱乐体验,例如游戏互动、影视观看、社交分享等。
医疗健康:AR眼镜可以为医护人员和患者提供更精准和便捷的医疗服务,例如手术导航、诊断辅助、康复治疗等。
旅游导览、电子商务、智能家居......
可以说,无论是C端还是B端,AR眼镜都有着非常广阔的应用空间。如果把人工智能技术比作人类的灵魂,那么AR眼镜就是人类的肉体。一个人,只有灵魂和肉体充分结合,才能大有作为。
如今随着AI技术和相关应用的大爆发,AR产业正迎来前所未有的火热。
艾瑞咨询预测数据显示,2030年AR终端设备出货量可超10亿台。前瞻行业研究院预计,2027年中国增强现实(AR)产业市场规模将超过2000亿元,2022-2027年复合增长率为78%。
那么,AR眼镜究竟什么时候才能迎来像如今人工智能一样的iPhone时刻呢?
我们不妨先来看一下,为什么突然爆火的ChatGPT会被认为是人工智能的iPhone时刻。
与iPhone一样,ChatGPT的推出引起了人们的广泛关注和兴奋,它的问答和语言生成功能为人们提供了前所未有的智能交互体验。
ChatGPT作为一个基于深度学习技术的大型语言模型,具备生成自然语言文本和理解语言的能力。与其他智能助手相比,ChatGPT并非只能对特定任务进行回应,而是可以根据输入的文本内容进行学习和生成答案,这使得它具备了更加广泛的应用空间和灵活性。
与iPhone类似,ChatGPT的推出引领了人工智能技术的发展方向,开启了一种全新的智能交互方式。而借由ChatGPT的成功,人们看到了AI的未来:ChatGPT和类似的大型语言模型有望成为人们日常生活中不可或缺的智能助手,为人们提供更加智能、便捷、个性化的服务。
虽然目前AR已经在一定程度上迎来了自己的「iPhone时刻」,比如苹果公司推出的ARKit平台,为iOS和iPadOS设备上的AR应用提供了强大的支持。
但要想让AR技术真正成为主流,达到扎克伯格描述的那种「你戴一副AR眼镜走在街上,就能随时随地与外界互动」的终极体验,仍然有不少制约因素。
这主要是由于AR眼镜是建立在真实世界的场景之上,然后再叠加一层虚拟信息。与此同时,由于人的视线不断移动,场景也会不断变换。这就意味着设备需要不断进行3D空间建模,才能保证实时场景的真实性。但是,这个过程对于算力的要求非常高。
如果再加上各种交互功能,算力要求就更高了。由此来看,硬件算力无疑是最为关键的桎梏之一。
所以,AR眼镜要进入自己的「iPhone时刻」,诸如信息采集、光学视觉、算力等底层技术的突破,必不可少。
其实从iPhone的诞生历史中不难学到相关经验。比如说初代iPhone最让人惊艳的地方之一是其多点触控操作体验。而这一体验得以实现的前提是其与Fingerworks公司多点触控技术的结合,使得我们能够识别多个手指在屏幕上的位置和动作。
从这个角度来看,AR眼镜在大众中的流行,可能还得等很长时间。
写在最后
实际上,如今无论是ChatGPT还是New Bing,都在面临着算力的桎梏。即便是财力雄厚如微软,也不敢全面开放其新搜索系统的使用,而是通过Waitlist来减少对算力的冲击。
但是,大众并未因此否定其带来的革命性意义。那么,对于智能眼镜来说,是否能够找到如ChatGPT这样的爆发方式,先让大众见闻其厉害之处,再随着市场接受度的提高、热钱的涌入,而适时扩大用户人群规模呢?
不过在此之前,AR眼镜可能得先找到足够有友好度的界面。
就像ChatGPT用一个对话框,就能带来的无穷魔力。
END
视频号里有最新鲜的数码评测哟~
快来关注我们!