未来语音业务展望--未来语音架构演进评估(2)

文摘   2024-11-04 09:19   瑞典  

本文延续语音业务之环境/标准/挑战--未来语音架构演进评估(1),在总结了语音业务的应用环境、标准化进程及所面临的挑战后,展望并总结下未来语音业务特性。

首先,需要继续推进基本语音服务。包括视频和AR/VR在内的语音扩展也需要继续推进或定义。消息传递和统一通信功能也应继续推进或定义。
将继续支持监管语音服务。应向无线和多媒体优先服务套件和紧急服务提供最新的通信技术——既适用于急救组,也适用于与公共安全应答点 (PSAP) 交互的公众。同样,对 CALEA 的持续支持对于未来的语音服务至关重要。虽然统一通信功能可以作为单一解决方案的一部分提供,但更引人注目的是将这些功能分解,以便可以通过API作为单独的组件提供,以集成到任意数量的应用程序中。
A. 语音
> 全双工语音
> 半双工语音 (PTT)
> 语音消息
B. 多媒体
> 视频通信
> AR/VR
> 消息传递
> 类似统一通信的功能
> 远程终端沉浸式电话会议和远程呈现
这些通信服务将需要包括补充功能 — 面向消费者和企业市场的传统和新功能。而除了这些功能之外,API还应通过网络即代码框架公开,在该框架中,有用的网络相关功能(例如数据连接、语音、消息传递、网络分析、网络数据、用户体验 (UE) 数据、边缘云计算)被抽象和简化,以供应用程序开发人员生态系统使用。这使任何(第三方)应用程序都可以直接在应用程序代码中集成网络感知和控制,并由此创建全新类型的应用程序和体验。
在未来的语音网络中,技术支持服务将越来越多地利用人工智能 (AI)。下面列出了此类服务的一些示例。
A. 技术支持服务
> 聊天机器人
> 远程、AI辅助诊断和维修
B. 运营服务
> 预测性维护
> 负载平衡
> 网络安全
> 其他
为了促进AI的使用,数据访问框架将允许数据消费 AI 代理从数据生产网络组件(包括3GPP通信系统(例如IMS))获取数据。未来还将引入新的商业模式。例如,在过去的几十年里,广告已被证明是互联网应用的成功商业模式。该模型可以应用于在通信服务中嵌入广告。还需要灵活性来支持其他新的商业模式。


第一类未来语音业务:政府及监管业务

包括了如下内容,不详细说这些了,相关的网上信息很丰富。

1) 应急业务

2) CALEA

3)优先服务要求

4)STIR/SHAKEN

第二类未来语音业务:AR/VR用例

AR/VR/扩展现实 (XR) 将为通话体验增加另一个深度维度。它可以提供娱乐性、将有用的信息嵌入通话会话、启用广告并促进通话双方之间的更好理解,尤其是当一个人试图远程协助另一个人完成任务时。AR/VR/XR应用程序可能会推动针对语音和视频延迟要求的网络解决方案的新方法。根据国际电信联盟 (ITU) G.114文档,当口到耳延迟超过150毫秒时,语音质量开始下降。对于沉浸式视觉实时应用,例如VR、多人游戏以及与远距离事件或人的沉浸式视觉交互,运动到光子往返时间 (RTT) 延迟必须小于20 毫秒。在地理上分散的端点上支持此类应用时,必须考虑几个因素,其中网络造成的延迟分量主要是由于光纤的光速限制和数据包穿过网络路由器时产生的延迟。由于光纤的长度和路由器的数量随着地理距离的增加或多或少呈线性增加,因此延迟本身也会随着距离的增加而线性增加。此外,监管和业务需求可能会在媒体路径中推动更多锚点,从而增加通信路径的延迟。下图图说明了一些AR/VR/XR应用程序的示例。
AR/VR的相关文章可参考:
未来VR虚拟现实业务应用场景展望
扩展现实XR基本信息--随手记2023(12)
XR相关标准化工作进展--随手2023(43)
R18中XR架构增强--随手记2023(36)
XR业务及其3GPP演进信息 --2023宏文(8)

AR/VR 增强通话体验的描述包括:
> 在与另一个人进行视频通话时,AR广告可以覆盖屏幕的一角。
> 在与另一个人交谈时,签约者可以启动AR/VR会话来探索某个位置(例如工厂车间)或提供远程培训。双方可以一起观看同一场景。呈现的视点 (PoV) 是控制方的视点。
> 在与其他人交谈时,签约者可以调出全息会话进行零售。
> 在与其他人交谈时,签约者可以调出现场活动,让所有各方虚拟地一起观看。
> 在玩游戏时,可以调出AR语音辅助教程。
支持这些用例的未来语音要求包括:
> 更高的带宽和极低的延迟。
> 语音客户端中集成的Web实时通信 (RTC) 数据通道。
> 可能需要增强的UE显示(例如,用于窗口叠加)。
> 系统必须支持安全的加密通信。
> 通信服务必须在单个客户端内以混合搭配捆绑的方式提供(即,不会将语音与视频与来自任何其他通信服务的消息传递隔离开来)。


第三类未来语音业务:丰富的呼叫用例

通信服务提供商的语音呼叫和消息传递中的UE几十年来一直没有变化。现在是时候进行重大更新了。一旦我们拥有可以支持语音和数据服务的客户端,最终用户体验将迎来一个全新的世界。
丰富的通话体验描述包括:
> 通话前体验:用户可以在拨打电话之前“编写”信息(包括主题、位置、图片等),以便对方在接听来电时能够看到编写的通话前信息。通信服务提供商可以添加广告。
> 通话中体验:用户可以在通话期间共享内容:聊天、文件(或文件组,如演示文稿)、位置、背景音频、视频。通信服务提供商可以添加广告。
> 通话后体验:与通话前体验类似,当通话被拒绝或无人接听时,用户可以“编写”其他信息,供对方查看。通信服务提供商可以添加广告。
> 丰富的通话日志:用户可以看到包含丰富信息的通话日志(例如,通话前和通话后共享的信息)。
> 可以使用 AI 增强的内容控制和/或预筛选的内容库。
支持这些用例的未来语音要求包括:
> 新的交互式和适应性客户端。
> 语音客户端中的集成数据通道(例如 IMS、WebRTC)。
> 系统必须支持安全、加密的通信,并对通话元数据进行验证和完整性保护。

第四类未来语音业务:远程医疗用例

要使远程医疗成为真正可行的选择或补充面对面的医生问诊,尽力而为的视频通话是不够的。高 QoS 的基本视频通话是不够的。医生还必须能够使用远程检查设备(如听诊器或耳镜)以高质量传输视频、图像和音频。如果没有高QoS连接,医生将无法准确诊断疾病。联网救护车也需要这一点。这个用例很重要,因为世界老龄人口正在迅速增长。老年人需要更频繁地看医生,但他们不太容易定期亲自去医生办公室。而并非所有地方都有专科医疗。下图举例总结了一些满足这些需求的远程医疗应用:
远程医疗体验包括:
> 通话体验1:医生在与患者或其他医生通话时使用AR来指导对方执行任务。
> 通话体验2:除了与患者进行视频通话的特定QoS之外,医生还需要使用远程检查设备的特定QoS,例如:
Stethoscope听诊器 - 需要足够的 QoS才能获得准确的音频。
Otoscope耳镜 - 需要足够的QoS才能获得准确的视频。支持这些用例的未来语音要求包括:
> 高带宽和极低延迟。
> 支持传感的网络和设备。
> 数据通道(例如IMS或WebRTC)支持远程医疗设备和AR/VR。
> 支持具有QoS的实时非语音音频。


坐而论道,好好读书!

欢迎转发本公众号的文章,copy,翻译,修改并转发文章or文章中部分内容(文字,图片,视频等)时请注明来自本公众号!。

5G6G网络与协议
1. 5G网络结构,流程,协议学习与研究 。 2. 2G3G4G5G协议及互操作。 3.云计算/大数据技术。 4.IP网络。 5. 6G网络预研信息。 6. AI/ML (本号部分内容转自通信业界公开发表的信息,如有侵权请告知去除)
 最新文章