随着小米15系列、苹果iPhone 16系列新机推出,相比前代,一些技术都取得了突破升级,比如:小米和苹果都在其产品中使用了音源变焦技术,以提升用户的通话和音频体验。
苹果iPhone 16系列手机在音频方面提供了音频变焦功能,这允许在录制视频时动态调整音频焦点,以匹配视频的变焦级别。此外,iPhone 16系列还支持空间音频和立体声录音,以及风噪降低和混音功能,使得在复杂环境中通话的清晰度进一步提升。小米15 Pro的音源变焦通过高信噪比麦克风阵列、深度学习、阵列增强技术以及实时噪声抑制等技术,有效降低了通话过程中的环境噪声,提高了语音通话的清晰度和质量。
音源变焦是基于人工智能的一项创新技术,旨在实时识别并抑制通话中的环境噪音。这项技术通常包括信号处理和机器学习两大部分。信号处理负责从音频信号中实时捕获并分离噪声和声音频率,而机器学习则通过预先训练的模型来识别和过滤噪声。这两年随着深度学习和语音处理算法的快速进步,音源变焦技术也取得了显著的突破。目前,它已广泛应用于手机、智能家居、视频会议系统等通讯设备中。
11月22日下午15:00,英飞凌与大象声科将带来主题为《基于AI语音增强的音源变焦技术与应用》的线上直播,本次活动为探讨为何远距离收音如此困难,音源变焦解决方案具体是如何实现的,大象声科与英飞凌在该技术研发上有哪些创新之处和最新的突破点,今后哪些产品上可以应用该技术为用户带来更优质的体验?
立即扫码报名预约
直播信息
音源变焦技术是结合大象声科的AI语音增强技术和英飞凌芯片的方案,可实现音频与视频的同步变焦。大象声科的AI语音增强技术从海量数据中自动学习分离规则,能够实时地将人声和背景噪声区隔开,有效提高人声的清晰度和可懂度,提升了整体音频效果。其中英飞凌硬件在 Audio Zoom 中不可或缺,其PSOC Edge AI边缘处理器可在本地处理音频信号,具有高信噪比、防水防尘等优势,进一步提升了音频质量。
嘉宾介绍
英飞凌科技消费、计算与通讯业务合作伙伴及生态系统管理龙洋经理、大象声科创始人&CEO内蒙古大学教授&博士生导师张学良博士,将在直播中分享硬件方案和前沿技术。
大象声科
张学良博士2010年进入内蒙古大学计算机学院,从事教学科研工作。2015年-2016年,美国俄亥俄州立大学访问学者。研究方向包括:语音分离/增强,计算听觉场景分析,语音信号处理。主持两项国家自然基金。发表论文包括IEEE/ACM Transactions on Audio Speech and Language Processing、ICASSP、INTERSPEECH等60余篇。
2017年创立大象声科,为工业界应用提供基于深度学习的前端降噪方案。目前在手机、TWS耳机、PC和车载场景被大量采用。服务的客户包括:华为、联想、小米、OPPO等。
英飞凌科技
龙洋经理将在直播中分享Audio Zoom方案的硬件组成,即英飞凌提供的高性能硅麦克风阵列及AI边缘处理器。还将详细阐述英飞凌的硅麦克风产品优势及其PSOC Edge AI如何进一步提升了远场收音的音频质量。