转载丨对话·科学先锋声智科技陈孝良：人工智能和声学的深度融合

文化 2024-11-12 09:00 上海

近年来，全球人工智能技术快速发展，成为推动科技和产业加速发展的重要力量，对经济社会发展和人类文明进步产生深远影响。人工智能技术也正在重塑传统声学领域，给声学研究带来新机遇。人工智能技术以及大模型的发展与声学融合产生了哪些结合点？人工智能技术如何赋能新质生产力发展？日前，北京声智科技有限公司创始人、董事长，首批“北京市先进科技工作者”陈孝良接受了新华网的采访。

新华网：围绕人工智能技术和声学的结合，您和团队开展了哪些研究？

陈孝良：我们围绕声学和大模型的结合，主要在远场语音交互技术上开展研究，包括空间编码、声音水印、声纹识别等。在空间编码上，我们实现了声音和位置信息的联合编码，可以得到更地回放效果。在声音水印方面，我们已经开展了对声音克隆的研究，并且应用在电信反欺诈系统。进一步，我们在探索利用人工智能技术，比如深度学习、监督学习的方法，更好地做源头的水印嵌入。另外，我们在声纹识别方面，特别是实时转写，我们能够把整个声纹处理控制在一个复杂场景下，现在也已经开始进行相关的应用推广，在AI耳机上开始应用这项技术。

新华网：面对采集的海量声音数据，您和团队在大模型训练过程中是如何克服训练过程中出现的相关困难及挑战？

陈孝良：灾难性遗忘是在预训练和微调过程中经常出现的问题。在大模型训练中，我们通过数据增强和自监督学习技术降低灾难性遗忘的风险，并通过算法优化减少模型幻觉现象。面对海量数据，我们团队采用高效的数据筛选和多层次的训练策略，使模型能够在大数据环境下稳定、可靠地进行推理。这些技术帮助我们克服了大规模数据带来的挑战，让声学AI模型更加精准、适应性更强。

新华网：您如何看待和理解人工智能技术和大模型在新质生产力中的体现？

陈孝良：人工智能很重要的一个分支是大模型，它解决了我们语言里面重要的理解问题，同时，它在新质生产力里面，非常典型的一个应用是AI硬件。因为AI硬件将声学技术、语音技术和语言技术融合在一起，并且落地到一个非常重要的载体中，对于技术和经济都带来巨大的价值。

AI硬件产品，如AI耳机、AI眼镜、AI PC和AI手机等设备，通过将声学计算与人工智能技术融入日常生活，不仅带动了技术创新，还提升了消费体验。这种技术驱动的消费升级推动了整个AI硬件产业链的发展，带动材料、传感、内容和服务等上、下游供应链的技术进步，为我们国家数字经济注入新的活力。

※ 本文原载自新华网。

关于标准

关于GAS

联系我们

http://mp.weixin.qq.com/s?__biz=MjM5NDI5MTYyOA==&mid=2652503213&idx=2&sn=99d757ffac14c73d830ade1a6dbe52d8

中国电子音响行业协会

风声雨声读书声，鸟鸣歌唱欢笑事——欢迎您关注协会，共同聆听这个越来越美的音响世界。

最新文章

中电音协周刊（2024年第49期会员专刊

中电音协周刊（2024年第49期）

HWA | 华为FreeBuds Pro 4无线蓝牙耳机获得首张HWA无损无线音频证书

中电音协周刊（2024年第48期会员专刊

中电音协周刊（2024年第48期）

习近平向2024年世界互联网大会乌镇峰会开幕视频致贺

中电音协周刊（2024年第47期会员专刊

中电音协周刊（2024年第47期）

GAS | 共襄音频盛举，同绘声界未来

转载｜全国性行业协会商会第十二联合党委第一次党员代表大会在京召开

协会 | 协会常务副会长陈立新受邀参加杰科公司25周年庆典

转载丨对话·科学先锋声智科技陈孝良：人工智能和声学的深度融合

中电音协周刊（2024年第46期会员专刊

中电音协周刊（2024年第46期）

协会 | 声学大讲堂:往期精选课程限时免费，不容错过的知识盛宴!

协会 | 2024GAS声学大讲堂——音频技术培训系列公益讲座圆满完成

谱写新时代社会工作高质量发展新篇章——党的十八大以来社会工作成就综述

HWA | 飞傲M23便携高清无损音乐播放器产品通过HWA证书

转载 | “浙江大学-阿尔卑斯阿尔派车载技术联合研发中心”签约揭牌仪式顺利举行

中电音协周刊（2024年第45期会员专刊

中电音协周刊（2024年第45期）

协会 | 关于开展 2024年度（秋季）“金耳朵选择（CGEC）/高保真音频产品（CPHA）”集中主观评价咨询活动的通知

协会 | 关于展开2024 耳机行业系列评选活动的通知

标准 | 中国电子音响行业协会联合中国电子技术标准化研究院关于召开《温室气体产品碳足迹量化方法与要求音箱》标准研讨会的通知

协会 | 声学大讲堂——理解声学场景及其引发的情感

中电音协周刊（2024年第44│会员专刊

中电音协周刊（2024年第44期）

协会 | 第一届高性能网络音频传输技术应用高峰论坛成功举办，推动音频行业创新发展

助力创新驱动融湾发展！中国电子音响行业协会受邀参加梅州市新一代电子信息产业发展创新论坛

转载 | 声学筑梦十九载辉煌同庆！2024国际音频产业峰会INTER AUDIO 暨声学楼十九周年年会圆满落幕活动全程精彩纪实

转载│CAIA副会长单位音王音响服务第六届世界佛教论坛

GAS | 听见未来，AI+音频｜2025中国国际音频产业大会（GAS）早鸟优惠10月31日截止！

协会 | 声学大讲堂——基于半监督的音乐旋律提取研究

中电音协周刊（2024年第43期）│会员专刊

中电音协周刊（2024年第43期）

协会 | 关于《低延迟低复杂度高清音频编解码蓝牙传输适配规范》《无损无线音频技术与设备规范及测试方法》等两项团体标准的发布公告

协会 | 关于车载音频三项团体标准的发布公告

协会 | 中国电子音响行业协会车载音频系列团体标准发布暨宣贯会在江苏常熟顺利召开

协会 | 第十一届全国声音与音乐技术会议在中国地质大学（武汉）成功举办

协会 | TechG“芯技术芯未来”技术论坛精彩回顾！

协会 | 声学大讲堂——人工智能音乐的发展与应用

转载 | 以耳听耳，以心复心——第十一届全国声音与音乐技术会议（CSMT2024)在中国地质大学（武汉）召开

中电音协周刊（2024年第42期）│会员专刊

中电音协周刊（2024年第42期）

协会 | 声学大讲堂——跨库语音情感识别技术

标准 | 关于召开车载音频系列团体标准发布暨宣贯会的通知

中电音协周刊（2024年第41期）│国庆﹒会员专刊

中电音协周刊（2024年第41期）

标准 | 关于召开车载音频系列团体标准发布暨宣贯会的通知

2024 CSMT会议日程和交通信息来啦！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

转载丨对话·科学先锋 声智科技陈孝良：人工智能和声学的深度融合

转载丨对话·科学先锋声智科技陈孝良：人工智能和声学的深度融合