AI语音招聘岗位合集

文摘 2025-01-05 12:00 北京

下面是本周VJoinU的招聘简讯合集，希望小伙伴们都能找到心仪的岗位。

道通科技

深圳市道通科技股份有限公司成立于2004年，于2020年2月成功登陆上海证券交易所科创版。公司专注于汽车智能分析、检测分析系统及汽车电子零部件的研发、生产、销售和服务，产品主销美国、德国、英国、澳大利亚等70多个国家和地区，是专业的汽车智能分析、检测和TPMS产品及服务综合方案提供商。

招聘岗位

语音算法工程师

岗位职责

搭建端侧和云侧一体的语音识别框架，确保系统稳定性和高效性；
针对不同语种，包括小语种，进行算法适配和优化，满足多语种识别需求；
负责语音算法的研发和优化，提升识别率和响应速度；
与硬件设备团队紧密合作，确保语音算法与设备的融合；
跟踪语音识别领域的前沿技术，为团队引入新的思路和方案。

岗位要求

计算机、数学、物理、统计学硕士及以上相关专业学历，3年以上语音算法相关领域从业经验；
热爱语音技术，对语音识别领域有浓厚的兴趣；
精通语音信号处理、模式识别、深度学习等关键技术，并有相关项目经验；
熟悉端侧和云侧一体的设计方案，具备相关项目经验者优先；
5.有小语种语音识别经验者优先，包括但不限于对识别算法进行针对性优化；
熟悉与硬件设备的集成和调优，有实际产品落地经验者优先；
优秀的问题分析和解决能力，对解决具有挑战性问题充满激情，能适应快节奏高强度的工作氛围

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：campus@auteltech.net

工作地点：深圳

灿瑞科技

作为模拟和数字IC设计公司，上海灿瑞科技股份有限公司专注于为客户提供多元化、高级能率比与可控成本于一体的电源管理IC产品、具有竞争力的电源解决方案以及完整的客制化系统设计支援和服务。借助于香港、台湾、中国大陆等地的分公司，灿瑞快速响应客户需求，为全球的客户提供高品质的半导体产品及解决方案。

招聘岗位

音频算法工程师

岗位职责

负责音频产品算法技术调研、算法方案设计、仿真验证等工作；
负责产品性能的持续优化以及客户算法问题跟踪与处理；
负责相关领域新技术研究探索;
音乐、音频新技术研究探索；
负责产品开发相关文档撰写。

岗位要求

本科以上学历，计算机、通信、电子、信号处理理、声学等相关专业；
精通信号处理与音频处理理技木，拥有良好的数学及DSP理论基础，有过音频算法处理和信号处理工作经验优先；
熟练使用建模工具；熟悉DSP嵌入式软件设计思路、开发方法和调试测试方法。熟悉DSP的系统架构、内外部资源者优先；
良好的英文论文阅读能力及算法仿真能力；
良好的沟通能力和团队合作精神，条理性强，逻辑清晰。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@orient-chip.com

工作地点：上海

百融云创

百融云创是一家领先的人工智能（AI）技术服务公司。应用大语言模型、自然语言处理（NLP）、深度机器学习、隐私计算和云计算等科技，通过模型即服务（MaaS）及业务即服务（BaaS）的服务模式提供服务。百融云创的MaaS服务利用决策式AI，通过分析用户的风险、需求和资质，将商业机构“了解你的客户”（KYC）和“了解你的产品”（KYP）的过程数字化。

招聘岗位

语音合成工程师

岗位职责

语音合成、音色克隆、多语种语音识别，多语种TTS、语音合成大模型，多模态大模型等技术；
探索语音、音频前沿方向和落地场景创新

岗位要求

相关专业，优秀高年级研究生，或者博士研究生；实习生、校招、社招均招聘；
具备较强的编码能力，熟悉Python，熟悉PyTorch/Tensorflow等至少一种主流深度学习框架，有多模态、音频大模型的实际项目经验者优先；
具备优秀的学习能力和良好的沟通合作精神；
在国际顶级会议/期刊上有相关·论文发表者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：qi.zhang8@brgroup.com

工作地点：北京

声加科技

北京声加科技有限公司成立于2018年1月，专注于通信声学核心技术，已先后通过中关村高新技术企业认证和北京市高新技术企业认证。为B端客户提供复杂场景下的近场、中场、远场语音交互技术方案，以及从芯片、模组、PCBA到工业设计的一站式产品方案。

招聘岗位

音频算法工程师

岗位职责

负责利用深度学习技术开发和优化音频算法，包括语音增强，回声消除，去混响，语音分离，命令词唤醒，迭代提升DNN性能；
负责解决DNN算法在测试中出现的问题，通过数据增强、调参、调整模型结构等方式解决或改善，加快产品落地；
负责DNN模型优化裁剪：用量化、算子替换、剪枝，蒸馏等方式，有效降低模型mips或RAM需求，方便移植到各硬件平台;
负责DNN模型转码、整合，协助解决平台移植中出现的适配问题。

岗位要求

信号处理、声学、物理、电子信息、通信工程、计算机等相关专业硕士及以上学历；
3年以上声学算法调试、音频数字信号处理相关工作经验, 有信号处理基础的优先考虑；
参加过dnn在语音上的落地项目，如：语音分离、语音增强（SE）、回声消除（AEC）、深度降噪（DNS）、去混响（Dereverberation）、命令词唤醒（KWS）、语音识别、声纹识别（Speaker Recognition、Speaker ID) ;
英语读写能力强，能够调研英文文献。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@soundiot.cn

地址：北京

物奇科技

物奇成立于2016年，在重庆、上海、长沙、香港、深圳等地设有研发中心和客户支持中心，是国内领先的短距通信芯片设计公司，依托领先的通信连接技术，为万物互联的世界提供一流的SoC芯片和软件解决方案。公司在高性能WiFi、蓝牙音频以及PLC宽带电力载波等通信技术上持续探索，量产了多款高性能SoC。

招聘岗位

音频算法开发工程师

岗位职责

基于客户需求，针对TWS耳机音频通话算法的优化和调试工作；
下一代音频通话算法的开发工作；

基于自适应滤波和DNN的AEC算法模块的开发工作；
基于多麦阵列信号处理和DNN的降噪算法模块的开发工作；

音效算法的开发工作；
基于TWS耳机的空间音频算法开发工作。

岗位要求

音频/语音算法相关工作经验1~3年；
熟悉传统信号处理，熟悉深度学习算法开发；
熟练掌握C/C++, matlab, python等开发语言，熟悉pytorch/tensorflow的开发框架；
计算机/信号处理/通信相关专业，本科及以上学历。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@wuqi-tech.com

工作地点：深圳

陌陌

陌陌科技，中国领先的社交网络和移动互联网公司，成立于2011年。最初以陌陌聊天应用闻名，用户可以通过地理位置找到附近的人并进行即时通讯。随着发展，陌陌逐渐扩展了其业务，包括直播、短视频和社交电商等。

语音大模型算法工程师

工作职责:

1、参与语音生成系统的研发，包括多语种对话TTS系统的构建，持续优化发音韵律、情感表达以及个性化克隆的效果。

2、优化语音生成引擎，提升语音生成的流畅度，支持流式合成特性，提升实时对话场景的体验，并与产研团队配合，应用到实际产品中，迭代使用体验。

3、结合大模型范式，研发encodec，decoder、多模态对齐等模块，构建LLM based TTS和speech2speech系统。

4、构建语音高质量数据处理pipeline，支持10w小时规模的语音数据数据清洗，实践语音大模型的scaling law

任职条件:

1. 计算机科学、人工智能或者相关的本科及以上学历，有语音合成、语音转换、歌声合成、语音大模型研发经验者优先。

2. 精通python，C++等编程语言，熟悉高性能数据处理和解码引擎开发。

3. 有语音识别、合成等算法研发经验，有大规模数据训练经验。熟练掌握VITS\VALLE\FISHSPEECH\COSYVOICE等算法原理

4. 具备良好的沟通能力，对新技术充满热情，了解LLM或者训练过LLM优先。

语音大模型研发实习生

工作职责:

1. 结合语音识别、前端信号处理等工具参与语音数据质量迭代pipeline的研发，持续累积语音高质量训练数据。

2. 实验各种新的语音生成方案，并对其中的模块进行解耦和分析。

3. 参与搭建实时语音对话pipeline，持续体验和优化系统涉及的各个算法模块。

任职资格:

1. 计算机科学、人工智能或者相关的本科及以上学历，掌握基础的语音算法原理，如ASR、VAD、AGC、NS等

2. 精通python，C++等编程语言，了解或者使用过VITS\VALLE\FISHSPEECH\COSYVOICE，有LLM训练优先。

3. 具备良好的沟通能力，对新技术充满热情，一周能保证至少4天实习，实习周期至少2个月。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：momo_speech_hire@126.com

工作地点：北京

云上曲率

云上曲率LiveData（北京云上曲率科技有限公司），泛娱乐行业全球领先的实时通信、AI+大数据服务提供商。自主研发基于微服务的高性能分布式框架和深度学习平台。服务覆盖全球200多个国家和地区。核心成员来自谷歌/腾讯/Facebook等核心团队，拥有15年以上专业经验。云上曲率深耕泛娱乐领域，同时在在线教育、工业控制、IoT、智慧城市等行业领域具备较大产品技术优势。

招聘岗位

语音算法工程师

岗位职责

负责语音、音频相关算法的研究与开发，包括但不限于语音识别、语音合成、语音降噪、声纹识别、音频分类等方向；
负责跟进行业前沿技术，跟踪国际最新发展方向，持续探索语音技术新能力和新应用。

岗位要求

硕士及以上学历，语音、信号处理、计算机等相关专业背景，可接受应届生，优秀者可转正；
熟悉Linux、python、pytorch/tensorflow等工具；
熟悉常用机器学习、深度学习模型及语音相关算法；
有语音识别/语音合成/声纹识别相关经验者优先；
在语音领域发表过顶会论文或者比赛获奖者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：HR@ilivedata.com

华为诺亚方舟实验室

光明实验室

人工智能与数字经济广东省实验室（深圳）（简称光明实验室）为省政府批准筹建的第三批广东省实验室，十大省实验室之一。光明实验室经市政府批准设立为事业单位，实验室坐落在深圳市光明科学城，深圳大学为光明实验室的牵头建设单位。

光明实验室瞄准人工智能重大战略需求，聚焦“多模态AI技术与应用生态建设”、“国产AI算力生态建设”两大关键牵引任务，面向区块链与金融科技、泛在感知与智慧城市、机器学习与智能系统、智能传感与精准医疗等重大场景，重点聚焦面向大模型时代的下一代 AI云基础设施关键技术研究，及结合新一代多模态 AI 技术科研攻关与应用验证。

光明实验室媒体智能团队以加拿大工程院院士、欧洲科学院院士作为学术带头人。团队自成立来，已在AAAI、ACM MM、Information Fusion、IEEE Transactions on Mobile Computing、IEEE Signal Processing Letters、COLING、ICASSP等人工智能领域高水平会议和期刊发表或接收论文10余篇。团队创作的AIGC短剧《嫦娥奔月》登陆央视频APP、央视网等。

团队聚焦多模态内容理解与生成研究，具体包括（1）数字人、人与物及场景的交互生成、（2）图像及视频的编辑与生成、（3）多模态大模型及其在情感智能上的应用等方向。团队学术氛围自由，算力资源充足，提供多学科专家交流平台，鼓励前沿探索与技术创新，并为个人发展提供广阔的空间。

媒体智能研究员

副研究员

特聘副研究员

工作职责:

1、负责媒体智能相关领域的科研探索工作, 包括（1）数字人、人与物及场景的交互生成、（2）图像及视频的编辑与生成、（3）多模态大模型及其在情感智能上的应用等不同技术，撰写和发表高水平学术论文；

2、积极参与团队学术交流、人才培养、项目申报、日常管理和实验室公共服务，协助团队完成相关领域科研任务。

任职条件:

1、AI方向博士研究生学历，熟悉计算机视觉、计算机图形学、语音处理、自然语言处理、多模态学习等任一AI技术，相关方向有论文发表；

2、具备针对研究方向开展独立研究与科研管理的能力，有较强中英文写作能力；

3、熟悉深度学习常用编程框架和工具，熟悉相关的理论知识；

4、具备良好的工程能力和编程习惯，有项目经验者优先；

5、熟悉AIGC相关经典工作优先；

6、具备较强的动手能力、团队沟通和协作能力。

科研岗位待遇:

1、资深研究员年薪70万起，研究员年薪60万起，副研究员年薪50万起，特聘副研究员年薪40万起，并享受实验室的社保、公积金、带薪年假等相关福利，具体工资待遇根据学历、研究经历、科研能力等确定；

2、实验室关注中青年骨干人才的成长，凡全职入职实验室且拥有博士学位的研究人员均可申请担任实验室硕士研究生导师；

3、可协助申请深圳市新引进博士人才生活补贴10万元；

4、可参与评选深圳市高层次人才，认定后可额外享受每年24万-60万的人才奖励补贴；

媒体智能工程师

工作职责:

1、负责媒体智能系统的实现、性能调优相关工作；

2、与团队科研人员合作进行技术前沿的探索并进行方法实现与功能改进；

3、能够独立完成媒体智能系统设计与开发任务；

4、撰写技术规范文档、开发文档、专利技术交底书等。

任职资格:

1、AI相关专业方向本科及以上学历，具备与深度学习相关的基础知识和基本技能；

2、熟练常见相关深度学习框架，了解深度学习模型部署相关技术；

3、具备较强的编程能力、动手能力；

4、熟悉AIGC相关经典工作优先；

5、具备良好的团队沟通和协作能力。

聘期待遇及优势:

1、提供有竞争力的薪酬待遇，具体可面议;

2、周末双休，提供五险一金;

3、团队追求创新，关注前沿科技，科研氛围自由。

媒体智能实习生

工作职责:

从事媒体智能相关领域的科研探索工作, 包括

1、数字人、人与物及场景的交互生成、

2、图像及视频的编辑与生成、

3、多模态大模型及其在情感智能上的应用等方向，撰写和发表高水平学术论文。

任职资格:

1、本科在读及以上，熟悉计算机视觉、计算机图形学、语音处理、自然语言处理、多模态学习等任一AI技术，相关方向有论文发表优先；

2、熟悉深度学习理论及常用编程框架和工具，具备良好的工程能力和编程习惯，至少熟练使用python/C++/Java其中一种编程语言；

3、熟悉AIGC相关经典工作优先；

4、具备良好的团队沟通和协作能力。

聘期待遇及优势:

1、提供有竞争力的实习薪资;

2、提供免费住宿;

3、团队追求创新，关注前沿科技，科研氛围自由。

4、表现优异同学可获得推荐信。

简历投递

申请材料：个人简历，以及如有，请提供其他可以证明资质的材料，如学历证明、工作证明、推荐信等。

联系邮箱：mafei@gml.ac.cn

联系人：马老师

地址：深圳市光明区玉塘街道科润大厦B座

注意事项：

1、申请人的学历、学位应与岗位要求相符。

2、申请人应如实提供简历及证明材料，如与实际情况不符，一经查实，取消其应聘或录用资格。

3、面试结束后经审批后通知是否同意聘用，应聘材料将予以保密。

普强信息

普强于2009年在美国硅谷成立全球研发中心，主要从事智能语音和语言技术的研究，2010年设立中国运营公司，是金融科技创新和智能汽车AI服务提供商，在硅谷和中关村、上海,深圳均建设有技术研发中心，在南京拥有声学实验室，专注于金融大数据、AI芯片，智能汽车领域，拥有100%自主知识产权60余项，并参与制定多个国家及行业标准，普强始终致力于为客户提供完整的AI技术咨询和解决方案服务。

招聘岗位

语音算法工程师

岗位职责

负责语音信号处理算法的研究、设计、开发和优化，包括但不限于特征提取、降噪、回声消除等；
参与语音识别算法的研发，提高识别准确率和识别速度；
负责语音合成算法的开发，优化语音生成的音质和流畅度；
跟踪语音技术领域的最新动态，研究新技术和新算法，为公司技术储备提供支持；
与其他部门紧密合作，确保语音算法在公司产品中的有效应用；
编写相关技术文档，包括算法设计文档、测试报告、使用说明等；
完成领导交办的其他任务。

岗位要求

计算机科学、电子工程、信号处理或相关专业本科及以上学历，具有扎实的数学基础和编程能力；
熟悉语音信号处理、语音识别、语音合成等基本原理和算法；
熟练掌握C/C++、Python等编程语言，熟悉Linux操作系统和常用开发工具；
了解常用的语音算法库和工具，如Kaldi、Sphinx、HTK等；
具备良好的分析问题和解决问题的能力，对解决具有挑战性问题充满激情；
具备良好的团队合作精神和沟通能力，能够与其他部门有效协作；
有语音识别、语音合成等相关项目经验者优先

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@pachiratech.com

工作地点：北京海淀区

永久福利直投简历

简历投递：join@speechhome.com

扫码关注我们

助力AI语音开发者的社区

语音之家

助力AI语音开发者的社区