AI语音招聘岗位合集

文摘 2024-12-29 12:01 北京

下面是本周VJoinU的招聘简讯合集，希望小伙伴们都能找到心仪的岗位。

华院计算

华院由美国加州大学伯克利分校数学博士创立，成立于 2002 年，公司专注于数据智能研究。团队以基础算法研究和通用人工智能引擎开发为核心，从计算智能、感知智能，到认知智能，一直在人工智能算法研究领域处于行业前茅，产品与技术广泛应用于金融保险、医疗健康、电商零售、智能制造、社会治理、政务、教育与人力资源等行业及领域。

招聘岗位

语音合成工程师

岗位职责

负责语音合成（TTS）的算法研发、性能优化与落地实现。
负责围绕虚拟人高度情感可感知的语音合成技术的研究。
跟进学术界、行业最新的研究趋势，将预研成果落地于实际产品。

岗位要求

统招硕士及以上学历，计算机、电子信息、自动化等相关专业，两年以上语音合成的算法研究、项目开发经验。
深刻理解TTS原理，熟悉开源架构声学模型Tacotron和声码器WaveGlow、WaveRNN、HifiGAN等。
对TTS前端Cleanser、TN、G2P有一定经验。
熟练掌握Python，至少熟练使用一种深度学习训练框架，如Tensorflow、Pytorch等。
在个性化技术、风格迁移、语音转换、情感合成等方面有经验者优先。
在语音相关会议或期刊（如ICASSP、Interspeech、ISCSL、ASRU等）发表过文章或者参加过相关国际比赛者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：fang.yuan@unidt.com

工作地点：上海

歌尔股份

歌尔股份有限公司成立于2001年6月，2008年5月在深交所上市，是全球布局的科技创新型企业，主要从事声光电精密零组件及精密结构件、智能整机、高端装备的研发、制造和销售，目前已在多个领域建立了综合竞争力。

招聘岗位

语音增强算法专家

岗位职责

跟踪业界语音增强相关技术动态，布局关键技术；
负责前沿语音算法的需求分析和系统方案设计；
负责算法性能评价体系搭建及优化；
指导算法工程师解决算法开发中的疑难问题。

岗位要求

计算机、电子、通信、声学等相关专业硕士以上学历，8年以上相关工作经验
精通深度学习各种模型架构(CNN/RNN/Transformer/GAN)及模型部署压缩量化技术
掌握3A语音处理技术以及麦克风阵列信号处理技术，并有丰富落地经验
对语音增强技术相关领域均有深入见解，包括性能指标、关键点、算法优化等
具备成熟商用嵌入式平台语音增强算法开发经验者优先考虑
熟练掌握C/C++，Python，MATLAB等开发工具
有较强的沟通能力及团队协作能力

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：info_nj@goertek.com

工作地点：江苏省南京市

升智信息

控股主体为新加坡公司，海外美元基金融资，专注于人工智能、语音处理相关的软件产品与软件服务，管理团队有良好的业界口碑和履历。我们提供人工智能产品在不同商业场景下的整体技术解决方案，服务国内与海外各类大型企业客户。我们的产品包括人工智能在数据、语音、图像等方面的整合技术方案，向企业输出全面的人工智能服务产品，帮助客户提高业务拓展能力，降低运营成本，提高行业竞争力。

招聘岗位

资深语音识别算法工程师

岗位职责

基于多渠道语音交互领域的应用场景，负责公司产品中ASR模块的搭建以及相关技术的研发；
跟进行业前沿技术发展趋势，针对应用场景探索当前模型的优化方案，解决特定语种识别率提升的突出问题；
分析语音产品的运行数据，定期组织分析、撰写产品运行分析报告，提出产品改进意见，不断完善ASR最终效果、持续改善用户体验。

岗位要求

计算机、电子信息、通信工程、自动化等相关专业硕士以上，一年以上工作经验；
具有良好的编程能力，熟练掌握Python，Shell，C/C++，熟悉TensorFlow/PyTorch/Kaldi/Wenet等工具；
善于分析问题和解决问题；具备良好的学习和研究能力，可查阅英文文献；具有良好的沟通能力和团队合作精神；
有机器学习基础，熟悉常见机器学习、深度学习算法；
具有语音、NLP或CV等领域算法相关经验的优先；
熟悉语音识别声学模型、语言模型，有语音识别系统研发经验者优先；
在ICASSP、Interspeech或ASRU等语音会议或期刊发表过论文的优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：tingting.xin@wiz.ai

工作地点：南京

标贝科技

标贝（北京）科技有限公司（简称“标贝科技”）是一家专注智能语音交互和AI数据服务的人工智能公司，公司拥有的知识产权超过120余项，个人知识产权达80余项。标贝科技以“语音连接场景、数据服务技术”为理念，打造有温度有情感的声音体验，个性化、场景化的语音交互体验，让人机交互变得美好、生活变得更简单。

招聘岗位

高级语音研发工程师

岗位职责

语音合成/识别系统的设计研发，包括模型训练、声码器（合成）或者解码器（识别）等；
多语种、多说话人的高性能合成/识别系统的设计和研发。

岗位要求

机器学习、模式识别、计算机、信号处理等相关专业；
精通神经网络建模、模型训练和优化；
对数据结构和算法设计有深刻的理解；
精通C/C++编程和python等脚本语言，熟悉Linux平台；
优秀的分析问题和解决问题能力，对解决具有挑战性问题充满激情；
具有良好的沟通能力和团队合作精神。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr002@data-baker.com

地址：北京

智谱华章

智谱AI致力于打造新一代认知智能大模型，专注于做大模型的中国创新。公司于2020年底研发GLM预训练架构，2021年训练完成百亿参数模型GLM-10B，同年利用MoE架构成功训练出收敛的万亿稀疏模型，2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。

招聘岗位

资深音频算法工程师

岗位职责

从事音频生成算法研究、训练、应用，包括人声、音乐、音效等方面；
负责模型的多机多卡训练、高性能推理等；
负责将生成技术落地到业务，并进行持续优化。

岗位要求

硕士及以上学历，计算机、数学、通信等相关专业；具备良好的学习能力、逻辑思维能力、沟通协作能力；
有一年及以上语音合成算法经验，或者一年以上语音识别经验且希望转生成方向；
熟练使用Python和Pytorch/Tensorflow深度学习框架；
熟悉以下至少一种，且有相应研发经验优先：

大模型的框架&理论（如Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM、NaturalSpeech等）；
各类声码器（如Hifi-GAN，MelGAN，BigvGAN等）；
上一代语音合成模型（如Tacotron、Fastspeech等）；
有顶会论文（各类CCF-A会、ICASSP/INTERSPEECH等）优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：talent@zhipuai.cn

工作地点：北京

汉王科技

汉王科技股份有限公司成立于1998年，作为国内人工智能产业的先行者，汉王科技潜心深耕二十余载，始终致力于多领域智能交互技术的研究与应用。在手写识别、光学字符识别(OCR)、人脸识别、笔迹输入等领域拥有多项具有自主知识产权的核心技术，其中手写汉字识别获得国家科技进步一等奖，OCR识别获得国家科技进步二等奖。

招聘岗位

语音识别算法工程师

岗位职责

跟进前沿算法研究，面向公司业务场景进行语音识别相关技术研究及模型训练落地。

岗位要求

硕士及以上学历，人工智能、计算机、软件、应用数学等相关专业；
有1年以上语音识别相关算法研发经验；
熟练使用Python/C++，熟悉主流深度学习工具Pytorch、TensorFlow等，有大数据开发经验；
具有前沿技术追踪能力和工程交付能力；
在方言识别、多语种识别等方向有项目经验者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hwxz@hanwang.com.cn

工作地点：北京

拾音汽车

拾音，以丰富客户的感知体验技术为使命，致力于提供的新技术及声学领域的服务、方案和产品。我们是一家高新技术企业，是国内拥有仿真分析、试验测试和软件算法能力最为完备的供应商之一。真诚用心的服务和前瞻性的科技专长，使拾音成为汽车性能开发、实验室解决方案、以及新感知技术领域值得信任的合作伙伴。

招聘岗位

声学语音算法工程师

岗位职责

负责声学语音算法开发，对语音、声学、心理声学等方向较深的认识，包括但不限于噪声抑制、统计分析、音频增强算法、阵列信号处理等；
声学语音算法技术的研究，杜比/3D音效算法、音效增强、定向发声、主动降噪（ANC/RNC）算法和模拟声浪算法的技术研究和开发；针对具体需求进行实车算法调优、性能测试与评估；
编写算法文档，完成相关算法的工程化实现、调优与测试

岗位要求

硕士及以上学历，计算机/自动化/通信/电子工程等相关专业。博士优先；
具有声学、语音、阵列信号等方面的信号处理算法基础，有相关的研究和开发经验。
有一定DSP (高通Adsp/ADI Sharc DSP 等）经验加分，对音响系统特性（扬声器，功放，系统化建设）等领域有一定的认知能力。
掌握C/C++，python等代码开发工具，有机器学习和深度学习基础。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@sinetac.com

工作地点：上海

方位通讯

深圳方位通讯科技有限公司（方位通讯）是全球领先的专业物联网音视频（A&V-IoT）产品提供商、国家级高新技术企业，拥有北京、深圳、苏州三个研发基地。方位通讯专注物联网通讯技术与终端研发，经过近二十年的沉淀积累，打造SIP对讲、SIP门禁&室内机、物联网网关与SIP桌面终端四大产品系列，在行业内率先倡导运用标准化网络通信协议和开放音视频技术共建音视频物联网（A&V-IoT)，推动业务创新，提升运营效率，助力各行业数字化转型。

招聘岗位

语音算法工程师

岗位职责

统招本科、硕士学历；计算机，通信，电子等相关专业；
精通C、C++、python编程，有良好的软件开发能力；
熟悉音视频编解码相关的原理；
具有良好的沟通能力和团队合作精神，责任心强，自驱力强，有一定的承压能力；
优秀应届毕业生可以考虑。

岗位要求

负责ARM Linux及Android平台产品音视频模块设计、开发；
负责语音降噪深度学习算法研究、算法优化、部署；
负责语音合成、语音识别的算法研究、部署；
负责音频处理算法的研究与优化，如 VAD，AGC，DRC，AEC，EQ等；
职位福利:五险一金、年底双薪、定期体检、节日福利、带薪年假、周末双休、加班补助

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：xinxin.zhang@fanvil.com

工作地点：北京

黑芝麻智能

黑芝麻智能科技致力于成为全球嵌入式智能驾驶计算平台的共创者，用“芯”赋能未来出行。公司于2016年设立，在硅谷、新加坡、上海，全球员工近700人，创始团队大多毕业于清华大学，有超过20年在图像处理、视觉算法、核心IP研发、芯片设计和车规级产品开发与应用方面的经验。

招聘岗位

AI算法工程师

岗位职责

从事手机图像和视频处理核心算法的研发，跟踪该领域的最新技术，定期做该领域的前沿学术报告；
从事车路、车舱应用场景下图像和视频处理核心算法的研发，跟踪该领域的最新技术，定期做该领域的前沿学术报告；
设计能够解决应用需求的具体算法，根据项目需求完成算法的设计、验证。

岗位要求

深度学习、计算机视觉、图像处理、机器学习相关专业，硕士及以上学历；
具备良好的数学理论基础，在深度学习方向具有扎实的理论和实践基础，保持对领域最前沿技术的追踪；
了解常见的深度学习算法，如CNN、RNN、LSTM等；
深入掌握至少一种常见的视觉问题的工作pipeline，如2D，3D目标检测，语义分割，人脸识别，图像分类等。包括数据准备，训练迭代，corner case迭代；
熟练掌握至少一种常见的深度学习框架，如pytorch，tensorflow、熟练掌握C/C++, Python中的一种或多种语言，熟悉Linux/Unix开发环境；
英文熟练，有良好的英语阅读能力；
具有较强的责任心，事业心，进取心，良好的沟通和团队合作能力。

具有以下任意一项算法相关的项目经验者优先录取：

具有人脸检测、landmark检测、人脸属性识别、手势识别等项目经验；
具有人脸识别、指纹识别、活体检测等项目经验；
具有国内国际视觉，语音，语言处理等大赛经验及获取名次。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：recruiting@bst.ai

工作地点：武汉

康冠科技

深圳市康冠科技股份有限公司创立于 1995 年，致力于成为全球优秀的平板显示产品专业制造商，着眼于全方位的智能终端显示整体解决方案，成功布局家庭、教育、商用、医疗等智能显示行业，产品涵盖 TV、电子白板、电子拼接墙、显示器、一体机、数字标牌、工业监视器等平板显示产品。

招聘岗位

音频算法工程师

岗位职责

负责商用显示产品，音频前后处理算法。如噪声抑制(NS)、增益控制(AGC)、人声增强、回音消除(AEC），麦克风阵列拾音算法等。

岗位要求

熟练使用C/C++/Python，精通信号处理与语音处理技术；
熟悉音频前处理算法如回声消除、语音增强、麦阵处理开发者优先；
熟悉至少一种AI芯片部署方案，如：Rockchip/MTK等；
能力优秀者薪资可再议。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@ktc.com

工作地点：深圳

第四范式

第四范式（北京）技术有限公司成立于2014年底，是人工智能平台与技术服务提供商，公司以“Empower AI Transformation and Advance AI For Everyone”为企业使命，旨在让AI成为驱动社会进步、企业增长的引擎。依托于国际领先的机器学习技术与丰富的行业实践经验，第四范式打造了全栈式企业级AI产品体系——全流程人工智能平台、一站式流量运营技术平台，以及软件定义算力平台。

招聘岗位

语音识别算法工程师

岗位职责

负责语音方向的设计和研发，模型的效果优化，包括不限于：参与语音识别、声纹识别、语音评测、语音合成等方向
将语音领域的算法应用于实际场景，解决真实业务问题
将实践中的创新点以Github Repo/Paper/Tech Report等形式开源

岗位要求

本科及以上学历，具备语音识别、声纹识别、语音评测、语音合成等方向相关经历
具备良好的编程能力，熟练掌握python/C++等编程语言，优秀的分析问题和解决问题的能力，对解决具有挑战性的问题充满激情
较强的算法实现能力，熟悉深度学习平台如tensorflow/pytorch等

加分项

有较强的代码能力优先，有各类竞赛获奖经历(如kaggle，天池、DF、DC等比赛平台)、有过ACM等编程竞赛经历，或代码开源在github上并有较大影响
在Interspeech/ICASSP/ACL/EMNLP/ NAACL等顶会顶级会议或者期刊发表论文者
在大模型多模态领域有相关技术经验或竞赛经验

简历投递

投递网址：https://app.mokahr.com/su/g1vwk

地址：北京/上海/武汉/深圳均可

安普德

Amp’ed RF安普德2003年创立于美国硅谷，并于2009年12月在中国天津滨海高新区华苑产业园注册成立，依托两地优势，我们聚集众多无线射频芯片和无线物联技术的高端人才，潜心研究、锐意进取，现已逐步成为国内外同行业中同时可提供无线射频芯片、无线通信软件协议栈、组网技术等软硬件相结合的高端产品和专业解决方案企业中的翘楚。

招聘岗位

语音识别/合成算法工程师

岗位职责

开发和优化语音识别模型和语言模型，提升算法性能与稳定性;
开发和优化语音合成算法;
阅读文献，复现当前最新语音识别技术。

岗位要求

本科及以上学历，计算机、电子、数学等相关专业；
3年以上相关工作经验，扎实的数学基础，了解深度学习，信号处理基础知识，有语音识别项目经验者优先；
具有Matlab、python，或C/C++项目开发经验；
具有神经网络项目开发经验者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：jobs@ampedrftech.com

工作地点：北京

永久福利直投简历

简历投递：join@speechhome.com

扫码关注我们

助力AI语音开发者的社区

语音之家

助力AI语音开发者的社区

天工版o1、4o同时上线！实时语音陪聊太上头

通过流匹配实现高效、高质量的文本转音频生成

语音/音频处理学术速递[1.6]

AI语音招聘岗位合集

OpenAI真的开源了！这波「实时语音」操作，让万物开口说话，我爱了

活动报名丨第五届全国人工智能大赛

复旦等提出「中国版GPT-Zero」！毕业论文AI率自查神器｜AAAI 2025

语音/音频处理学术速递[1.3]

AI教父辛顿力挺马斯克，明确反对 OpenAI 的营利化转型。

分享 10 款免费在线 TTS 工具，开启语音新世界大门

4o-mini只有8B，Claude 3.5 Sonnet有175B，微软论文「透露」了下顶级模型参数

高噪声环境下的语音增强技术，在极低信噪比条件下显著提升目标语音的质量

使用知识图谱增强大语言模型生成问答逻辑形式

Ilya布局末日倒计时？奥特曼与谷歌大佬揭秘2025年ASI降临时间表！

ICASSP2025丨语音国家工程研究中心26篇录用论文分享

国产大模型全球“刷屏”，总训练成本557万美元，性能比肩GPT-4o

语音/音频处理学术速递[12.31]

ICASSP2025丨上交大跨媒体语言智能实验室12篇录用论文分享

2024年人工智能年终总结报告｜Artificial Analysis

语音/音频处理学术速递[12.30]

AI语音招聘岗位合集

听见未来，AI+Audio｜2025中国国际音频产业大会（GAS）

长文本+o1？评估LLM在真实世界长文本多任务中的深度理解与推理能力

国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元

ICASSP2025丨内蒙古大学语音信号处理组5篇录用论文分享

AI大模型权威评测：豆包中文对话最强，OpenAI o1推理和数学占优

全球首个中文安全领域事实性基准评测集发布

音频版ControlNet来了！Adobe推出Sketch2Sound

AI首次自主发现人工生命！人类窥见上帝造物

INFP：照片+音频让蒙娜丽莎秒变播客主理人

语音/音频处理学术速递[12.25]

CultureLLM 与 CulturePark：增强大语言模型对多元文化的理解

ICASSP2025丨人类语言技术实验室（HLT Lab）10篇录用论文分享

o3曝智商高达157，比肩爱因斯坦碾压99%人类！陶哲轩水平AI或出现

语音/音频处理学术速递[12.24]

ICASSP2025丨IMU语音理解与生成实验室3篇论文分享

开源更新丨通义3D-Speaker多说话人日志功能

李飞飞谢赛宁：多模态LLM「空间大脑」觉醒，惊现世界模型雏形！

语音/音频处理学术速递[12.23]

AI语音招聘岗位合集

GAS"消费电子科创奖” | 展示消费电子行业突破性成果

WavChat：深入探索语音对话模型的前沿

Interspeech 2025丨首届言语健康挑战赛

一键生成万字专利！中科院发布多智能体框架AutoPatent，含1933个「草稿-专利」数据对

内大语音理解与生成实验室最新视觉语音合成工作分享

语音/音频处理学术速递[12.20]

【AI对话系统新挑战】FutureDial-RAG Challenge详解

李飞飞团队统一动作与语言，新的多模态模型不仅超懂指令，还能读懂隐含情绪

语音/音频处理学术速递[12.19]

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉