AI语音招聘岗位合集

文摘 2024-12-22 12:00 河北

下面是本周VJoinU的招聘简讯合集，希望小伙伴们都能找到心仪的岗位。

北银金科

北银金融科技有限责任公司根植于北京银行，是一家致力于大数据、人工智能、云计算、区块链、物联网等新技术创新与金融科技应用的科技企业，公司充分发挥北京银行企业文化和技术积淀先天优势，通过对技术、场景、生态的完美融合，输出科技创新产品和技术服务。

招聘岗位

语音算法工程师

岗位职责

负责语音识别、声纹识别、情感识别相关算法研究；
参与识别算法设计与实现，以及结合业务进行模型优化工作；
参与语音克隆产品研发，融合不同音色、情感等进行优化工作；
跟踪国际最新的识别、合成相关技术和前沿技术的发展。

岗位要求

熟悉Linux操作系统，精通python等脚本，熟悉ASR和TTS；
熟悉常用的语音模型及框架：wenet、funasr、espnet、kaldi等，有语音识别、语音合成项目实践经验者优先；
具备优秀的逻辑思维能力，较强的沟通和学习能力；
在相关国际会议或主流期刊（ICASSP、Interspeech、ACL、ICML等）上发表论文者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：zhaopin@bobfintech.com.cn

工作地点：北京

灿瑞科技

作为模拟和数字IC设计公司，上海灿瑞科技股份有限公司专注于为客户提供多元化、高级能率比与可控成本于一体的电源管理IC产品、具有竞争力的电源解决方案以及完整的客制化系统设计支援和服务。借助于香港、台湾、中国大陆等地的分公司，灿瑞快速响应客户需求，为全球的客户提供高品质的半导体产品及解决方案。

招聘岗位

音频算法工程师

岗位职责

负责音频产品算法技术调研、算法方案设计、仿真验证等工作；
负责产品性能的持续优化以及客户算法问题跟踪与处理；
负责相关领域新技术研究探索;
音乐、音频新技术研究探索；
负责产品开发相关文档撰写。

岗位要求

本科以上学历，计算机、通信、电子、信号处理理、声学等相关专业；
精通信号处理与音频处理理技木，拥有良好的数学及DSP理论基础，有过音频算法处理和信号处理工作经验优先；
熟练使用建模工具；熟悉DSP嵌入式软件设计思路、开发方法和调试测试方法。熟悉DSP的系统架构、内外部资源者优先；
良好的英文论文阅读能力及算法仿真能力；
良好的沟通能力和团队合作精神，条理性强，逻辑清晰。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@orient-chip.com

工作地点：上海

太初电子

太初元碁（太初（无锡）电子科技有限公司）是由国家超级计算无锡中心孵化的高性能人工智能产业化公司，致力于发展世界领先的自主可控高性能计算技术和生态。公司主要业务方向为研发自主可控的高性能计算产品、系统集成技术与全栈软件生态，面向政府和企业用户，提供高性能、高能效的智能算力解决方案，技术服务及培训等。

招聘岗位

语音算法工程师

岗位职责

负责深度语音处理技术研究和开发
负责语音模型及语音识别的开发
完成相关代码的维护和文档的撰写

岗位要求

熟练掌握语音处理及深度学习相关知识，具有语音识别，语音模型项目经验者优先。
在深度学习领域有较强的理论研究与实践经验，至少掌握一种以上深度学习框架（如Tensorflow、PyTorch等）
有较强的算法分析和实现能力，掌握Python编程语言，熟悉Linux开发环境，有C/C++基础
有较强的英文文献的阅读理解能力，能跟踪学术界与业界最新进展，具有较强的研究能力
具备敬业精神和团队合作精神，善于分析和解决问题

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：recruit@tecorigin.com

工作地点：无锡

启英泰伦

成都启英泰伦科技有限公司（以下简称“启英泰伦”）于2015年11月在成都高新区注册成立，是集语音芯片、语音算法、应用方案、开发平台于一体的行业领导型语音解决方案供应商。公司致力于为用户提供更自然、更简单、更智能的人机交互体验，让“智能语音+”产品无处不在。

招聘岗位

语音识别算法工程师

岗位职责

负责语音识别中声学模型相关算法的设计和实现，探索语音相关(语音识别ASR、音频端点检测VAD、多语言识别)算法研究工作，推进新算法在业务场景的落地；
负责语音识别声学模型、语言模型的训练和测试；
进行业务相关模型优化工作,针对性解决业务问题；
为语音识别相关模块提供机器学习算法和工具的支持。

岗位要求

熟悉语音识别声相关算法，语音信号处理技术，能够独立完成相关算法的设计和实现；
具备一定的机器学习或模式识别知识，对深度学习有清晰的理解，有过语音识别相关的经验；
熟练掌握python、shell等语言，能熟练使用pytorch或者tensorflow，熟悉C++，深入掌握C语言使用，熟悉嵌入式相关应用，熟悉行业主流语音识别开源工具。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@chipintelli.com

地址：成都

云上曲率

云上曲率LiveData（北京云上曲率科技有限公司），泛娱乐行业全球领先的实时通信、AI+大数据服务提供商。自主研发基于微服务的高性能分布式框架和深度学习平台。服务覆盖全球200多个国家和地区。核心成员来自谷歌/腾讯/Facebook等核心团队，拥有15年以上专业经验。云上曲率深耕泛娱乐领域，同时在在线教育、工业控制、IoT、智慧城市等行业领域具备较大产品技术优势。

招聘岗位

语音算法工程师

岗位职责

1、负责语音、音频相关算法的研究与开发，包括但不限于语音识别、语音合成、语音降噪、声纹识别、音频分类等方向；
2、负责跟进行业前沿技术，跟踪国际最新发展方向，持续探索语音技术新能力和新应用。

岗位要求

硕士及以上学历，语音、信号处理、计算机等相关专业背景，可接受应届生，优秀者可转正；
熟悉Linux、python、pytorch/tensorflow等工具；
熟悉常用机器学习、深度学习模型及语音相关算法；
有语音识别/语音合成/声纹识别相关经验者优先；
在语音领域发表过顶会论文或者比赛获奖者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：HR@ilivedata.com

海飞科

海飞科（Hexaflake）是一家致力于通用并行处理器（GPU）研发，并建立通用并行计算软件开发生态的高科技企业。AI的迅速发展正在深刻改变人类社会和世界的面貌，深度学习之所以有今天的繁荣，除了有创新的算法模型外，还有强大的算力支撑。

招聘岗位

深度学习框架研发专家和工程师

岗位职责

设计和开发大规模分布式深度学习训练和推理平台；
跟踪/分析/评估各主流开源深度学习框架，参与自研深度学习软件栈的整体设计和实现，性能调优；
在海飞科自研AIGPU芯片上，设计与实现高性能的算子加速库。

岗位要求

计算机/数学/物理/电子工程/自动控制专业，本科及以上学历，3年以上工作经验（特别优秀者可适当放宽要求）；
熟练掌握计算机科学基础知识，对计算机系统（包括操作系统，计算机体系结构，并行处理等）有深刻的理解，且具有较丰富的相关实践经验；
精通C++/Python编程，有3年以上工作经验；
熟练掌握Linux应用程序开发流程及环境；
熟悉图编译及网络优化；
理解深度学习理论，熟悉至少一种深度学习框架及相关软件，如TensorFlow/XLA，TVM，PyTorch，PaddlePaddle，NNVM，ONNX等，对框架内部有所了解；
良好的编程风格习惯，优秀的书面和口头沟通能力，团队协作精神。

加分项:

具有AI算子开发和优化经验；
CUDA/OpenMP/OpenCL相关开发经验；
任一种推理引擎TensorRT/TF-Lite/AndroidNN/CoreML/MNN上的开发使用经验；
熟悉常见深度学习模型算法，在计算机视觉、语音、自然语言处理中任一个领域的应用经验。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@hexaflake.ai

工作地点：南京

普强信息

普强于2009年在美国硅谷成立全球研发中心，主要从事智能语音和语言技术的研究，2010年设立中国运营公司，是金融科技创新和智能汽车AI服务提供商，在硅谷和中关村、上海,深圳均建设有技术研发中心，在南京拥有声学实验室，专注于金融大数据、AI芯片，智能汽车领域，拥有100%自主知识产权60余项，并参与制定多个国家及行业标准，普强始终致力于为客户提供完整的AI技术咨询和解决方案服务。

招聘岗位

语音算法工程师

岗位职责

负责语音信号处理算法的研究、设计、开发和优化，包括但不限于特征提取、降噪、回声消除等；
参与语音识别算法的研发，提高识别准确率和识别速度；
负责语音合成算法的开发，优化语音生成的音质和流畅度；
跟踪语音技术领域的最新动态，研究新技术和新算法，为公司技术储备提供支持；
与其他部门紧密合作，确保语音算法在公司产品中的有效应用；
编写相关技术文档，包括算法设计文档、测试报告、使用说明等；
完成领导交办的其他任务。

岗位要求

计算机科学、电子工程、信号处理或相关专业本科及以上学历，具有扎实的数学基础和编程能力；
熟悉语音信号处理、语音识别、语音合成等基本原理和算法；
熟练掌握C/C++、Python等编程语言，熟悉Linux操作系统和常用开发工具；
了解常用的语音算法库和工具，如Kaldi、Sphinx、HTK等；
具备良好的分析问题和解决问题的能力，对解决具有挑战性问题充满激情；
具备良好的团队合作精神和沟通能力，能够与其他部门有效协作；
有语音识别、语音合成等相关项目经验者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@pachiratech.com

工作地点：北京海淀区

冠旭电子

深圳市冠旭电子股份有限公司于1997年成立于中国深圳，总部位于深圳龙岗坪地国际低碳城中心区。公司主要从事专业音频、智能耳机及智能音箱等智能终端产品的研发、制造及品牌营销。凭借全方位、多领域的核心技术体系及精益化生产管理能力等综合竞争优势，公司与国际知名品牌商、芯片商、平台方案商、云服务商达成稳定、紧密、长期的战略合作关系。

招聘岗位

音频算法工程师

岗位职责

负责评估产品中音频软件方案；
负责QCC\ARM等平台音频算法模块的开发；
根据产品设计要求，完成算法定制、集成和测试验证；
负责解决产品中音频相关问题；
负责前瞻性音频软件技术研究。

岗位要求

本科或本科以上，电子、计算机、自动化、通信或者相关专业；
具有扎实的数字信号处理基础，掌握常用的时域、频域处理技术；
了解常用的音频处理算法，EQ、DRC等；
具有较好的C编程基础；
熟练使用Matlab或Python软件；
具有良好的英文阅读能力；
有DSP开发经验者优先；
了解降噪、音效处理、语音增强技术者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：anna.guan@grandsun.com

工作地点：南京

像衍科技

像衍的创始团队深耕数字人相关的三维计算机视觉和图形学技术多年，创新研发了基于神经网络表示的高质量三维重建、驱动和绘制技术，打造了以“计算底座+工具链+超写实数字人内容生成”的全栈工具软件平台，以创造每个人的数字化身为使命，让数字人成为企业与个人对外宣传与客户服务的最佳媒介。

招聘岗位

语音算法工程师

岗位职责

负责声纹识别、语音识别、语音合成、语音转换等算法的研发、实现、优化和落地；
负责算法优化和迭代更新，确保算法具备竞争力；
负责跟进行业前沿技术发展趋势，跟踪国际最新算法发展方向和相应技术。

岗位要求

硕士以上学历，计算机、音频、机器学习、语音、自然语言处理、机器视觉等相关专业优先；
较强的算法实现和编程能力，熟练掌握c/c++、python语言；
扎实的深度学习算法基础，熟练掌握 TensorFlow、Pytorch等；
对语音信息处理具有浓厚兴趣，在ASR、TTS、STT等相关方向有一定的研究经历；
有相关竞赛和学术会议发表论文者优先；
工作积极主动，学习能力强，有良好的沟通能力和团队合作能力。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@idr.ai

工作地点：杭州

魔珐科技

魔珐科技成立于2018年，是一家以三维计算机图形学和AIGC技术为核心的3D虚拟人科技公司。魔珐科技打造了端对端的超写实3D虚拟人工业化产线，并在此基础上建立了“3D虚拟人AIGC平台--星云平台”，自研了3D虚拟人AIGC消费级产品矩阵，致力于为各行各业提供高质量、高效率、低门槛、规模化的超写实3D虚拟人技术，产品和服务。

招聘岗位

数据标注 / AI训练师

岗位职责

正式全职岗位，可接受汉语言文学专业应届生或往届生，接受无数据标注经验，可培养

负责语音数据的标注、检查和验收，根据业务和算法需求，深刻了解数据标准规范，保障数据质量合格；
负责音频转写、文本校对、音频数据处理、拼音韵律标注、音色测评等标注工作；
负责总结经验、优化流程，培训指导标注同学按标准交付。

岗位要求

本科学历优先；
有语言学或汉语言文学相关专业背景优先，学习过现代汉语课程者优先，中文、新闻传播、语文教育专业优先；
对汉语言相关知识有一定了解，了解汉语拼音、韵律等语言知识并能在工作中进行相应的应用；
有声音数据采集和TTS标注经验者优先；
对声音细节敏感，能敏锐捕捉声音瑕疵，对质量有较高的追求和审美。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@xmov.ai

工作地点：上海

中科智加

中科智加是中科院自动化所旗下技术产业化公司，致力于用AI技术为行业赋能，为客户提供以语音识别、机器翻译、自然语言理解、知识图谱、图像视频智能处理等技术为核心的应用产品与解决方案，相关服务案例覆盖国内30余地市。

招聘岗位

语音识别工程师

岗位职责

参与公司核心语音识别系统的研发。
针对实际场景制定实现要求的模型、策略、算法方案、进行模型选择、训练、设计、开发及调试。
跟踪国内外行业最新动态，结合公司业务，迭代产品。

岗位要求

计算机及相关专业硕士及以上学历,信息与计算科学、数据、自然语言处理（NLP）、深度学习、机器学习等相关专业。
有1年以上语音项目工作经验。
熟练使用Python、c/c++和shell等编程语言，熟练使用dokcer服务。
熟练掌握linux开发环境。
熟悉主流ASR系统框架，理解声学模型/语言模型主流先进的建模方法，在模型训练和优化方面富有业务经验。
熟练使用常见的语音及深度学习开源工具，包括但不限于kaldi、PyTorch、Tensorflow等。
对最新语音模型如paraformer，whisper等有深入研究。
有模型国产化移植、模型压缩、量化、加速经验者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr.services@iplustek.com

地址：北京

时空壶

深圳时空壶技术有限公司创立于2016年，致力于通过人工智能与硬件技术的结合，打造让人类跨越语言障碍的AI翻译产品。成立6年间，时空壶针对不同场景下的翻译需求，先后上市W3旗舰翻译耳机、M3旅行翻译耳机，以及Zero随身翻等系列产品。在商务、旅游、教育等多行业得到了广泛的应用，如写字楼、旅游景点、学校、警察局甚至是教堂，都能看到时空壶产品的身影。

招聘岗位

算法实习生

岗位职责

协助现有语音识别算法的模型训练、监控中间结果、参与结果分析并优化；
参与算法研究，跟踪最新的语音识别技术和研究成果，探索新的算法和方法来改进识别系统；
协助完成语音识别工程化落地，包括提升识别正确度、识别速度、降低资源消耗等方面

岗位要求

认可公司的文化和价值观；
熟练掌握编程语言，如Python、C++等，能够实现和优化算法；
需要计算机、人工智能、自然语言处理等相关专业的学士或硕士学位；
有whisper、wenet等工程经验的优先，能独立分析模型结果并提出改进方案；
博士在读生薪酬可另谈。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：atin.zhang@timekettle.co

工作地点：深圳

永久福利直投简历

简历投递：join@speechhome.com

扫码关注我们

助力AI语音开发者的社区

语音之家

助力AI语音开发者的社区

天工版o1、4o同时上线！实时语音陪聊太上头

通过流匹配实现高效、高质量的文本转音频生成

语音/音频处理学术速递[1.6]

AI语音招聘岗位合集

OpenAI真的开源了！这波「实时语音」操作，让万物开口说话，我爱了

活动报名丨第五届全国人工智能大赛

复旦等提出「中国版GPT-Zero」！毕业论文AI率自查神器｜AAAI 2025

语音/音频处理学术速递[1.3]

AI教父辛顿力挺马斯克，明确反对 OpenAI 的营利化转型。

分享 10 款免费在线 TTS 工具，开启语音新世界大门

4o-mini只有8B，Claude 3.5 Sonnet有175B，微软论文「透露」了下顶级模型参数

高噪声环境下的语音增强技术，在极低信噪比条件下显著提升目标语音的质量

使用知识图谱增强大语言模型生成问答逻辑形式

Ilya布局末日倒计时？奥特曼与谷歌大佬揭秘2025年ASI降临时间表！

ICASSP2025丨语音国家工程研究中心26篇录用论文分享

国产大模型全球“刷屏”，总训练成本557万美元，性能比肩GPT-4o

语音/音频处理学术速递[12.31]

ICASSP2025丨上交大跨媒体语言智能实验室12篇录用论文分享

2024年人工智能年终总结报告｜Artificial Analysis

语音/音频处理学术速递[12.30]

AI语音招聘岗位合集

听见未来，AI+Audio｜2025中国国际音频产业大会（GAS）

长文本+o1？评估LLM在真实世界长文本多任务中的深度理解与推理能力

国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元

ICASSP2025丨内蒙古大学语音信号处理组5篇录用论文分享

AI大模型权威评测：豆包中文对话最强，OpenAI o1推理和数学占优

全球首个中文安全领域事实性基准评测集发布

音频版ControlNet来了！Adobe推出Sketch2Sound

AI首次自主发现人工生命！人类窥见上帝造物

INFP：照片+音频让蒙娜丽莎秒变播客主理人

语音/音频处理学术速递[12.25]

CultureLLM 与 CulturePark：增强大语言模型对多元文化的理解

ICASSP2025丨人类语言技术实验室（HLT Lab）10篇录用论文分享

o3曝智商高达157，比肩爱因斯坦碾压99%人类！陶哲轩水平AI或出现

语音/音频处理学术速递[12.24]

ICASSP2025丨IMU语音理解与生成实验室3篇论文分享

开源更新丨通义3D-Speaker多说话人日志功能

李飞飞谢赛宁：多模态LLM「空间大脑」觉醒，惊现世界模型雏形！

语音/音频处理学术速递[12.23]

AI语音招聘岗位合集

GAS"消费电子科创奖” | 展示消费电子行业突破性成果

WavChat：深入探索语音对话模型的前沿

Interspeech 2025丨首届言语健康挑战赛

一键生成万字专利！中科院发布多智能体框架AutoPatent，含1933个「草稿-专利」数据对

内大语音理解与生成实验室最新视觉语音合成工作分享

语音/音频处理学术速递[12.20]

【AI对话系统新挑战】FutureDial-RAG Challenge详解

李飞飞团队统一动作与语言，新的多模态模型不仅超懂指令，还能读懂隐含情绪

语音/音频处理学术速递[12.19]

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉