AI语音招聘岗位合集

文摘 2024-11-10 12:51 河北

下面是本周VJoinU的招聘简讯合集，希望小伙伴们都能找到心仪的岗位。

蚂蚁集团

蚂蚁集团天筭实验室，专注于人工智能、机器学习、数据安全等领域的研究与应用。在AIGC（人工智能生成内容）时代背景下，我们致力于开发领先的音频检测技术，以保护数字媒体内容的真实性和信任度。为了加强我们的研发团队，我们现在寻找富有才华的实习生，共同应对日益复杂的音频安全挑战。

招聘岗位

AIGC音频检测实习生

岗位职责

参与设计和实现先进的音频防伪检测算法。
基于声纹识别，语音合成或预训练大模型，实施和优化创新的防伪算法。
产出学术论文及专利。
参加声音防伪攻击相关国内外竞赛。

岗位要求

预计在2025年11/30或之后毕业，目前正在攻读计算机科学、人工智能、声学工程或相关专业的硕士或博士学位。
在国际高水平期刊或会议上发表过关于音频处理、声纹识别或相关领域的学术论文。
拥有语音或与预训练大模型相关的研发经验优先。
具备中等偏上的编程能力，熟练使用Python或其他编程语言，并有使用机器学习库（如TensorFlow、PyTorch）的经验。
可以至少连续实习4个月，有能力独立完成项目并解决复杂问题。
对音频安全领域有浓厚兴趣，具备出色的分析和解决问题的能力，能够独立工作。
具有卓越的逻辑思维能力、沟通能力和团队协作精神。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：guyanmei.gym@antgroup.com

工作地点：上海/杭州

慧言科技

慧言科技（天津）有限公司是一家业内领先的言语交互高新技术企业。公司基于自主可控“海河·谛听”言语交互意图理解大模型，研发语音识别、语音生成、语义理解、文本生成、知识问答、机器翻译、声纹识别等全链路言语交互技术，支持中英日韩法西俄德维藏泰越等20余个语种，言语交互技术达到国内领先。同时，公司为合作伙伴提供大模型+教育、大模型+办公、大模型+金融等多行业综合解决方案。

招聘岗位

算法工程师

岗位职责

能够根据上级主管交代的需求进行相关语音算法的研发；
能够按照论文思路对论文中所提出的框架进行复现；

岗位要求

本科及以上学历，具有良好的编程能力，熟悉并熟练使用python以及pytorch框架；
熟悉linux开发环境；
具备一定的深度学习基础，有深度学习/机器学习/自然语言处理专业背景和经验者优先；

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@huiyan-tech.com

工作地点：天津

云上曲率

云上曲率LiveData（北京云上曲率科技有限公司），泛娱乐行业全球领先的实时通信、AI+大数据服务提供商。自主研发基于微服务的高性能分布式框架和深度学习平台。服务覆盖全球200多个国家和地区。核心成员来自谷歌/腾讯/Facebook等核心团队，拥有15年以上专业经验。云上曲率深耕泛娱乐领域，同时在在线教育、工业控制、IoT、智慧城市等行业领域具备较大产品技术优势。

招聘岗位

语音算法工程师

岗位职责

负责语音、音频相关算法的研究与开发，包括但不限于语音识别、语音合成、语音降噪、声纹识别、音频分类等方向；
负责跟进行业前沿技术，跟踪国际最新发展方向，持续探索语音技术新能力和新应用。

岗位要求

硕士及以上学历，语音、信号处理、计算机等相关专业背景；
1～2年语音方向工作经验，精通深度学习理论，精通语音相关算法；
熟练掌握C/C++、python，有较强的工程实现能力；
有多模态、音频大模型技术研发经验者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：HR@ilivedata.com

北银金科

北银金融科技有限责任公司根植于北京银行，是一家致力于大数据、人工智能、云计算、区块链、物联网等新技术创新与金融科技应用的科技企业，公司充分发挥北京银行企业文化和技术积淀先天优势，通过对技术、场景、生态的完美融合，输出科技创新产品和技术服务。

招聘岗位

语音算法工程师

岗位职责

负责语音识别、声纹识别、情感识别相关算法研究；
参与识别算法设计与实现，以及结合业务进行模型优化工作；
参与语音克隆产品研发，融合不同音色、情感等进行优化工作；
跟踪国际最新的识别、合成相关技术和前沿技术的发展。

岗位要求

1.熟悉Linux操作系统，精通python等脚本，熟悉ASR和TTS；
2.熟悉常用的语音模型及框架：wenet、funasr、espnet、kaldi等，有语音识别、语音合成项目实践经验者优先；
3.具备优秀的逻辑思维能力，较强的沟通和学习能力；
4.在相关国际会议或主流期刊（ICASSP、Interspeech、ACL、ICML等）上发表论文者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：zhaopin@bobfintech.com.cn

工作地点：北京

普强信息

普强于2009年在美国硅谷成立全球研发中心，主要从事智能语音和语言技术的研究，2010年设立中国运营公司，是金融科技创新和智能汽车AI服务提供商，在硅谷和中关村、上海,深圳均建设有技术研发中心，在南京拥有声学实验室，专注于金融大数据、AI芯片，智能汽车领域，拥有100%自主知识产权60余项，并参与制定多个国家及行业标准，普强始终致力于为客户提供完整的AI技术咨询和解决方案服务。

招聘岗位

语音算法工程师

岗位职责

1.负责语音信号处理算法的研究、设计、开发和优化，包括但不限于特征提取、降噪、回声消除等；
2.参与语音识别算法的研发，提高识别准确率和识别速度；
3.负责语音合成算法的开发，优化语音生成的音质和流畅度；
4.跟踪语音技术领域的最新动态，研究新技术和新算法，为公司技术储备提供支持；
5.与其他部门紧密合作，确保语音算法在公司产品中的有效应用；
6.编写相关技术文档，包括算法设计文档、测试报告、使用说明等；
7.完成领导交办的其他任务。

岗位要求

1.计算机科学、电子工程、信号处理或相关专业本科及以上学历，具有扎实的数学基础和编程能力；
2.熟悉语音信号处理、语音识别、语音合成等基本原理和算法；
3.熟练掌握C/C++、Python等编程语言，熟悉Linux操作系统和常用开发工具；
4.了解常用的语音算法库和工具，如Kaldi、Sphinx、HTK等；
5.具备良好的分析问题和解决问题的能力，对解决具有挑战性问题充满激情；
6.具备良好的团队合作精神和沟通能力，能够与其他部门有效协作；
7.有语音识别、语音合成等相关项目经验者优先

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@pachiratech.com

工作地点：北京海淀区

第四范式

第四范式（北京）技术有限公司成立于2014年底，是人工智能平台与技术服务提供商，公司以“Empower AI Transformation and Advance AI For Everyone”为企业使命，旨在让AI成为驱动社会进步、企业增长的引擎。依托于国际领先的机器学习技术与丰富的行业实践经验，第四范式打造了全栈式企业级AI产品体系——全流程人工智能平台、一站式流量运营技术平台，以及软件定义算力平台。

招聘岗位

语音识别算法工程师

岗位职责

负责语音方向的设计和研发，模型的效果优化，包括不限于：参与语音识别、声纹识别、语音评测、语音合成等方向
将语音领域的算法应用于实际场景，解决真实业务问题
将实践中的创新点以Github Repo/Paper/Tech Report等形式开源

岗位要求

本科及以上学历，具备语音识别、声纹识别、语音评测、语音合成等方向相关经历；
具备良好的编程能力，熟练掌握python/C++等编程语言，优秀的分析问题和解决问题的能力，对解决具有挑战性的问题充满激情；
较强的算法实现能力，熟悉深度学习平台如tensorflow/pytorch等。

加分项

有较强的代码能力优先，有各类竞赛获奖经历(如kaggle，天池、DF、DC等比赛平台)、有过ACM等编程竞赛经历，或代码开源在github上并有较大影响；
在Interspeech/ICASSP/ACL/EMNLP/ NAACL等顶会顶级会议或者期刊发表论文者；
在大模型多模态领域有相关技术经验或竞赛经验。

简历投递

投递：https://app.mokahr.com/su/g1vwk

工作地点：北京/上海/武汉/深圳均可

Akulaku

Akulaku是东南亚市场交易量较大，用户活跃度较高，团队成熟和发展速度较快的互联网金融平台。目前已覆盖印度尼西亚、菲律宾、越南等市场，致力于提供更本地化的产品服务。

招聘岗位

算法实习生

岗位职责

参与OCR，活体检测，人脸识别，语音识别，音频质检等算法开发

岗位要求

25届应届生，计算机，软件工程，应用数学等相关专业；每周可实习至少3天
熟悉机器学习，图像处理，信号处理，深度学习等理论；
熟悉Linux；
熟悉python或c++；
熟悉tensorflow或pytorch；

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr.sz@akulaku.com

工作地点：深圳

中科智加

中科智加是中科院自动化所旗下技术产业化公司，致力于用AI技术为行业赋能，为客户提供以语音识别、机器翻译、自然语言理解、知识图谱、图像视频智能处理等技术为核心的应用产品与解决方案，相关服务案例覆盖国内30余地市。

招聘岗位

语音识别工程师

岗位职责

参与公司核心语音识别系统的研发。
针对实际场景制定实现要求的模型、策略、算法方案、进行模型选择、训练、设计、开发及调试。
跟踪国内外行业最新动态，结合公司业务，迭代产品。

岗位要求

计算机及相关专业硕士及以上学历,信息与计算科学、数据、自然语言处理（NLP）、深度学习、机器学习等相关专业。
有1年以上语音项目工作经验。
熟练使用Python、c/c++和shell等编程语言，熟练使用dokcer服务。
熟练掌握linux开发环境。
熟悉主流ASR系统框架，理解声学模型/语言模型主流先进的建模方法，在模型训练和优化方面富有业务经验。
熟练使用常见的语音及深度学习开源工具，包括但不限于kaldi、PyTorch、Tensorflow等。
对最新语音模型如paraformer，whisper等有深入研究。
有模型国产化移植、模型压缩、量化、加速经验者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr.services@iplustek.com

工作地点：北京

华院计算

华院由美国加州大学伯克利分校数学博士创立，成立于 2002 年，公司专注于数据智能研究。团队以基础算法研究和通用人工智能引擎开发为核心，从计算智能、感知智能，到认知智能，一直在人工智能算法研究领域处于行业前茅，产品与技术广泛应用于金融保险、医疗健康、电商零售、智能制造、社会治理、政务、教育与人力资源等行业及领域。

招聘岗位

语音合成工程师

岗位职责

负责语音合成（TTS）的算法研发、性能优化与落地实现；
负责围绕虚拟人高度情感可感知的语音合成技术的研究；
跟进学术界、行业最新的研究趋势，将预研成果落地于实际产品。

岗位要求

统招硕士及以上学历，计算机、电子信息、自动化等相关专业，两年以上语音合成的算法研究、项目开发经验；
深刻理解TTS原理，熟悉开源架构声学模型Tacotron和声码器WaveGlow、WaveRNN、HifiGAN等；
对TTS前端Cleanser、TN、G2P有一定经验；
熟练掌握Python，至少熟练使用一种深度学习训练框架，如Tensorflow、Pytorch等；
在个性化技术、风格迁移、语音转换、情感合成等方面有经验者优先；
在语音相关会议或期刊（如ICASSP、Interspeech、ISCSL、ASRU等）发表过文章或者参加过相关国际比赛者优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：fang.yuan@unidt.com

工作地点：上海

中科信利

北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立，是以开发语音技术为核心的高新技术公司。公司专注于语音识别和音频信号处理相关技术和产品的研发，具有国际一流水平的语音识别/处理引擎、语音云系统和语音分析应用产品，产品涵盖互联网、电信平台、广电网教育、音乐检索以及嵌入式终端等多个领域。

招聘岗位

语音识别算法工程师

岗位职责

语音领域人工智能算法和模型的研发和优化，方向包括前端语音处理，语音识别，说话人、语种识别；
负责系统的数据处理、模型训练、结果分析、实验验证；
跟踪国内外最新的相关技术。

岗位要求

硕士或博士学历，计算机、电子、自动化、应用数学、模式识别、人工智能等相关专业
熟悉机器学习及深度学习基本原理和基本模型，熟练使用至少一种深度学习框架；（Kaldi、TensorFlow、Caffe等）；
在深度学习、机器学习等人工智能领域有一定的实际经验，具备扎实的模式识别、语音信号处理等理论和知识基础，擅于跟踪和学习最前沿人工智能技术；
良好的编程基础，掌握常用数据结构、算法，具备大数据/分布式机器学习技能优先。

简历投递

邮箱主题：姓名 + 申请岗位 + 语音之家推荐

邮箱：hr@thinkit.cn

工作地点：北京

永久福利直投简历

简历投递：join@speechhome.com

扫码关注我们

助力AI语音开发者的社区

http://mp.weixin.qq.com/s?__biz=MzI4OTQyNzA0Ng==&mid=2247533428&idx=1&sn=f62849c0d685542d3febc6d11fe2c3e5

语音之家

助力AI语音开发者的社区

最新文章

上交大与上海人工智能研究所联合推出医学多语言模型，模型数据代码开源

CCF语音对话与听觉专委 “走进高校”系列活动—走进江苏大学

语音/音频处理学术速递[11.12]

诺奖AI成果开源了！ AlphaFold3代码人人可以免费下，Nature亲自撰文推荐

PersonaTalk：无需训练即可创建数字人，视频口型编辑超SOTA

智谱，让AI视频正式迈入“有声时代”

语音/音频处理学术速递[11.11]

AI语音招聘岗位合集

王仁华：“这是我们民族的事，应该自己闯出这条路！” | 先生

重磅！刚刚Sam Altman万字采访：AGI将在2025年实现，通往 AGI 的道路已经清晰可见

语音增强的跨域优化：并行还是级联？

文本图格式大一统！首个大规模文本边基准TEG-DB发布 | NeurIPS 2024

语音/音频处理学术速递[11.8]

【直播预告】Xmart•学生论坛丨刘濠赫：LDMs in audio decoding

港科大、中科大等推出最强扩散Transformer，「黑神话」级3A大作AI实时游戏生成！

语音/音频处理学术速递[11.7]

CNCC2024技术论坛“多模态大模型时代的语音音频技术：带来哪些机遇与挑战？”圆满举行

腾讯混元开源最大 MoE大模型

语音/音频处理学术速递[11.6]

技术沙龙预告丨揭秘新一代大规模声音克隆TTS模型MaskGCT

满血版o1倒计时！奥特曼完整专访流出：o系列疯狂迭代，马上起飞

语音/音频处理学术速递[11.5]

自回归量化连续语音合成，潜在扩散模型；多模态音频理解基准

倒计时3天，ISCSLP2024大会即将开幕！注册参会持续开放中

微软清华改进Transformer：用降噪耳机原理升级注意力，一作在线答疑

语音/音频处理学术速递[11.4]

AI语音招聘岗位合集

大规模、动态「语音增强/分离」新基准！清华发布移动音源仿真平台SonicSim，含950+小时训练数据

Meta发布全新后训练方式CGPO，编程水平直升5%

语音/音频处理学术速递[11.1]

刚刚，ChatGPT变身AI搜索免费用！OpenAI颠覆谷歌，搜索变天了

SiliconCloud上线Fish Audio：一站式开发端到端实时语音应用

o1驾驶无人机后空翻，OpenAI开发者日惊掉下巴！2分钟爆改代码写App

语音/音频处理学术速递[10.31]

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

博士招生机会！

智源研究院发布千万级多模态指令数据集Infinity-MM：驱动开源模型迈向SOTA性能

语音/音频处理学术速递[10.30]

语音/音频处理学术速递[10.29]

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

可在嘈杂环境中识别声音，新型液态声学传感器模拟鲸鱼额隆

超越Transformer，全面升级！MIT等华人团队发布通用时序TimeMixer++架构，8项任务全面领先

开放下载丨超自然对话语音合成数据集NCSSD

对话语音合成大模型GPT-Talker: Generative Expressive CSS

谷歌AI播客刚火，Meta就开源了平替，效果一言难尽

语音/音频处理学术速递[10.28]

AI语音招聘岗位合集

7B新王登基！Zamba 2完胜同级模型，推理效率比Llama 3提升20%，内存用量更少

语音/音频处理学术速递[10.25]

直播预告丨RTE2024 第十届实时互联网大会

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉