下面是本周VJoinU的招聘简讯合集,希望小伙伴们都能找到心仪的岗位。
华院由美国加州大学伯克利分校数学博士创立,成立于 2002 年,公司专注于数据智能研究。团队以基础算法研究和通用人工智能引擎开发为核心,从计算智能、感知智能,到认知智能,一直在人工智能算法研究领域处于行业前茅,产品与技术广泛应用于金融保险、医疗健康、电商零售、智能制造、社会治理、政务、教育与人力资源等行业及领域。
语音合成工程师
负责语音合成(TTS)的算法研发、性能优化与落地实现。
负责围绕虚拟人高度情感可感知的语音合成技术的研究。
跟进学术界、行业最新的研究趋势,将预研成果落地于实际产品。
统招硕士及以上学历,计算机、电子信息、自动化等相关专业,两年以上语音合成的算法研究、项目开发经验。
深刻理解TTS原理,熟悉开源架构声学模型Tacotron和声码器WaveGlow、WaveRNN、HifiGAN等。
对TTS前端Cleanser、TN、G2P有一定经验。
熟练掌握Python,至少熟练使用一种深度学习训练框架,如Tensorflow、Pytorch等。
在个性化技术、风格迁移、语音转换、情感合成等方面有经验者优先。
在语音相关会议或期刊(如ICASSP、Interspeech、ISCSL、ASRU等)发表过文章或者参加过相关国际比赛者优先。
简历投递
歌尔股份有限公司成立于2001年6月,2008年5月在深交所上市,是全球布局的科技创新型企业,主要从事声光电精密零组件及精密结构件、智能整机、高端装备的研发、制造和销售,目前已在多个领域建立了综合竞争力。
语音增强算法专家
跟踪业界语音增强相关技术动态,布局关键技术; 负责前沿语音算法的需求分析和系统方案设计; 负责算法性能评价体系搭建及优化; 指导算法工程师解决算法开发中的疑难问题。
计算机、电子、通信、声学等相关专业硕士以上学历,8年以上相关工作经验 精通深度学习各种模型架构(CNN/RNN/Transformer/GAN)及模型部署压缩量化技术 掌握3A语音处理技术以及麦克风阵列信号处理技术,并有丰富落地经验 对语音增强技术相关领域均有深入见解,包括性能指标、关键点、算法优化等 具备成熟商用嵌入式平台语音增强算法开发经验者优先考虑 熟练掌握C/C++,Python,MATLAB等开发工具 有较强的沟通能力及团队协作能力
简历投递
控股主体为新加坡公司,海外美元基金融资,专注于人工智能、语音处理相关的软件产品与软件服务,管理团队有良好的业界口碑和履历。我们提供人工智能产品在不同商业场景下的整体技术解决方案,服务国内与海外各类大型企业客户。我们的产品包括人工智能在数据、语音、图像等方面的整合技术方案,向企业输出全面的人工智能服务产品,帮助客户提高业务拓展能力,降低运营成本,提高行业竞争力。
资深语音识别算法工程师
基于多渠道语音交互领域的应用场景,负责公司产品中ASR模块的搭建以及相关技术的研发;
跟进行业前沿技术发展趋势,针对应用场景探索当前模型的优化方案,解决特定语种识别率提升的突出问题;
分析语音产品的运行数据,定期组织分析、撰写产品运行分析报告,提出产品改进意见,不断完善ASR最终效果、持续改善用户体验。
计算机、电子信息、通信工程、自动化等相关专业硕士以上,一年以上工作经验;
具有良好的编程能力,熟练掌握Python,Shell,C/C++,熟悉TensorFlow/PyTorch/Kaldi/Wenet等工具;
善于分析问题和解决问题;具备良好的学习和研究能力,可查阅英文文献;具有良好的沟通能力和团队合作精神;
有机器学习基础,熟悉常见机器学习、深度学习算法;
具有语音、NLP或CV等领域算法相关经验的优先;
熟悉语音识别声学模型、语言模型,有语音识别系统研发经验者优先;
在ICASSP、Interspeech或ASRU等语音会议或期刊发表过论文的优先。
简历投递
标贝(北京)科技有限公司(简称“标贝科技”)是一家专注智能语音交互和AI数据服务的人工智能公司,公司拥有的知识产权超过120余项,个人知识产权达80余项。标贝科技以“语音连接场景、数据服务技术”为理念,打造有温度有情感的声音体验,个性化、场景化的语音交互体验,让人机交互变得美好、生活变得更简单。
高级语音研发工程师
语音合成/识别系统的设计研发,包括模型训练、声码器(合成)或者解码器(识别)等; 多语种、多说话人的高性能合成/识别系统的设计和研发。
机器学习、模式识别、计算机、信号处理等相关专业; 精通神经网络建模、模型训练和优化; 对数据结构和算法设计有深刻的理解; 精通C/C++编程和python等脚本语言,熟悉Linux平台; 优秀的分析问题和解决问题能力,对解决具有挑战性问题充满激情; 具有良好的沟通能力和团队合作精神。
简历投递
智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型,2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。
资深音频算法工程师
从事音频生成算法研究、训练、应用,包括人声、音乐、音效等方面;
负责模型的多机多卡训练、高性能推理等;
负责将生成技术落地到业务,并进行持续优化。
硕士及以上学历,计算机、数学、通信等相关专业;具备良好的学习能力、逻辑思维能力、沟通协作能力;
有一年及以上语音合成算法经验,或者一年以上语音识别经验且希望转生成方向;
熟练使用Python和Pytorch/Tensorflow深度学习框架;
熟悉以下至少一种,且有相应研发经验优先:
大模型的框架&理论(如Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM、NaturalSpeech等);
各类声码器(如Hifi-GAN,MelGAN,BigvGAN等);
上一代语音合成模型(如Tacotron、Fastspeech等);
有顶会论文(各类CCF-A会、ICASSP/INTERSPEECH等)优先。
简历投递
汉王科技股份有限公司成立于1998年,作为国内人工智能产业的先行者,汉王科技潜心深耕二十余载,始终致力于多领域智能交互技术的研究与应用。在手写识别、光学字符识别(OCR)、人脸识别、笔迹输入等领域拥有多项具有自主知识产权的核心技术,其中手写汉字识别获得国家科技进步一等奖,OCR识别获得国家科技进步二等奖。
语音识别算法工程师
跟进前沿算法研究,面向公司业务场景进行语音识别相关技术研究及模型训练落地。
硕士及以上学历,人工智能、计算机、软件、应用数学等相关专业; 有1年以上语音识别相关算法研发经验; 熟练使用Python/C++,熟悉主流深度学习工具Pytorch、TensorFlow等,有大数据开发经验; 具有前沿技术追踪能力和工程交付能力; 在方言识别、多语种识别等方向有项目经验者优先。
简历投递
拾音,以丰富客户的感知体验技术为使命,致力于提供的新技术及声学领域的服务、方案和产品。我们是一家高新技术企业,是国内拥有仿真分析、试验测试和软件算法能力最为完备的供应商之一。真诚用心的服务和前瞻性的科技专长,使拾音成为汽车性能开发、实验室解决方案、以及新感知技术领域值得信任的合作伙伴。
声学语音算法工程师
负责声学语音算法开发,对语音、声学、心理声学等方向较深的认识,包括但不限于噪声抑制、统计分析、音频增强算法、阵列信号处理等;
声学语音算法技术的研究,杜比/3D音效算法、音效增强、定向发声、主动降噪(ANC/RNC)算法和模拟声浪算法的技术研究和开发;针对具体需求进行实车算法调优、性能测试与评估;
编写算法文档,完成相关算法的工程化实现、调优与测试
硕士及以上学历,计算机/自动化/通信/电子工程等相关专业。博士优先; 具有声学、语音、阵列信号等方面的信号处理算法基础,有相关的研究和开发经验。 有一定DSP (高通Adsp/ADI Sharc DSP 等)经验加分,对音响系统特性(扬声器,功放,系统化建设)等领域有一定的认知能力。 掌握C/C++,python等代码开发工具,有机器学习和深度学习基础。
简历投递
深圳方位通讯科技有限公司(方位通讯)是全球领先的专业物联网音视频(A&V-IoT)产品提供商、国家级高新技术企业,拥有北京、深圳、苏州三个研发基地。方位通讯专注物联网通讯技术与终端研发,经过近二十年的沉淀积累,打造SIP对讲、SIP门禁&室内机、物联网网关与SIP桌面终端四大产品系列,在行业内率先倡导运用标准化网络通信协议和开放音视频技术共建音视频物联网(A&V-IoT),推动业务创新,提升运营效率,助力各行业数字化转型。
语音算法工程师
统招本科、硕士学历;计算机,通信,电子等相关专业; 精通C、C++、python编程,有良好的软件开发能力; 熟悉音视频编解码相关的原理; 具有良好的沟通能力和团队合作精神,责任心强,自驱力强,有一定的承压能力; 优秀应届毕业生可以考虑。
负责ARM Linux及Android平台产品音视频模块设计、开发;
负责语音降噪深度学习算法研究、算法优化、部署;
负责语音合成、语音识别的算法研究、部署;
负责音频处理算法的研究与优化,如 VAD,AGC,DRC,AEC,EQ等;
职位福利:五险一金、年底双薪、定期体检、节日福利、带薪年假、周末双休、加班补助
简历投递
黑芝麻智能科技致力于成为全球嵌入式智能驾驶计算平台的共创者,用“芯”赋能未来出行。公司于2016年设立,在硅谷、新加坡、上海,全球员工近700人,创始团队大多毕业于清华大学,有超过20年在图像处理、视觉算法、核心IP研发、芯片设计和车规级产品开发与应用方面的经验。
AI算法工程师
从事手机图像和视频处理核心算法的研发,跟踪该领域的最新技术,定期做该领域的前沿学术报告;
从事车路、车舱应用场景下图像和视频处理核心算法的研发,跟踪该领域的最新技术,定期做该领域的前沿学术报告;
设计能够解决应用需求的具体算法,根据项目需求完成算法的设计、验证。
深度学习、计算机视觉、图像处理、机器学习相关专业,硕士及以上学历;
具备良好的数学理论基础,在深度学习方向具有扎实的理论和实践基础,保持对领域最前沿技术的追踪;
了解常见的深度学习算法,如CNN、RNN、LSTM等;
深入掌握至少一种常见的视觉问题的工作pipeline,如2D,3D目标检测,语义分割,人脸识别,图像分类等。包括数据准备,训练迭代,corner case迭代;
熟练掌握至少一种常见的深度学习框架,如pytorch,tensorflow、熟练掌握C/C++, Python中的一种或多种语言,熟悉Linux/Unix开发环境;
英文熟练,有良好的英语阅读能力;
具有较强的责任心,事业心,进取心,良好的沟通和团队合作能力。
具有以下任意一项算法相关的项目经验者优先录取:
具有人脸检测、landmark检测、人脸属性识别、手势识别等项目经验;
具有人脸识别、指纹识别、活体检测等项目经验;
具有国内国际视觉,语音,语言处理等大赛经验及获取名次。
简历投递
深圳市康冠科技股份有限公司创立于 1995 年,致力于成为全球优秀的平板显示产品专 业制造商,着眼于全方位的智能终端显示整体解决方案,成功布局家庭、教育、商用、医疗 等智能显示行业,产品涵盖 TV、电子白板、电子拼接墙、显示器、一体机、数字标牌、工 业监视器等平板显示产品。
音频算法工程师
熟练使用C/C++/Python,精通信号处理与语音处理技术;
熟悉音频前处理算法如回声消除、语音增强、麦阵处理开发者优先; 熟悉至少一种AI芯片部署方案,如:Rockchip/MTK等; 能力优秀者薪资可再议。
简历投递
第四范式(北京)技术有限公司成立于2014年底,是人工智能平台与技术服务提供商,公司以“Empower AI Transformation and Advance AI For Everyone”为企业使命,旨在让AI成为驱动社会进步、企业增长的引擎。依托于国际领先的机器学习技术与丰富的行业实践经验,第四范式打造了全栈式企业级AI产品体系——全流程人工智能平台、一站式流量运营技术平台,以及软件定义算力平台。
语音识别算法工程师
负责语音方向的设计和研发,模型的效果优化,包括不限于:参与语音识别、声纹识别、语音评测、语音合成等方向 将语音领域的算法应用于实际场景,解决真实业务问题 将实践中的创新点以Github Repo/Paper/Tech Report等形式开源
本科及以上学历,具备语音识别、声纹识别、语音评测、语音合成等方向相关经历 具备良好的编程能力,熟练掌握python/C++等编程语言,优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情 较强的算法实现能力,熟悉深度学习平台如tensorflow/pytorch等
有较强的代码能力优先,有各类竞赛获奖经历(如kaggle,天池、DF、DC等比赛平台)、有过ACM等编程竞赛经历,或代码开源在github上并有较大影响 在Interspeech/ICASSP/ACL/EMNLP/ NAACL等顶会顶级会议或者期刊发表论文者 在大模型多模态领域有相关技术经验或竞赛经验
简历投递
Amp’ed RF安普德2003年创立于美国硅谷,并于2009年12月在中国天津滨海高新区华苑产业园注册成立,依托两地优势,我们聚集众多无线射频芯片和无线物联技术的高端人才,潜心研究、锐意进取,现已逐步成为国内外同行业中同时可提供无线射频芯片、无线通信软件协议栈、组网技术等软硬件相结合的高端产品和专业解决方案企业中的翘楚。
语音识别/合成算法工程师
开发和优化语音识别模型和语言模型,提升算法性能与稳定性;
开发和优化语音合成算法;
阅读文献,复现当前最新语音识别技术。
本科及以上学历,计算机、电子、数学等相关专业; 3年以上相关工作经验,扎实的数学基础,了解深度学习,信号处理基础知识,有语音识别项目经验者优先; 具有Matlab、python,或C/C++项目开发经验; 具有神经网络项目开发经验者优先。
简历投递
永久福利 直投简历
简历投递:join@speechhome.com