下面是本周VJoinU的招聘简讯合集,希望小伙伴们都能找到心仪的岗位。
蚂蚁集团天筭实验室,专注于人工智能、机器学习、数据安全等领域的研究与应用。在AIGC(人工智能生成内容)时代背景下,我们致力于开发领先的音频检测技术,以保护数字媒体内容的真实性和信任度。为了加强我们的研发团队,我们现在寻找富有才华的实习生,共同应对日益复杂的音频安全挑战。
AIGC音频检测实习生
参与设计和实现先进的音频防伪检测算法。
基于声纹识别,语音合成或预训练大模型,实施和优化创新的防伪算法。
产出学术论文及专利。
参加声音防伪攻击相关国内外竞赛。
预计在2025年11/30或之后毕业,目前正在攻读计算机科学、人工智能、声学工程或相关专业的硕士或博士学位。
在国际高水平期刊或会议上发表过关于音频处理、声纹识别或相关领域的学术论文。
拥有语音或与预训练大模型相关的研发经验优先。
具备中等偏上的编程能力,熟练使用Python或其他编程语言,并有使用机器学习库(如TensorFlow、PyTorch)的经验。
可以至少连续实习4个月,有能力独立完成项目并解决复杂问题。
对音频安全领域有浓厚兴趣,具备出色的分析和解决问题的能力,能够独立工作。
具有卓越的逻辑思维能力、沟通能力和团队协作精神。
简历投递
慧言科技(天津)有限公司是一家业内领先的言语交互高新技术企业。公司基于自主可控“海河·谛听”言语交互意图理解大模型,研发语音识别、语音生成、语义理解、文本生成、知识问答、机器翻译、声纹识别等全链路言语交互技术,支持中英日韩法西俄德维藏泰越等20余个语种,言语交互技术达到国内领先。同时,公司为合作伙伴提供大模型+教育、大模型+办公、大模型+金融等多行业综合解决方案。
算法工程师
能够根据上级主管交代的需求进行相关语音算法的研发;
能够按照论文思路对论文中所提出的框架进行复现;
本科及以上学历,具有良好的编程能力,熟悉并熟练使用python以及pytorch框架; 熟悉linux开发环境; 具备一定的深度学习基础,有深度学习/机器学习/自然语言处理专业背景和经验者优先;
简历投递
云上曲率LiveData(北京云上曲率科技有限公司),泛娱乐行业全球领先的实时通信、AI+大数据服务提供商。自主研发基于微服务的高性能分布式框架和深度学习平台。服务覆盖全球200多个国家和地区。核心成员来自谷歌/腾讯/Facebook等核心团队,拥有15年以上专业经验。云上曲率深耕泛娱乐领域,同时在在线教育、工业控制、IoT、智慧城市等行业领域具备较大产品技术优势。
语音算法工程师
负责语音、音频相关算法的研究与开发,包括但不限于语音识别、语音合成、语音降噪、声纹识别、音频分类等方向; 负责跟进行业前沿技术,跟踪国际最新发展方向,持续探索语音技术新能力和新应用。
硕士及以上学历,语音、信号处理、计算机等相关专业背景; 1~2年语音方向工作经验,精通深度学习理论,精通语音相关算法; 熟练掌握C/C++、python,有较强的工程实现能力; 有多模态、音频大模型技术研发经验者优先。
简历投递
北银金融科技有限责任公司根植于北京银行,是一家致力于大数据、人工智能、云计算、区块链、物联网等新技术创新与金融科技应用的科技企业,公司充分发挥北京银行企业文化和技术积淀先天优势,通过对技术、场景、生态的完美融合,输出科技创新产品和技术服务。
语音算法工程师
负责语音识别、声纹识别、情感识别相关算法研究; 参与识别算法设计与实现,以及结合业务进行模型优化工作; 参与语音克隆产品研发,融合不同音色、情感等进行优化工作; 跟踪国际最新的识别、合成相关技术和前沿技术的发展。
1.熟悉Linux操作系统,精通python等脚本,熟悉ASR和TTS; 2.熟悉常用的语音模型及框架:wenet、funasr、espnet、kaldi等,有语音识别、语音合成项目实践经验者优先; 3.具备优秀的逻辑思维能力,较强的沟通和学习能力; 4.在相关国际会议或主流期刊(ICASSP、Interspeech、ACL、ICML等)上发表论文者优先。
简历投递
普强于2009年在美国硅谷成立全球研发中心,主要从事智能语音和语言技术的研究,2010年设立中国运营公司,是金融科技创新和智能汽车AI服务提供商,在硅谷和中关村、上海,深圳均建设有技术研发中心,在南京拥有声学实验室,专注于金融大数据、AI芯片,智能汽车领域,拥有100%自主知识产权60余项,并参与制定多个国家及行业标准,普强始终致力于为客户提供完整的AI技术咨询和解决方案服务。
语音算法工程师
1.负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等; 2.参与语音识别算法的研发,提高识别准确率和识别速度; 3.负责语音合成算法的开发,优化语音生成的音质和流畅度; 4.跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持; 5.与其他部门紧密合作,确保语音算法在公司产品中的有效应用; 6.编写相关技术文档,包括算法设计文档、测试报告、使用说明等; 7.完成领导交办的其他任务。
1.计算机科学、电子工程、信号处理或相关专业本科及以上学历,具有扎实的数学基础和编程能力; 2.熟悉语音信号处理、语音识别、语音合成等基本原理和算法; 3.熟练掌握C/C++、Python等编程语言,熟悉Linux操作系统和常用开发工具; 4.了解常用的语音算法库和工具,如Kaldi、Sphinx、HTK等; 5.具备良好的分析问题和解决问题的能力,对解决具有挑战性问题充满激情; 6.具备良好的团队合作精神和沟通能力,能够与其他部门有效协作; 7.有语音识别、语音合成等相关项目经验者优先
简历投递
第四范式(北京)技术有限公司成立于2014年底,是人工智能平台与技术服务提供商,公司以“Empower AI Transformation and Advance AI For Everyone”为企业使命,旨在让AI成为驱动社会进步、企业增长的引擎。依托于国际领先的机器学习技术与丰富的行业实践经验,第四范式打造了全栈式企业级AI产品体系——全流程人工智能平台、一站式流量运营技术平台,以及软件定义算力平台。
语音识别算法工程师
负责语音方向的设计和研发,模型的效果优化,包括不限于:参与语音识别、声纹识别、语音评测、语音合成等方向 将语音领域的算法应用于实际场景,解决真实业务问题 将实践中的创新点以Github Repo/Paper/Tech Report等形式开源
本科及以上学历,具备语音识别、声纹识别、语音评测、语音合成等方向相关经历; 具备良好的编程能力,熟练掌握python/C++等编程语言,优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情; 较强的算法实现能力,熟悉深度学习平台如tensorflow/pytorch等。
有较强的代码能力优先,有各类竞赛获奖经历(如kaggle,天池、DF、DC等比赛平台)、有过ACM等编程竞赛经历,或代码开源在github上并有较大影响; 在Interspeech/ICASSP/ACL/EMNLP/ NAACL等顶会顶级会议或者期刊发表论文者; 在大模型多模态领域有相关技术经验或竞赛经验。
简历投递
Akulaku是东南亚市场交易量较大,用户活跃度较高,团队成熟和发展速度较快的互联网金融平台。目前已覆盖印度尼西亚、菲律宾、越南等市场,致力于提供更本地化的产品服务。
算法实习生
参与OCR,活体检测,人脸识别,语音识别,音频质检等算法开发
25届应届生,计算机,软件工程,应用数学等相关专业;每周可实习至少3天
熟悉机器学习,图像处理,信号处理,深度学习等理论;
熟悉Linux;
熟悉python或c++;
熟悉tensorflow或pytorch;
简历投递
中科智加是中科院自动化所旗下技术产业化公司,致力于用AI技术为行业赋能,为客户提供以语音识别、机器翻译、自然语言理解、知识图谱、图像视频智能处理等技术为核心的应用产品与解决方案,相关服务案例覆盖国内30余地市。
语音识别工程师
参与公司核心语音识别系统的研发。
针对实际场景制定实现要求的模型、策略、算法方案、进行模型选择、训练、设计、开发及调试。
跟踪国内外行业最新动态,结合公司业务,迭代产品。
计算机及相关专业硕士及以上学历,信息与计算科学、数据、自然语言处理(NLP)、深度学习、机器学习等相关专业。
有1年以上语音项目工作经验。
熟练使用Python、c/c++和shell等编程语言,熟练使用dokcer服务。
熟练掌握linux开发环境。
熟悉主流ASR系统框架,理解声学模型/语言模型主流先进的建模方法,在模型训练和优化方面富有业务经验。
熟练使用常见的语音及深度学习开源工具,包括但不限于kaldi、PyTorch、Tensorflow等。
对最新语音模型如paraformer,whisper等有深入研究。
有模型国产化移植、模型压缩、量化、加速经验者优先。
简历投递
华院由美国加州大学伯克利分校数学博士创立,成立于 2002 年,公司专注于数据智能研究。团队以基础算法研究和通用人工智能引擎开发为核心,从计算智能、感知智能,到认知智能,一直在人工智能算法研究领域处于行业前茅,产品与技术广泛应用于金融保险、医疗健康、电商零售、智能制造、社会治理、政务、教育与人力资源等行业及领域。
语音合成工程师
负责语音合成(TTS)的算法研发、性能优化与落地实现;
负责围绕虚拟人高度情感可感知的语音合成技术的研究;
跟进学术界、行业最新的研究趋势,将预研成果落地于实际产品。
统招硕士及以上学历,计算机、电子信息、自动化等相关专业,两年以上语音合成的算法研究、项目开发经验;
深刻理解TTS原理,熟悉开源架构声学模型Tacotron和声码器WaveGlow、WaveRNN、HifiGAN等;
对TTS前端Cleanser、TN、G2P有一定经验;
熟练掌握Python,至少熟练使用一种深度学习训练框架,如Tensorflow、Pytorch等;
在个性化技术、风格迁移、语音转换、情感合成等方面有经验者优先;
在语音相关会议或期刊(如ICASSP、Interspeech、ISCSL、ASRU等)发表过文章或者参加过相关国际比赛者优先。
简历投递
北京中科信利技术有限公司于2002年依托中国科学院声学研究所合作成立,是以开发语音技术为核心的高新技术公司。公司专注于语音识别和音频信号处理相关技术和产品的研发,具有国际一流水平的语音识别/处理引擎、语音云系统和语音分析应用产品,产品涵盖互联网、电信平台、广电网教育、音乐检索以及嵌入式终端等多个领域。
语音识别算法工程师
语音领域人工智能算法和模型的研发和优化,方向包括前端语音处理,语音识别,说话人、语种识别;
负责系统的数据处理、模型训练、结果分析、实验验证; 跟踪国内外最新的相关技术。
硕士或博士学历,计算机、电子、自动化、应用数学、模式识别、人工智能等相关专业
熟悉机器学习及深度学习基本原理和基本模型,熟练使用至少一种深度学习框架;(Kaldi、TensorFlow、Caffe等) ;
在深度学习、机器学习等人工智能领域有一定的实际经验,具备扎实的模式识别、语音信号处理等理论和知识基础,擅于跟踪和学习最前沿人工智能技术;
良好的编程基础, 掌握常用数据结构、算法,具备大数据/分布式机器学习技能优先。
简历投递
永久福利 直投简历
简历投递:join@speechhome.com