参与言语工程的语料库制作,包括不限于语音合成、语音识别、自然语言处理/理解三个方向。
具体工作将专注于语言研发,主要是标注标准制定与优化迭代、人员培训,包括数据标注内容和标准、算法效果评测维度和标准等,并根据业务需要会进行数据生产项目管理,以及进行少量、必要的数据标注和质检工作。
学习了解业务流程,与产品、算法、工程、测试、标注等团队密切沟通配合,完成业务目标。
学习了解言语工程算法各模块,与算法工程师一起对各模块效果进行优化。其他与业务相关的工作。
必须:印尼语、俄语、阿拉伯语专业,硕士及以上。
优先:应用语言学专业、语言与言语信息处理专业等,有系统学习过 计算语言学 或 实验语音学 或 语料库语言学等方向课程,理论语言学基础扎实过硬,对应用语言学知识到工业界有强烈的兴趣
优先:有工业界语音合成、语音识别、自然语言处理相关数据生产、模型评测经验
优先:熟悉语音合成、语音识别、对话系统相关算法者优先
优先:熟练python进行文本处理、正则表达式编写、音频处理者优先
优先:熟练使用praat进行音频分析、标注、编写praat脚本者优先
优先:熟悉pytorch或者TensorFlow等深度学习框架者优先
必须:认同“Together we can”,具有良好的沟通表达能力、团队协作能力,工作态度认真负责
点击阅读原文可在线投递简历哦~
我们有英/阿/俄/日/韩等各语种微信交流群,每天会将精选的优质岗位推送到群内,欢迎加微信wei2292439301(注明:语种+昵称),分享到朋友圈 可以免费入群