1. 负责设计具有强大语言理解和生成能力的大规模语言模型的整体架构,包括确定模型的层数、参数数量和连接方式等;
2. 熟悉并应用各种神经网络模型、注意力机制、序列建模和语言表示学习等技术;
3. 使用tensorflow、pytorch等主流深度学习框架进行模型训练,调整超参数,监控训练进度,并解决梯度消失或爆炸等问题;
4. 精通自然语言处理技术、机器学习与深度学习算法、具备大数据分析与处理能力;
5. 进行模型微调、网络剪枝、量化等优化技术的应用,以提高模型的性能和效率;
1. 构建和训练具有高准确率和低延迟的大型语言模型;
2. 能够处理和分析大规模数据集;
3. 能够实现模型的持续优化和迭代。
1. 海外博士学历,计算机科学、数学、统计或相关专业,在人工智能、机器学习等领域有深入研究优先。
2. 精通深度学习、自然语言处理等相关技术,熟悉tensorflow、pytorch等主流深度学习框架和工具。
3. 具有2年以上人工智能、机器学习或相关领域的工作经验,具备良好的编程能力,熟练掌握Python等编程语言。
4. 具备良好的沟通能力和团队合作精神,能够与不同领域的专家紧密合作,有成功设计、开发和优化大规模预训练语言模型的经验者优先。
海外高端人才要求:
1. 创新人才一般应当取得博士学位,在国际知名企业担 任高级职务,或者在国外著名高校、科研机构担任相当于副教授及以上职务、具有较高科研水平和较强科技创新能力的专业技术人才和经营管理人才。
2. 青年人才应当具有博士学位,年龄不超过40周岁(出生日期1983年1月1日以后),从事自然科学、工程技术、管理创新等领域的工作;取得博士学位后在海外知名高校、科研机 构、企业及其研发机构具有正式职位,连续工作36个月以上。在海外取得博士学位的,可适当放宽工作年限要求。
3.申报人尚未回国(来华)工作,或者2022年1 月 1 日后回国(来华)工作。引进后须辞去海外工作或在海外无工作,并全职回国(来华)工作不少于3年。
如果您对岗位感兴趣
请联系👇
赵经理