招聘 | 大模型评测方向实习生招聘

文摘   2025-01-09 14:26   天津  


实验室主页:https://tjunlp-lab.github.io/

实验室公众号:TJUNLP




研究方向




1. 评测基准构建研究:探索大模型评测任务的科学性和通用性,设计标准化的测试体系,为大模型性能对比提供可靠依据。

2. 评测方法研究:深入研究大模型性能评估的前沿方法,优化评测流程,提升评测结果的准确性与效率。

3. Science of Evals研究 :探讨评测背后的科学原理和方法论,揭示评测过程的机制与改进方向,推动评测理论发展。

4. 高效评测方法研究:研究如何利用最少的资源和时间完成高质量的大模型评测,解决评测资源瓶颈问题。

5. 评测标准制定:协助各类大模型评测标准的撰写与编制,深度参与评测指标体系和规范文件的设计。

6. 大模型评测平台开发:

    前端开发:负责评测平台用户界面设计与实现,包括页面布局、交互效果、响应式设计等;

    后端开发:负责平台核心功能的实现,包括接口开发、数据存储与管理、评测任务调度等。




实习要求




1. 勇于探索新知识、新技术,对大模型技术有浓厚兴趣;

2. 熟悉Python,具备一定的数据处理和分析能力;

3.前端方向:熟悉HTML、JavaScript、CSS,具备基础开发能力,有小程序开发经验者优先;

4. 后端方向:熟悉Spring Boot、MyBatis、Redis等框架,有项目经验者优先;

5. 能长期线下参与者优先(半年以上)。




预期收获




1. 参与创新性研发项目,提升技术视野与工程实践能力;

2. 获得与大模型企业接触和沟通的机会,全面了解行业大模型评测最新技术;

3. 参与发表大模型评测相关顶会论文与开发前沿开源项目;

4. 提供实验室的实习证明导师推荐机会。

/ 关于我们/

天津大学自然语言处理实验室在熊德意教授的带领下,开展大语言模型、机器翻译、AI对齐、AI for Science等方向的研究,建立了省部级科技创新合作平台,承担了国家重点研发计划等多项重要研究项目。实验室具备AI大模型全栈研发能力,覆盖数据采集与处理、基座模型训练、AI对齐、模型评测及应用部署大模型全生命周期,已自主研制中文大模型仁文伏羲、多语言大语言模型FuxiTranyu(覆盖40+语种并实现基座及对齐模型全开源)及DNA大模型。实验室围绕大模型安全、对齐及评测,积累了深厚的大模型安全可控技术,发布了数百页的大模型安全、对齐与评测全面报告,构建了大模型评测平台OpenEval及多个大模型安全评测基准,联合发布了大模型基准测试白皮书。实验室致力于为AI大模型构筑全面和多维度安全可控体系,助推AI大模型能力与安全协同发展!

报名方式

请有意者将个人简历及相关资料发送至tjunlp@163.com,邮件标题注明“大模型评测方向实习生应聘 - [姓名] ”。


TJUNLP
天津大学自然语言处理实验室
 最新文章