实验室介绍
清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP) 是国内开展自然语言处理研究最早、深具影响力的科研单位,也是国内开展大模型研究最早的团队。团队依托国家实验室平台及孵化企业承担了国家重点研发项目、国家社会科学基金重大项目等多项重要研究任务,并与腾讯、华为、搜狗等企业建立密切的学术合作关系。
团队2021年发起创建的开源社区OpenBMB已成为国内领先大模型研发与应用开源社区,开源23个项目,GitHub星标4w+。发布了多个行业内领先的基础大模型,研发了面向大模型训练、微调、压缩、评测、对齐、智能体等技术工具套件,相关研究成果获 ACL2022最佳展示论文奖、入选Nature Machine Intelligence封面论文。开发的ToolLLM、ChatDev、AgentVerse、XAgent等智能体开源工具成为领域的代表性工具。
清华NLP实验室现依托清华实验室平台、国家实验室平台、孵化企业招募大量工程、研究岗位。如果你对大模型前沿技术充满好奇心,对推进技术落地满怀热情,希望投身到AGI实现的事业中来,欢迎加入我们!我们将提供具有竞争力的薪酬和福利,良好的工作环境和发展机会,以及多平台联动的广阔空间。
➤ 更多信息参见实验室主页
🔗 http://nlp.csai.tsinghua.edu.cn/
法律智能方向介绍
法律智能(Legal AI)是在自然语言处理(NLP)中具有强烈现实应用需求的研究领域之一。法律系统中的成员(如法官、律师)需要处理和解读大量文本,这些文本通常具有高度的专业性和规范性,且内含复杂的逻辑推理过程。法律智能致力于提高法律系统的运行效率,并为公众提供可靠、高效、低成本的法律服务。然而,法律文本的复杂性以及对法律服务可靠性的高要求,为法律智能研究带来了巨大的技术和伦理挑战,导致其在现实场景中很少得到大规模应用。随着大模型技术的发展,我们希望进一步推进法律智能的研究,以满足现实应用的需求。
1. 对不同法律场景进行理论模型的构建:通过深入理解不同法律过程(如庭审、谈判)中的关键要素和逻辑关系,建立能够模拟真实法律情景的理论框架。
2. 利用多智能体系统对法律过程进行模拟与建模:利用多智能体系统模拟不同法律角色(如法官、律师)的互动和决策过程,从而对法律过程这一复杂系统行为进行建模。
研究成果
研究成果1——Lawformer: A pre-trained language model for Chinese legal long documents
国内最早的法律领域预训练语言模型之一,在 HuggingFace 上获得大量下载,论文获全国社会媒体处理大会最佳论文奖。
➤ 论文链接
🔗 https://www.sciencedirect.com/science/article/pii/S2666651021000176
➤ 模型链接
🔗 https://huggingface.co/thunlp/Lawformer
研究成果2——How does NLP benefit legal system: A summary of legal artificial intelligence
➤ 论文链接
🔗 https://aclanthology.org/2020.acl-main.466/
博士后岗位要求及薪资待遇
➤ 岗位要求
已获得博士学位(授予时间在3年内)或应届博士毕业生(已满足学位论文答辩要求),年龄在35周岁以下(不含),全职从事博士后工作;
以第一作者在人工智能、自然语言处理等领域发表过1篇以上的高水平论文;
思维活跃、勇于创新,具有强烈的技术创新和研发热情;
责任心强、工作勤奋,有良好的团队意识与合作精神;
有大模型训练和推理经验,或法律智能相关研究经验者优先;
有计算机、法律、数学、语言学背景优先。
薪资、保险等按照国家和清华大学博士后管理办法执行; 可申请清华博士后公寓或享受住房补贴; 解决子女入园、入学; 推荐申请各类博士后支持计划,包括博士后科学基金项目、博士后创新人才支持计划、博士后国(境)外交流项目等。具体信息请查询清华大学博士后官网:http://postdoctor.tsinghua.edu.cn/ 优异者可推荐申请清华大学“水木学者”计划,学校为水木学者提供优渥的薪酬待遇:校发年薪 30 万元(税前);提供周转公寓,如个人放弃租住学校周转公寓,提供租房补贴 4.2 万元/年;由教师发展中心提供职业发展培训,“水木学者”可参加清华大学新教师导引计划。
➤ 博后申请方式
本通知长期有效,请发送邮件至邮箱:thunlp@163.com,标题为“申请(意向导师姓名)博士后/研究员-姓名-学校”,在邮件中说明意向导师及感兴趣的研究方向并附简历。
实习生招聘
➤ 基本要求
能长期参与实验室相关科研工作(6个月以上);
计算机、法律、数学、语言学相关专业本科生或研究生;
具有强烈的技术创新和研发热情、善于沟通、工作勤奋、责任心强、勇于创新;
能够线下参与者优先,有较强编程能力者优先,有自然语言处理或预训练模型等相关研究经验者优先。
融入与优秀导师、博士后、博士联合指导的研究环境;
参与大模型前沿研究与应用;
获得共研并发表顶尖论文的机会;
优秀者可推荐攻读硕博学位或一线企业工作机会。
➤ 实习生申请方式
扫描下方二维码填写申请表单。
➤ 招聘官网链接
🔗 https://nlp.csai.tsinghua.edu.cn/join_us/research_direction/?post=research_direction
关于我们
清华大学自然语言处理与社会人文计算实验室(TsinghuaNLP)成立于 20 世纪七十年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位,也是中国中文信息学会计算语言学专业委员会及中国人工智能学会因果与不确定性人工智能专业委员会的挂靠单位。实验室在学术总体带头人孙茂松教授及学术方向带头人刘洋教授、刘知远副教授的带领下,围绕以中文为核心的自然语言处理,在语言大模型、跨模态大模型、中文信息处理、机器翻译、知识图谱、智慧教育、社会人文和艺术计算等方面开展系统深入的研究,在国内外具有较大的学术影响。近年来,实验室承担了国家 973 项目、国家重点研发项目、国家社会科学基金重大项目等多项重要研究任务,并与腾讯、华为、搜狗等企业建立密切的学术合作关系。
Website:http://nlp.csai.tsinghua.edu.cn/
Email:thunlp@163.com
GitHub:https://github.com/thunlp
https://github.com/OpenBMB
Twitter:https://twitter.com/TsinghuaNLP
THUNLP 长期开放招聘