Yuntian Deng教授于2024年8月加入Cheriton计算机科学学院,担任助理教授。在来到滑铁卢大学之前,他是非营利性研究机构艾伦人工智能研究所(AI2)的博士后研究员,该研究所致力于开展高影响力的人工智能研究和工程,服务于公共利益。
Deng教授拥有哈佛大学计算机科学博士学位、卡内基梅隆大学语言技术硕士学位以及清华大学工程学士学位。他的研究重点是推进自然语言处理(NLP)和机器学习领域的发展。
他曾获得多项奖学金和奖项,包括NVIDIA奖学金、百度奖学金、芝加哥大学数据科学新星、ACL 2017最佳演示论文亚军、ACM戈登·贝尔COVID-19研究特别奖、阿贡国家实验室影响力奖以及DAC 2020最佳论文奖。截至2024年10月,他的研究论文在Google Scholar上的引用次数已超过5100次,h指数为19。
以下是与Deng教授的对话摘录,他讨论了他的研究、对有志成为计算机科学家的学生们的建议,以及他对加入Cheriton计算机科学学院的兴奋之情。
请介绍一下你的研究。你认为你最重大的贡献是什么?
我致力于语言模型的研究,这是像ChatGPT这样的聊天机器人的底层技术。
我最近的一项项目是WildChat,我们构建了一个聊天机器人,为用户提供免费访问ChatGPT的机会,以换取他们同意发布他们的数据。我们收集了超过一百万次聊天机器人对话——实际是用户与ChatGPT的对话——让研究人员能够研究现实世界的互动并识别错误和模型限制。
我的另一项研究称为“隐式思维链推理”,它教会语言模型通过内化推理过程来推理复杂问题。这可以与人类学习相比较。例如,当婴儿学习走路时,他们专注于单个肌肉运动,但随着时间的推移,这个过程变得内化和无意识,使他们能够在此基础上学习更复杂的任务,如跳舞。同样,我们已经证明,较小的语言模型可以通过内化这些推理过程直接预测结果——例如解决20位乘20位的乘法——而不依赖于中间步骤。
你认为自然语言处理和机器学习中有哪些挑战最令人兴奋?
我认为最令人兴奋的挑战之一是找出如何教会语言模型以不同于人类的方式推理和沟通。由于它们的架构与我们的大脑根本不同,它们解决问题和相互沟通的最佳方式可能与我们的方式不同。例如,虽然人类需要逐步推理复杂任务,但语言模型有时可以完全内化这些步骤,正如我在隐式思维链工作中所看到的。挑战在于发现最佳的教学方法,而我们自己并不知道最佳方法。
希望是利用语言模型的潜力,通过教会它们以最有效的方式推理,这很可能与人类的推理方式不同。
你会给有兴趣从事你研究领域的学生什么建议?
我建议学生在承诺攻读NLP博士项目之前获得一些研究经验。NLP研究领域正在迅速发展,简单、可扩展的方法往往比复杂、手工设计系统更具影响力。相当一部分进展来自系统工程努力,通常由大型协作团队推动。
在承诺攻读博士学位之前,我建议学生通过加入实验室或复制他们喜欢的论文来探索当今从事NLP研究的感觉,并只有在他们发现自己对研究充满热情并愿意在最有生产力的年份投入其中时才做出承诺。
你认为在Cheriton计算机科学学院有机会进行合作研究吗?
绝对有。滑铁卢大学的计算机科学系很大,有许多不同领域的专家。我已经与软件工程专家Nie Pengyu教授合作开展了一个与编码相关的项目。软件工程是测试语言模型推理能力的潜在应用。随着我逐渐了解其他同事,我看到了更多的合作机会。
加入Cheriton计算机科学学院最让你兴奋的是什么?
我最兴奋的是加入一个有如此多专家进行有影响力工作的部门。与他们成为同事是一种荣誉。
谁在你的职业生涯中激励了你?
我的博士生导师,Alexander(Sasha)Rush教授激励我追求学术生涯。我非常享受博士生活,我希望成为像他一样的导师。我的共同导师Stuart Shieber教授也有很大影响,教会我以长远的视角思考并考虑长远来看重要的事情。我的博士后导师Yejin Choi教授的职业生涯和毅力也激励了我,展示了如何追求最初未被重视的研究领域最终可以导致有影响力、广泛接受的研究。
他们鼓励我将这种精神传承下去,现在我努力以同样的奉献精神和指导支持我的学生。
你在业余时间做什么?
我过去喜欢在业余时间游泳、徒步、滑雪、阅读和自驾游。但自从成为父母后,我的大部分业余时间现在都花在和儿子一起享受活动上。
Deng教授的加入为Cheriton计算机科学学院带来了新的活力和视角,他的研究和教学无疑将对学院乃至整个NLP和机器学习领域产生深远影响。我们期待Deng教授在未来的学术旅程中取得更多成就。
公众号:研真清,开篇新的版块,邀请访谈学界各领域的教授,科学家,全面的介绍自己的背景,学术,未来,学生,喜好.......扩大知名度和影响力,让更多的潜在学生和学界同行了解,欢迎有意的老师投稿,预约访谈,有意的老师可以邮件:xingguocheng@realresearch.cn或加微信联系: