2024年9月20-22日,全国知识图谱与语义计算大会暨知识图谱国际联合会议(CCKS-IJCKG2024)在重庆召开。
国际语义网(Semantic Web)之父James Hendler作为大会特邀嘉宾,做大会报告“知识图谱的未来发展:语义网愿景的再定位”。
James Hendler是中国语义网学术界的老朋友,多次来访中国;我(鲍捷)曾经在美国与James Hendler工作过三年,本文是我回忆与James Hendler结识并一起工作学习的经历。
从美国回国后,我一直从事语义网和知识图谱相关研发工作,这次CCKS-IJCKG2024大会上我也将带来论坛报告“大模型和知识图谱在航空领域的应用”。
初识 Jim
我在2008年的2月成为James Hendler(以下简称Jim)教授的博士后,之后和他一起工作了三年。在这之前,我和他见过几次面。
我头两次见Jim的时候,还在Iowa State University(ISU,艾奥瓦州立大学),2003年和2004年。他当时是University of Maryland at College Park(UMCP,马里兰大学)的教授,来ISU做一个跨校交流。我还请教了他一个问题,他说话很官方,我不太听得懂他的意思。那时候我刚开始做语义网(Semantic Web)的研究,Jim被大家认为是语义网之父,能和领域创始人见面还是很高兴的。
第三次见面是2006年秋天在北京,我们都来参加第一届ASWC(亚洲语义网会议)。我得了这次会议的最佳论文,关于模块化本体的语义。这次会上没有深入交流,可能他就知道了有我这个人在做他也感兴趣的、还挺难的研究吧。
第四次见面是2007年夏天在温哥华,参加AAAI(国际人工智能会议)。我那时候汇报博士论文的内容,关于描述逻辑的分布式推理,和Jim的一个学生的工作很相关。我看到Jim,就请他来看看我的工作。他又说了很长一段,说得不快,咬字清楚,词我都听得懂,连起来句子啥意思我基本没明白——这也是后来我听他说话的基本范式,就是话的逻辑结构复杂,听到后半句前半句已经忘了。总之,我当时的那个研究,还是很有理论深度的,应该给Jim留下了更深的印象。
2007年冬天,我鼓足勇气给Jim写信,问他愿意不愿意接受我做博士后,他回信说“Your timing is very good”。过了两个月,我就离开了白雪皑皑的Iowa,走向了白雪皑皑的纽约上州。
Jim在2006年离开马里兰大学,去了Rensselaer Polytechnic Institute(RPI,伦斯勒理工学院),在纽约州府 Albany 附近的小城Troy(特洛伊),我和Jim 的头两年是在RPI度过的。最后一年多他推荐我去了MIT跟Tim Berners-Lee(Web发明人,2016年图灵奖得主)学习,不过我的行政关系还是保留在RPI。
作为大宗师的Jim
从师承上,Jim的导师是布朗大学的Eugene Charniak,Charniak的导师是人工智能创始人Marvin Minsky。Minksky 研究agent和无数其他领域,Charniak研究统计语言处理,Jim博士期间的工作在规划理论(Planning)。我认识Jim的那几年,他在研究描述逻辑(Description Logic)和语义网。2001年他在《科学美国人》与Tim Berners-Lee 和 Ora Lassila 发的那篇文章“The Semantic Web”,被公认是领域的奠基之作。
和Jim学习的这几年,也是对我思想塑造的年份。他并没有专门和我说过什么大道理,但是通过一系列具体的事,告诉了我世界第一流的研究应该是什么样子,以及,作为一位学者,你应该建立什么样的价值观和世界观,你要用什么角度去判断,什么是对的、什么是错的。这些价值观和世界观,不但影响了我个人的成长,也在后来文因互联企业的发展中,留下了深深的烙印。
Jim确实是一位大宗师。所谓大宗师,就是在学术这棵大树上,他长出来的绝对不是几片叶子,而是很粗的一个分枝,这个分枝上会未来几十年、年复一年长出无数的叶子来。他是能开出一个门派,有深远的第一性原理思考的学者。他的着眼点绝不是一两篇顶会文章、一两个重大项目申报,而是永远在思考,一个领域最核心的洞察(insight)应该是什么,怎么才能沿着这个最核心的问题,用有效的方法去解决它?
比如在语义网(后来改名叫知识图谱)这个领域,Jim教会了我几个核心的观察角度。
首先,在Semantic Web这个领域中,最重要的是什么?他说,不是Semantic,而是Web,只有Web是新东西。之前那么多年做专家系统、知识表现,semantics的研究一直得不到突破,知识获取的成本太高了,只有引入 Web 这个新变量,用群体智慧的力量,让千千万万的人贡献的知识被利用起来,才能实现语义网。他管这种观点为Semantic WEB,而非SEMANTIC Web。在Semantic Technology 2008: “Fellowship of the (Semantic) Web - The Two Towers” 这个讲座里,他又称为大O派(语义派)和小o派(Web派)。大O派的代表是欧洲的一些描述逻辑专家,他们聚焦于知识语言的表达力和计算复杂性,重视“Ontology”,Jim代表的小o派,是RDFS视角,重视“连接”这个属性,不太在意语言本身的严格语义学限制。他后来总结这些观点在《Semantic Web for the Working Ontologist》这本书里。再往后,发展为社会机器(Social Machine)理论,他也写了本书叫《Social Machine》。这两本书都有中文版。
我读博士期间,本来是大O派,天天做不可判定性和算法复杂性证明,到了Jim这里,才开悟。回想起当初为什么听不懂他的话,可能就是学术的理解力没到。观点转变后,我作为W3C OWL工作组成员,写了一篇博客“OWL or OLD”(OLD=ontology language of domain,是我杜撰的一个缩写),认为我们语义网的标准语言不应该再是逻辑表达力驱动的。我还抱怨,我们把OWL搞复杂了。这篇被一位大O派名教授批判了,说我作为工作组成员不应该和“主流”唱反调。作为逻辑学家他还说,我们语言的子集计算复杂性只有多项式时间,怎么算复杂呢?我心里说,但是文档有几百页啊,是对人复杂,不能只考虑是不是对机器复杂。Jim就站出来为我说话,说 Jie 有表达自己学术观点的自由。
第二个我从Jim这获得的洞察角度是,理解AI系统,一定不要只从机器角度、算法角度,一定要重视人的认知、重视人机交互(HCI)。2008年我刚到岗的时候,iPhone还是个新鲜玩意,他就很鼓励大家把语义网的技术用在开发触摸屏应用上。他推荐所有人都去用“Twine”这个语义书签应用,并引导了我去理解社交网络对AI的作用。他重视视觉交互和互动式信息检索工具的作用,引导我在分面浏览器(faceted browser,后来到MIT后和David Karger又进一步深入学习了这个技术)和语义维基(semantic wiki)技术上做了深入的探索。他的团队里还有人研究机械手、虚拟现实等各种看起来和AI无关的人机交互手段。2013年我开始创业的时候,特地飞到RPI去咨询他,那天他正好在玩谷歌眼镜(Google Glass),他就说,语义网的应用一定要和虚拟现实或增强现实中的信息流结合在一起,这和我创立文因互联的初衷完全一致。
虽然我今天还没有实现这个初衷,但是终有一日,我坚定相信,语义网也好,知识图谱也好,大模型也好,作为语义分析方法,他们最好的应用会在视觉驱动的信息流上。人的认知才是AI系统成败的关键,也是AI应用的落脚点。我在RPI和Jim的这一部分研究,后来整合在“心智扩展”(Extended Mind)理论中。这些工作工程性很强,我的主要工作就是写代码、做工具、做系统,这方面没咋写过论文。Jim也从来不要求我去发顶会论文,他对高质量工作的判断是探索的创新性而不是KPI。这一点也深刻影响了我,什么是顶级的研究应该有的价值尺度。BTW,后来到MIT,发现Tim Berners-Lee也是这个风格,超级重视工程而不在乎论文。
第三,做研究工作,要去思考“第一性原理”。对于语义网/知识图谱这个领域,最核心的问题就是到底什么是“语义”,什么是“知识”?2010年开始,Jim就开始引导我进入这个最内核的问题,我也从搞工程的“实验计算机科学家”又回归到“理论计算机科学家”的本色。他建议我去研究的问题是“语义信息论”(semantic information theory)。这可能是我一生最痛苦无助的研究题目了,因为它实在是太难了,光前置知识就包括经典信息论、算法信息论、概率逻辑理论、可计算性与超计算理论、语义学、语用学等等,打印出来的参考文献超过我的身高。虽然最后只发了一篇普通杂志论文,但是这个研究是我一生(至今)最自豪的研究,有一种“会当凌绝顶,一览众山小”的感觉,感觉从此回头看认知智能里所有的问题,再没有看不明白的。而且到了最后几个月(2011年了),我也想明白了,语义表示的可计算工程架构,一定是分布式表示。可惜后来我就离开了 RPI 没有再继续这个工作,但一年以后深度学习兴起,词向量(word vector)方法在2012年出现,说明领域的发展确实是有规律可循的。抓住第一性原理,就能在茫茫迷雾中感知到大致正确的方向,然后再用强大的工程能力去突破。后来分布式表示方法一路演化为今天的大语言模型(LLM),如今被广泛接受。
又比如,Web(万维网)的第一性原理是什么?Jim说是Serendipity。这个词中文没法翻译,没有完全对应的概念,是说某种未经规划的惊喜。很多年以后,我把它翻译成“缘”。Web 代表是一种精神,信息可以自由地互联,不需要什么伟大的规划,你只要能保障自由,就会产生信息的化学反应,人、信息自由组合,产生serendipity。所以Jim是网络中立(network neutrality) 的坚定捍卫者,也是社交网络封闭花园(walled garden)的坚定反对者,反对包括Google、Facebook这样大公司的很多行为。很多这些原则性的大是大非问题,我开始不理解,要在很多不经意的闲谈中,理解 Jim 的价值观,理解他为什么坚定捍卫网络自由,因为只有这样才能保障Serendipity。其实这和市场经济的思想是一致的。后来到MIT 和 Tim 继续学习了可追责理论(accountability,Jim也是这个理论的创立者之一),更加坚定了这个信仰。我坚信,AI研究和互联网结合,最终一定可以创造出一种信息的市场经济,最终从经济增长和人类自由两方面,促进社会的范式进步。
第四,做事情一定要坚持。他有一句名言“A little semantics goes a long way”(一点点语义要走很长的路)。从1997年他做SHOE语言开始,到现在快30年了,漫长的领域演化,经历agent、语义网、知识图谱、大语言模型,用知识(语义)服务社会的初衷一直没有变。有人把这句话叫“Hendler定理”。他在马里兰的学生有过有这句话的文化衫,但是在RPI我没有,也一直是小小的遗憾。
以上只是对Jim作为大宗师挂一漏万的一点记录。他学生很多,我从他那里得到的,也只不过是只鳞片甲。但是这一点点就足以让我眼界大开。他带着我到学术的高峰处领略了顶级研究的思想享受,那几年时光我特别珍惜。我特别珍视他的学术思想背后体现的世界观和价值观。人的一生常常被繁琐的小事困扰,论文、工作、“帽子”、头衔、涨薪、搞钱,日久便会迷失,作为技术人,你的初心是什么?十多年来,我常常回到这个初心,我也常常感激Jim带给我这个初心。
作为“圣保罗”的Jim
Jim作为学者,也同时是一个积极的活动家和组织者。语义网这个领域,有人说他是“之父”,他自己不承认,他说Tim Berners-Lee才是语义网之父,他最多只是助产士。我觉得更合适的比喻,对于Web这样强烈的信仰驱动的领域,Tim是耶稣,Jim是圣保罗:耶稣创造信仰,圣保罗建立教会,搞人搞钱,让信仰得以落地。
早期的AI研究,没有多少商业应用,基本都是政府,特别是军方,在多年砸钱。语义网早期发展,离不开 DARPA(国防部高等研究计划署)、陆军、海军的很多资助。Jim是 DARPA 在这个方向的program director(1999年),像DAML(DARPA Agent Markup Language,OWL语言的前身)、CALO(Cognitive Assistant that Learns and Organizes,后来演化为Siri)这样的奠基性工作,Jim 功不可没。后来美国陆军有长达10年的对各大学的AI资助,名教授基本都被资助过,Jim也是主要推动者。
Jim 是民主党的支持者。2009年 Obama 成为总统后,他被任命为白宫万维网专家顾问(Web Expert)。Jim发挥了他对美国政界的影响力,在联邦和纽约州推动了很多科学促进工作。特别是他响应Tim Berners-Lee的“开放互联数据”(Linked Open Data)倡议,推动美国联邦政府开放数据,建立了”data.gov”网站,把一切不保密的政府数据让公众自由地获取。他在RPI建立了“Linked open government data”项目,对政府开放数据进行语义化的再加工,并开发各种示范应用。这个工作得了ISWC(国际语义网会议)2010年的最佳应用挑战论文。我参与了开放金融数据的工作,该工作得了IEEE金融工程和计算智能会议2010年最佳论文——后来文因互联进入金融AI领域,渊源也在这里。
Jim是AAAI、IEEE等诸多协会的会士(Fellow),是W3C很多工作组的核心成员,他和Wendy Hall(ACM前主席)、Nigel Shadbolt等人关系很好,形成了一个大西洋两岸的活跃的学术共同体,被称为“Web Science”。RPI的TWC( Tetherless World Constellation,我自己翻译为“无量世界研究所”)吸引了很多第一流的国际学者来工作或者访问,如 Deborah McGuinness、Peter Fox、季姮、李娟子、Peter Mika等等。他还组织了Data Intelligence这个杂志,成为知识图谱的核心期刊。学术共同体促进思想的交流,形成了思想的“Serendipity”。
作为可爱的人的Jim
日常生活中,Jim是个和蔼可爱的胖爷爷。Jim是犹太人,日常带犹太小帽,有时候腿脚不好还会拄个拐棍。他的办公室里堆满了各种猫头鹰装饰,因为“OWL”语言的英文恰好就是猫头鹰。
当时我在我的办公室里挂了一把指环王里那种大剑。他一天来转,看到,笑眯眯地说,这就是你的让我保持对你友好(nice)的办法吗。还有一次我额头上长了个大包,请假去看医生,他说,虽然我很想我的实验室里有一只独角兽,不过还是健康重要。
Jim每天永远在回消息,不是回电子邮件就是在Twitter 上话唠,也是无数邮件列表的活跃成员。我上Twitter 和Facebook 都是受他影响。回国后有一次要找他,就去Facebook发私信,很快就联系上了。他后来来中国次数多了,还有了微信。所以Jim和我说话时,日常就是一边在手机上回消息,一边和我讲话,而且我说的他都能听得到。这个一心二用的本事令人赞叹。
我回国创业后还见过他几次。RPI TWC这个组有不少人后来也加入了文因互联,两任首席科学家都是TWC 同事。2017年7月他来北京,我邀请他访问文因互联。那天我还特意穿了2011年TWC黑客马拉松(hackathon)的文化衫,同事们笑话我咋穿的这么不正式(且丑),我说,见Jim就得穿这件。那时候文因互联刚刚起步,我们刚刚签下上交所这第一个大客户。Jim对知识图谱能在金融落地很感兴趣,而且说,好像在中国,工业界对知识图谱的兴趣,比在美国还浓厚。他戏言道,以后我得来中国搞钱。那段时间,他确实每年都来中国。
2018年CCKS(全国知识图谱与语义计算大会)在天津开,Jim是主题演讲人,我在天津又见了他一面,一起去城里吃了顿天津菜。那时候他兼任了RPI IDEA学院(Institute for Data Exploration and Applications)的院长,研究的范围更广了。我和他讲了过去的一年的进展,特别是在中国的金融监管中的知识图谱落地案例,如上交所,全国股转系统(北交所的前身)和银行间交易商协会(债券监管)。他很高兴,觉得比美国的同行发展得还要快。
近两年,他由于年龄原因,越来越少国际旅行,疫情三年也打断了他来中国的习惯。我这两年也很少参加国际学术会议,已经6年没有见过他。希望他的身体能保持健康,也希望两国的正常学术交往能越来越多,能和 Jim 再多见面。从他那里,我一直能得到能量。一点点语义要走很长的路,他一生做了一点点,我一生再做一点点,以后的年轻人再做一点点。许多一点点加在一起,说不定真的能改变世界呢?
往
期
推
荐