题外:文章的总标题是我在IBM的工作经历,其实写的内容不限于我自己做的那点事,更多的是在跳出IBM后,结合内外视角,谈谈对IBM的理解和发展的话题。
Waston这个话题深有感触,IBM内网的资源还是挺开放的,虽然太新太秘的东西肯定看不到,但从内网首页可以链接到全球各大实验室的WEB,MarketPlace,MediaPlace,又跳到各种稀奇古怪的WEB,全球几十万员工,上百年的积累,只要有心,还是可以看到很多新玩意和脑洞,现在还有机会的IBMer,别浪费这个机会。那时我时不时在内网漫游,看到好玩的积攒下来,当作跟客户和BP的谈资,也感觉跟前沿科技没那么遥远。
IBM是人工智能孤独的先行者和探索者,从没有一个企业能近百年在这个领域不懈努力,虽然在历次的AI浪潮中都没有赚到什么钱,但其探索的成果和坎坷的经验,给后人和行业带来深远的影响。
这一次的AI浪潮,国外唱主角的是谷歌,DeepMind, 脸书,OpenAI,国内是BAT系(吐槽:大的互联网公司最后都变成放贷),四小龙(时过境迁),和大量大模型套壳的中小公司,而IBM由于Waston的陨落,更多被当作一个失败者被嘲笑。这种观点是短视而局限的,后面随着视角的展开,你会了解到,海面上激荡的波浪,下面隐藏着更多看不见的湍流,有的湍流消失了,有的在悄悄的碰撞、破碎、汇合,一旦浮出海面,将引起新一轮的海啸。
书归正传。读者大概都听说过2016年谷歌AlphaGO战胜韩国李世石9段的事情,这是AI第一次在围棋领域战胜人类,虽然人类早知道是迟早的事情,但比预期早了数十年。
早在1996、1997年,在国际象棋中,IBM的计算机深蓝DeepBlue, 和更深的蓝DeeperBlue战胜了国际象棋大师卡斯帕罗夫,宣告了机器智能的来临,当时虽然引起一波震撼,没有人认为是真正的威胁,从公开的资料看,更多的是通过暴力计算获得价值最大的棋子和棋盘位置,算法仅适用国际象棋,更多的是体现了机器的高性能,当时使用的就是IBM Power小型机。
机器与人的交互,显然自然语言更适合,但却是难以逾越的高山。以前业界多年的努力,并没有带来令人满意的结果。主要的障碍,一是人类语言的模糊性,二是机器缺乏对世界的基础知识和逻辑能力。
传统的解决思路大部分是基于符号主义的,即靠人为设定规则,将规则编码,这种做法很难泛化,只能在设定的专业狭窄领域使用,而且很难维护,一旦跳出领域就变成弱智。我大学的毕设,就是做专家系统,深受模糊矛盾的教条之苦。
2011年,IBM Waston问答机器人在美国“危险边缘”智力问答节目中击败人类,标志着认知时代Cognitive Era的到来。
为什么这个是一个巨大的飞跃?先介绍下这个问答游戏的规则。
基本介绍可以看这个:https://tech.sina.com.cn/d/2011-01-11/18505083210.shtml, 我摘了一部分:
《危险边缘》(Jeopardy)是美国著名的智力问答竞赛节目。比赛以一种独特的问答形式进行,问题设置的涵盖面非常广泛,涉及到历史、文学、艺术、流行文化、科技、体育、地理、文字游戏等等各个领域。根据以答案形式提供的各种线索,参赛者必须以问题的形式做出简短正确的回应。《危险边缘》在美国已经经历了数十年的历史,并不断演化出不同的形式和版本。
在该节目历史上,出现了两位传奇人物,肯-詹宁斯和布拉德-鲁特,他们是《危险边缘》节目中最成功的选手。詹宁斯曾连续74场赢得比赛,所获得的奖金总额高达2520700美元。鲁特则是获得总奖金最高的一位,在2002年和2005年的比赛中共拿到超过325万美元奖金。
摘抄结束,比较细的可以去看link,这里提炼几个关键点:
问题涉及各个领域,不可能像传统方式那样对某个领域进行优化;
主持人给出提示,选手必须以问题形式回应线索。重点是“以问题的形式”,直接说答案是不行的,要说问题;
参赛者进行抢答,不同的问题有不同的分值,涉及衡量风险和收益的决策;
不可联网搜索。
举个例子:
类别:美国历史 提示:他是唯一一位在任职期间被弹劾的美国总统。
参赛者A(卫冕冠军,当前得分领先):他是谁?
参赛者B(挑战者,得分较低):他是谁?
参赛者C(另一位挑战者,得分居中):他是谁?
在这个例子中,三位参赛者需要根据给出的提示,以问题的形式回答这位美国总统是谁。正确的答案应该是:“谁是理查德·尼克松?” 理查德·尼克松是美国第37位总统,也是唯一一位在任职期间因水门事件而遭到弹劾的总统。
这里还有几个《危险边缘》游戏中可能出现的示例提示和正确答案:
类别:世界首都 提示:这个南美国家的首都以其丰富的文化和历史遗迹而闻名,包括古老的印加遗址。正确答案:利马是哪里的首都?
类别:文学作品 提示:这部查尔斯·狄更斯的小说以一个孤儿的奋斗和成长为主线,讲述了他在英国维多利亚时代的生活。正确答案:《雾都孤儿》是哪位作者的作品?
类别:科学与技术 提示:这个术语描述了一种遗传病,其中患者的染色体数目异常,导致智力障碍和其他健康问题。正确答案:"三体综合征"是哪种遗传疾病的别称?
类别:电影 提示:这部1994年的电影由昆汀·塔伦蒂诺执导,讲述了六个相互关联的故事,涉及黑帮、拳击手和抢劫犯。正确答案:《低俗小说》的导演是谁?
类别:音乐 提示:这位著名的古典作曲家以他的交响曲和弦乐四重奏而闻名,他的作品编号从Op. 1一直到Op. 135。正确答案:谁是第94号交响曲的作曲家?
类别:地理 提示:这个位于亚洲的内陆国家以其广阔的沙漠和丰富的石油资源而闻名。正确答案:世界上最大的内陆国家是哪个?
类别:名人 提示:这位美国发明家和商人拥有超过2000项专利,他改进了电灯泡和发明了留声机。正确答案:"天才是百分之一的灵感加上百分之九十九的汗水"是谁的名言?
相信正在读这篇文章的你已经晕头转向了,简直想象不到这种浩瀚到变态加拐弯的知识问答,竟然有人能乘风破浪举重若轻的完成。然而Waston以绝对的优势,战胜了人类的常胜将军詹宁斯和鲁特。把对自然语言的理解和表达,对知识的掌握和分析,革命性的提升到新的层次,这一切,来自一个新的系统Deep QA, 以下是大概架构,我会在下次详细说明。
往期精选