嘉宾:雷志斌教授
香港科技大学区块链客座教授
香港应用科技研究院创新研发前总监
主持人:曾瀞漪
曾瀞漪:为什么由ChatGPT引发的生成式AI热潮,成为全球科技业最新焦点?是否从此将对人类带来巨大改变?
雷志斌:对比几年前,当我们第一次听说AlphaGo的时候也是非常的惊艳。我们看到它可以下围棋,比人类最好的棋手都要厉害,但是我们总感觉它离我们的生活还是很遥远,毕竟下围棋的人有限,而且也不太能够去理解围棋的这种复杂程度。
我们现在看到ChatGPT真的是走进我们的生活,我们可以用它来搜索,可以去跟它对话,甚至它可以去挑战一些错误的假设,拒绝回答一些你给它设的套路,有个性了。而且在短短的一个星期时间就有上百万用户,甚至现在几千万、超过一个亿的人开始去试用它。它已经不是高高在上、远离我们、不食人间烟火的深奥AI,它好像是一个你的工具,你可以去用它、去跟它对话、去改善它。某种程度讲它确实是一个我们经常说的横跨很多场景的技术,是可以被用在方方面面提高效率去和我们互动。这就是为什么所有的人都开始思考,当它来到我们中间的时候,当它加速的去替代我们过去很多较慢或者较冗余的动作的时候,会带来什么样的生产力变化,或者推动社会突飞猛进的进步。
曾瀞漪:我们现在把它看成是朋友,可是它将来会不会是我们的敌人,威胁我们的工作?
雷志斌:这种担忧过去确实很多,包括AI最开始出来的时候。每一代的技术发展都会有这样的担心,但实际上从最早的机械革命、蒸汽机革命、电子革命、互联网革命、现在 AI的革命,人们的这种担心没有一次是真正发生了的。往往当新的技术出来的时候,会把一些老的职业替代掉,但同时也会产生很多新的机遇。
曾瀞漪:国际大型企业争相竞逐生成式AI科技,将来是否走向不同领域的分化路线?
雷志斌:一定是这样,就像我们人类中有博学家,它什么都知道,但是也有专家,专家在某一个领域里面知道的非常多非常深。所以我们现在看到的 ChatGPT令人惊艳,因为它把全部互联网上的信息都拿来训练。但是如果进到一个专门的领域里去问它很详细的问题,在那一方面它缺少相关的知识,就无法回答。
为什么它叫Generative Pre-trained Transformer,就是根据历史的数据去大规模训练的模型,但是如果缺少这样的训练数据,在相关领域里面它是没有办法去回答这样的问题的。所以势必会发展出利用这样的大规模语言的模型,在不同的垂直行业,甚至人类不同的地区,不同的语言,不同的专业,它都会试图去解决它的相关的问题。而且在解决问题的过程中能够和我们自然地对话,把很复杂的概念用我们能够听懂的自然语言讲出来。
曾瀞漪:ChatGPT是一种通用的大语言模型,但是关于医疗等更需要专业回答的领域,他可能没有完整的能力的,而这个能力可能还要经过很多的数据培养出来。
雷志斌:没错,这就是我们讲的取决于你有什么东西“进去”。它训练用的是人工神经网络,就像我们去训练一个孩子,看你给他什么样的知识。例如双胞胎,放在不同的环境下,训练出来的知识和人格,可能完全不一样。如果它现在用到的所有知识,没有涉及你所说的专业领域,那它就需要重新专门训练。
曾瀞漪:所以,给它什么样的数据,就等于给它什么样的“价值观”,出来的结果就会很不一样。
雷志斌:是的。
曾瀞漪:这让我想起来,美国企业研发的ChatGPT引爆这波AI热潮,中国很多科技企业也竞相宣布投入,而且就像我们刚刚说的,“中国价值观”很重要,中国企业需要投入。中美企业在生成式AI领域的实力如何?
雷志斌:像这样的大规模语言模型,它有三个重要方面:一个是语言训练的“数学模型”,还有一个是“算力”,需要投入大量的算力去进行运算,把它的统计模型给计算出来。还有需要大量的“数据”。
从数学模型方面讲,大家的“模型”基本上相差不太远,基本都是来自于谷歌几年前的Transformer这样的一套模型。但是在算力上面,实际上有很大差别,因为现在用的最多的GPU芯片,中国目前还不能够生产,所以在这上面我们还需要追赶。
在”数据“上面,中美各有千秋,比如说中文就有很多数据。将“模型、算力、数据”三个放在一起,才能训练出非常有效,非常powerful的一个 GPT的模型。
曾瀞漪:能不能够再仔细地说一下中国的情况。中国最高端芯片受制于人,“数据”方面和美国各有千秋,接下来中国企业如果真的要追赶,可以怎么做?
雷志斌:其实有很多不同的方面,包括我们现在看到,即使是这么厉害的 ChatGPT,它还是有很多缺陷。这个缺陷要去弥补,本身就有很多工作要去做。在“模型”上面还是有很多机会去提高。在芯片方面,确实我们现在是落后的,但是在大型计算平台上面,我们还是有很大的空间可以发展,比如说去投入更多的算力,这个算力只要是有一个好的模型、好的产品、好的数据还是有可能出来一些很有效的结果。另外就是在一些领域,特别是我们领先的领域,比如关于中国文学,恐怕没有国家有我们掌握的数据多。
曾瀞漪:就是中美竞争或者共同发展GPT时,某些专业领域适合中国人就用中国的,而不是去用美国的相关系统?
雷志斌:类似于这种大语言模型,其实是既有竞争又有合作的。美国也好,中国也好,欧洲也好,都是地球上的人类,所有的语言、所有的价值体系,我们经常讲的是共通的。最早的ChatGPT这样的模型发展也是由于要做语言翻译,例如中文英文之间翻译,各种数据放在一起才会发挥更大价值,所以有竞争也有合作的机会。
曾瀞漪:AI这样发展下去,在Web3.0第三代互联网时代,彼此将产生什么关系?
雷志斌:可以说相当于生产力和生产关系。因为AI是一种生产力,它真的是可以在某一个领域里面大大提高效率。但要讲到数据来自于谁,数据是我们每个人都在产生,人们的数据训练了这个模型,那么模型产生的价值归属问题,以及这种数据放到一个模型里训练之后,它能不能够替代现有人工的工作,那么这些人是否能去做其它的事情,还是有什么方法将他们都纳入到整个体系里面,认可并奖励他们数据的贡献,这些都是非常复杂的生产关系问题。而数据所有权和价值归属是Web3.0的核心理念。
我们观察Open AI这间公司的成立,它就不是一个传统意义上追逐利益最大化的公司结构,它有一个非常独特的架构,例如它的盈利要设上限,这就是一种特殊生产关系的体现。好的生产关系一定能够最大化地促进生产力发挥它的极大优势。
曾瀞漪:Open AI起初的理念是“盈利有上限”,但现在成为微软的公司,更往私人方向走了。如何在Web3.0时代与AI生成式发展之间,有比较好的关系,也保护个人创作呢?雷志斌:Web3.0利用现有的第三代互联网的通讯技术、区块链的技术、智能合约等技术,构建一个底层架构。它可以将我们大家所产生出来的数据,或者所拥有的数据,把它织成一张有价值的数字资产网络。这个数字资产就是我们去“喂”给 AI大数据模型,让它能够发挥作用。如果解决了底层的数据“生产关系”,就可以极大的将数据的潜力发挥出来。企业在追逐利润的同时,作为一个全社会的人类价值的资产,相关的合作或者科研也一样有它可以发挥作用的空间。
曾瀞漪:因为Web3.0和AI超算的关系密切,香港特区政府上周公布的最新财政预算案,在科技方面的投入着力甚多,包括编列5000万港元推动第三代互联网生态圈,以及可能有几十亿港元研究建立AI超算中心,在香港迈向国际创科中心,相关预算整体高达百亿。特区政府投入这方面创科,有何重要意义?
雷志斌:我觉得这是非常有远见,而且是非常必要的。算力、大规模的语言模型,就相当于社会公有的资产,像我们呼吸的空气,干净的水。这种资源实际上是在每一个地区人们赖以生存的最重要的资源,也是最重要的生产要素。所以特区政府投放这么多资源,做这种大型AI超算中心,希望可以发展出一套针对香港本地的大语言模型 Hong Kong GPT。因为若拿内地的 GPT或者是国外的OpenAI的GPT,它一定不能够适应香港这个两文三语的环境。那么谁来提供训练材料?一定是香港。谁来用这个?那一定也是香港。所以在香港特区政府投放这样大量的资源,集合官产学研各种资源,产生出香港本地的HKGPT,作为一个开源的系统,可以对全球开放,鼓励香港应用市场的创新,包括在香港语言特殊环境中的发展。香港在这个基础上的各种创科,也能得到非常长足的发展。
曾瀞漪:让香港的超算中心符合香港特色。香港是国际金融中心,国际科技业者看准时机,闻风涌至,包括币圈人士。Web3.0和AI在我们未来经济生活中的定位,究竟应该是什么?
雷志斌:这个问题问得非常好。技术,它一定要推动社会的发展,金融也一定要能够服务于实体经济。不管你是来自于金融科技、科技金融或者是链圈币圈,最重要的目的就是这样一套技术出来之后,是不是能够服务于社会,服务于普通老百姓,服务于实体经济,用这个尺度是非常容易衡量出来的。很多人讲的”泡沫“,究竟是泡沫还是真实的生产力工具,要看我们怎么将这样的技术纳入到我们生活和工作中来。从这点来看,我认为“创新”是否能服务于实体经济是最好的检验。它是吹出来的泡泡,还是我们看到它真的能降本增效,看到各行各业能够用它去产生很大的效益提升。尤其是当我们讲第三代互联网的时候,如果没有像AI这样的生产力提升工具,很多时候就会流于表面的”虚拟资产“—我更倾向于管它叫数字资产,所谓虚拟资产其实最终是落于数字,和数字下面所代表的数据资产。这个数字资产就代表了数据是由实际应用场景中来,由实体经济中来的,回过头来做出来的AI也是去服务于实体经济。虚拟代表的是什么?其实它都是数字和数据的体现。所以我认为虚拟资产或者币圈项目,是否具有价值最终还是要看它的创新是不是能够带动实体经济的发展。
曾瀞漪:特区政府在迈向虚拟资产中心时,更多人涌进来,他们是否能够做出对实体经济的贡献,您的观点就是很好的判断准则了。谢谢雷志斌教授。
点
亮
在
看
=
点
石
成
金