最近一些朋友聊天,大家都在使用chatGPT
三个月前也真香过,但我也很奇怪为什么后来没有再用了,看完一篇 Ted Chiang 写的科技评论《ChatGPT Is a Blurry JPEG of the Web》,突然想写点什么。
回想一下当时的情景,我问了一系列我自己想不通或者不知道怎么表述清楚的问题,GPT都给了我非常informative的回答。因为怕断网答案消失,我赶紧把它们贴在一个石墨文档里。
这些答案看起来非常完整,字正句凿,带着不容质疑的逻辑腔调(每处结尾必有的Overall,kinda of cute)。我假设着我的理解力已经和他并驾齐驱,一个接一个的提问,他继续用大段的东西来征服我,我激动不已。
"Excuse me, is it your passport? I just saw you were sitting there..." 一阵英音传来
我猛然抬头,发现自己抱着羽绒服,手里端着电脑,背包四敞大开,护照落在了闸机通道旁边的咖啡厅。
1
写作越久就越有一种毛病,不是我真的想通的东西,我无法直接贴过来。并不是每一个写作者的目的都一样,但是可能有一种相似的追求,通过遣词造句寻求语言本身的解释力,写的每一个字都要知道他为什么在那里
这种解释力是什么?
一系列非原创的碎片组成的 路径
Some might say that the output of large language models doesn’t look all that different from a human writer’s first draft, but, again, I think this is a superficial resemblance. Your first draft isn’t an unoriginal idea expressed clearly; it’s an original idea expressed poorly, and it is accompanied by your amorphous dissatisfaction, your awareness of the distance between what it says and what you want it to say. That’s what directs you during rewriting, and that’s one of the things lacking when you start with text generated by an A.I.
有些人可能会说,大语言模型的输出看起来与人类作家的初稿没有什么不同,但是,我再次认为这是一种表面的相似性。你的初稿并不是一个表达清楚的非原创想法;它是一个表达不佳的原创想法,它伴随着你无定形的不满,你意识到它所说的和你希望它所说的之间的距离。这就是在重写过程中指导你的东西,这也是当你从人工智能生成的文本开始时缺乏的东西之一。
--引用自 <ChatGPT Is a Blurry JPEG of the Web> by Ted Chiang
再次引用费兰特,
作者用一辈子寻找合适的词语组合,找到合适的表达工具:什么样的语言、节奏和语感适合讲述我所知道的事情。没有合适的词汇,没有一个漫长的训练过程,学会组合词汇和语言,是无法产生一些真实的东西的。文学的真实,是用词得当的文本里散发出来的真实,会溶于语言之中,它直接和句子里散发的能量挂钩。
2
我们选择依赖机器很大程度上是因为我们对自己的头脑 没有自信。
因此我们大多数时间选择去训练机器,或接受机器提供的信息,而不是直接训练头脑。尽管训练头脑的步骤可能异常的简单:去理解一些被认为“简单”的东西,从脑子里找路径。说来有趣,有一次我在想一个意大利语语法点:直接和间接宾语代词的时候,我发现这是一个「指代」问题,理解句子里「给谁 a chi」很重要。当然到这里没有停止,那如果我什么也不懂,怎么更简单的理解句子?
这不是我们的错,因为绝大部分社会程序中需要漂亮完美的东西呈现,为的是进入下一个程序。如果结果看上去差不多,谁会关心你是不是理解。但
自己也不关心吗?
机器会给你一种感觉,就是他非常博学,无所不知。在现实生活中很难很难遇到这样的人,我们对一个事情的理解往往要求助很多人。
我们问教授、同学、问微信备注中我们给贴了专业标签的朋友问题时,会经常遇到死胡同的情况。他无法理解你为什么不理解,你也表达不清楚,俩人有时面面相觑,结束时双方带着些许遗憾回去各自冷静一下。后来,可能的事情是,你们往往会继续思考这个“遗憾“的点,要么是他给你发了一段他的新解释,要么是你想通了什么然后感谢他。
“people are all we ve got” -- Phoebe Waller Bridge
尽管有时候体验不是完全赞,但我得承认这种双向互动所带来的持续惊喜感是非常美妙的。当然前提是我相信,人们对共同经历的事情的感受是相似的,所以你的态度决定着很多事情。比如你对一个问题的着迷,很大程度上会感染你所询问的对方(如果你对事情没有什么求知欲,那么对方的解释戛然而止也是正常)。但是当然,机器不会产生这种感觉延伸。
3
再举一个搜索的例子,在没有统一问答GPT时我们是怎么进行搜索的呢?一个问题我们会找得无穷多个解释版本(和上下文),然后我们开始挨个啃,拼凑出大脑最能接受的版本。这不是一个痛快的过程,事实上非常混乱,从浏览器打开的密恐网页数就可以看出。不过,这却是一个很真实的过程,设想一下这些地址是真实的地址,你走🚶♀️到每一个地方是不是要花费时间和能量?大脑其实也是在不断的定位,并标记这些地址,有可能还会存储在某处。我可能最终娶不到真经,但是我有九九八十一难的体验,而且有的妖怪👺我还能记得在哪。
有时候我们会把不同的媒介,比如视频、图像、文本的具体位置存下来,来构建这种理解(轨迹)的空间记忆。这个过程在我看来非常重要,而且像之前所说,如果这个过程能够实现一种双向连接:技术来帮助可视化互联网的诸多路径,而不是让这张JPEG更加模糊。
It’s possible that, in the future, we will build an A.I. that is capable of writing good prose based on nothing but its own experience of the world. The day we achieve that will be momentous indeed—but that day lies far beyond our prediction horizon. In the meantime, it’s reasonable to ask, What use is there in having something that rephrases the Web? If we were losing our access to the Internet forever and had to store a copy on a private server with limited space, a large language model like ChatGPT might be a good solution, assuming that it could be kept from fabricating. But we aren’t losing our access to the Internet. So just how much use is a blurry jpeg, when you still have the original?
有可能在未来,我们会建立一个人工智能,能够根据自己对世界的经验写出好的散文。我们实现这一目标的那一天将是非常重要的,但那一天远远超出了我们的预测范围。在此期间,我们有理由问,拥有重新表述网络的东西有什么用?如果我们永远失去了对互联网的访问,并且不得不在一个空间有限的私人服务器上存储一个副本,那么像ChatGPT这样的大型语言模型可能是一个很好的解决方案,前提是它可以不被制造出来。但我们并没有失去对互联网的访问。那么,当你还有原件的时候,一张模糊的JPEG有多大用处呢?
--引用自<ChatGPT Is a Blurry JPEG of the Web>
by Ted Chiang
4
我们没有把精力放在 大脑如何为我们建立理解的版本这个问题上,GPT非常好,但是我不觉得他的核心问题是这个。相应的,Vannevar Bush 的Memex储存器(researchers in the future could make connections between writings as frames microfilm),Ted Nelson的Xanadu (make parallel pages with visible connections),Roam research 是,我想做的word block也是。
大脑有一个非常牛逼的算法,只不过很多现实标尺让他看上去没有那么“实用”、“有效”、“快”。
可能它就做一件事:理解
我一直觉得这个过程是非常非常强大的,这个运行机制让你能够做决策,能够对事物有感,能够建立联系...
你是真的非要马上知道那个lambda吗?你是想看看自己是怎么知道那个lambda的。GPT是一段段连引用都没有的聚合物,互联网是已经存在了无穷标签的杂货铺(但是可以分拣)。
我的愿望是借助科技帮助人(自己)探寻大脑“理解”事物的过程,即如何创建事物与事物之间的联系。我认为这个过程机器无法代劳,无法帮助我们加速理解(甚至让人省略理解)。科技不是充当那个联系的建立者,也不是小叮当的口袋,而是作为工具,让人能在数字世界去完成最基本的事,并能与人接触。