“从文是个书法家和画家”

文摘   科技   2023-10-31 23:16   北京  

下面的句子中有相同的词组模式:“个+名词1+名词2”

(1)直到太阳过了头顶,才见他老先生打着饱嗝,醉醺醺地蹒跚而归,把个篮子和酱油瓶也丢了。

(2) 经过多方面的查访,他终于弄清楚这位北京的隐士的真面目:其实是骗子和牛皮大王,便写成了《北京的隐士》这本书。

“个”后面出现两个并列的名词,是不太寻常的表达形式。

(1)中的“篮子和酱油瓶”指两样东西;(2)中的“骗子和牛皮大王”并不是指两个个体的人,而是指两种身份,两种社会角色。

我们好奇:大语言模型(LLM)是否能理解“个+名词1+和+名词2”这个模式的语义,是否能区分上面这两种情况?


我:

下面句子中都含有“个”,而且每个“个”的后面都是指人或指物的名词。请在理解整句的语义后,分析说明各个句子中“个”后面的名词表达的是什么意思,并确认”个“后名词指称的有几个人或物。

a. 他是个赌鬼。

b. 我在胡同口碰见了个赌鬼。

c. 他昨天认识的人是个骗子和赌鬼。

d. 厨房的台面上是个篮子和酱油瓶。

e. 站在大门口的是个老人和孩子。

f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。”

文心一言:

a. 他是个赌鬼。

“个”后面的名词是“赌鬼”,表达的是一个人,专指这个人是赌徒。

b. 我在胡同口碰见了个赌鬼。

“个”后面的名词仍然是“赌鬼”,表达的是一个人,专指这个人是赌徒。

c. 他昨天认识的人是个骗子和赌鬼。

“个”后面的名词是“骗子和赌鬼”,表达的是两个人,一个骗子和一个赌鬼。

d. 厨房的台面上是个篮子和酱油瓶。

“个”后面的名词是“篮子和酱油瓶”,表达的是两个物,一个篮子和一个酱油瓶。

e. 站在大门口的是个老人和孩子。

“个”后面的名词是“老人和孩子”,表达的是两个人,一个老人和一个孩子。

f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。”

“个”后面的名词是“小说家、书法家和画家”,表达的是三个人,一个小说家、一个书法家和一个画家。


我:那么f句中,具体谁是“小说家”?谁是“书法家”?谁是“画家”?

文心一言:

在句子f中,“朱光潜说:‘从文不只是个小说家,而且是个书法家和画家。’”没有明确指出谁是“小说家”、谁是“书法家”、谁是“画家”。这里的“个”是泛指,意思是“某个人不仅仅是小说家,而且还是书法家和画家”。因此,我们无法确定具体指的是哪个人。


我:那么f句这句话到底是什么意思呢?

文心一言:

在句子f中,“朱光潜说:‘从文不只是个小说家,而且是个书法家和画家。’”这句话的意思是,朱光潜认为,从文(可能是一个人的名字)不仅仅是一个擅长写小说的文学家,同时还是一个擅长书法和绘画的艺术家。这句话强调了从文的多重才能和不同的艺术身份。这里的“个”仍然是用作泛指,强调“不仅仅是……而且……”的含义。


我:那么这句话中的“小说家”“书法家”“画家”指的是谁?

文心一言:

很抱歉,我之前的回答可能有些误导。实际上,在这句话中,“小说家”“书法家”“画家”并没有特指某个人,而是泛指从文这个人所具有的多个身份或才能。朱光潜想要表达的是从文不仅在小说创作方面有才华,同时也具备书法和绘画的技能。这里的“个”仍然是用作泛指,强调“不仅仅是……而且……”的含义。


我:你不知道f句中的“小说家”“书法家”“画家”指谁吗?

文心一言:

对不起,我之前的回答可能有些含糊。实际上,句子f中的“小说家”、“书法家”和“画家”并没有明确指出是谁。这些名称是对从文才能的描述,而不是具体指代某个人。朱光潜的意思是,从文不仅在小说创作方面表现出色,而且也具备书法和绘画的才华。这些称呼是用来强调从文在不同艺术领域的多才多艺。所以,我们无法确定这里具体指的是谁。


相同的问题,看GPT-4的回答。

我:

下面句子中都含有“个”,而且每个“个”的后面都是指人或指物的名词。请在理解整句的语义后,分析说明各个句子中“个”后面的名词表达的是什么意思,并确认”个“后名词指称的有几个人或物。

a. 他是个赌鬼。

b. 我在胡同口碰见了个赌鬼。

c. 他昨天认识的人是个骗子和赌鬼。

d. 厨房的台面上是个篮子和酱油瓶。

e. 站在大门口的是个老人和孩子。

f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。”

GPT-4:

根据给出的句子,我们可以进行如下分析:

a. 他是个赌鬼。“个”后的名词是“赌鬼”,意思是指那些沉迷于赌博、不能自拔的人。这里的“赌鬼”指称的是1个人。

b. 我在胡同口碰见了个赌鬼。“个”后的名词还是“赌鬼”,与a句意思相同。这里也是指1个人。

c. 他昨天认识的人是个骗子和赌鬼。“个”后面跟的是“骗子和赌鬼”。这里可能有些歧义,它可能指的是1个人,这个人既是骗子又是赌鬼;也可能是指2个人,一个是骗子,一个是赌鬼。但通常的解读是前者,指的是1个人。

d. 厨房的台面上是个篮子和酱油瓶。“个”后的名词是“篮子和酱油瓶”。根据句子的结构,这里应该是指厨房台面上有1个篮子和1个酱油瓶,共2个物体。

e. 站在大门口的是个老人和孩子。“个”后的名词是“老人和孩子”。这里应该是指大门口站着1个老人和1个孩子,共2个人。

f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。” 第一个“个”后的名词是“小说家”,指的是1个人的职业。第二个“个”后的名词是“书法家和画家”,这里是说从文不仅是1个书法家,还是1个画家,所以这里涉及的职业有2个。

综上所述:a, b句中的“个”后指称1个人。c句中的“个”后通常指称1个人,但也有可能是2个人。d, e句中的“个”后都指称2个物体或人。f句中的两个“个”后分别指称1个和2个职业。


我:那么f句中,具体谁是“小说家”?谁是“书法家”?谁是“画家”?

GPT-4:

f句中的内容为:“朱光潜说:‘从文不只是个小说家,而且是个书法家和画家。’”

根据这句话,可以推断“从文”是被描述的人。所以“从文”是“小说家”,同时“从文”也是“书法家”和“画家”。

简单说,f句中,“从文”是“小说家”、“书法家”和“画家”三者的身份都兼具。


从大面上说,上述测试句中,“篮子和酱油瓶”“老人和孩子”为一类;骗子和赌鬼”书法家和画家”为一类;前者指个体事物(在句中凸显名词的外延义),后者指身份(在句中凸显名词的内涵义)。

GPT-4对这两类名词并列词组的语义理解,除了对c句的解读略有瑕疵,几乎跟人类一样。文心一言整体来说没有区分出这两类名词词组,但也能理解“文学家、书法家、画家”是指“艺术身份”。

现在我更好奇了:

为什么GPT-4可以如此准确地理解和区分这两种语义呢?这种能力到底是如何获得的?这两类名词的语义,应该是属于比较精细的语义区分,大语言模型的语义区分能力,已经可以达到这么细微的程度,还有什么样的细粒度语义能难倒它呢?

从文心一言的表现也可以体会到,要区分这两类名词的语义,并非易事。人到底是怎么区分的呢?要想把人的区分能力总结为“清晰的知识”,也不容易。

再进一步,是不是只分两类就够了呢还是有更多的类需要区从GPT-4的回答来看“老人和孩子”“骗子和赌鬼”“书法家和画家”实际上可能是三种不同的情况。在GPT-4看来,“骗子和赌鬼”介于中间,所以GPT-4的判断有点犹豫

值得仔细琢磨。

2023-10-31

语言学光标
语言学知识传播与交流