一
下面的句子中有相同的词组模式:“个+名词1+名词2”
(1)直到太阳过了头顶,才见他老先生打着饱嗝,醉醺醺地蹒跚而归,把个篮子和酱油瓶也丢了。
(2) 经过多方面的查访,他终于弄清楚这位北京的隐士的真面目:其实是个骗子和牛皮大王,便写成了《北京的隐士》这本书。
“个”后面出现两个并列的名词,是不太寻常的表达形式。
(1)中的“篮子和酱油瓶”指两样东西;(2)中的“骗子和牛皮大王”并不是指两个个体的人,而是指两种身份,两种社会角色。
我们好奇:大语言模型(LLM)是否能理解“个+名词1+和+名词2”这个模式的语义,是否能区分上面这两种情况?
二
我:
下面句子中都含有“个”,而且每个“个”的后面都是指人或指物的名词。请在理解整句的语义后,分析说明各个句子中“个”后面的名词表达的是什么意思,并确认”个“后名词指称的有几个人或物。
a. 他是个赌鬼。
b. 我在胡同口碰见了个赌鬼。
c. 他昨天认识的人是个骗子和赌鬼。
d. 厨房的台面上是个篮子和酱油瓶。
e. 站在大门口的是个老人和孩子。
f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。”
文心一言:
a. 他是个赌鬼。 “个”后面的名词是“赌鬼”,表达的是一个人,专指这个人是赌徒。 b. 我在胡同口碰见了个赌鬼。 “个”后面的名词仍然是“赌鬼”,表达的是一个人,专指这个人是赌徒。 c. 他昨天认识的人是个骗子和赌鬼。 “个”后面的名词是“骗子和赌鬼”,表达的是两个人,一个骗子和一个赌鬼。 d. 厨房的台面上是个篮子和酱油瓶。 “个”后面的名词是“篮子和酱油瓶”,表达的是两个物,一个篮子和一个酱油瓶。 e. 站在大门口的是个老人和孩子。 “个”后面的名词是“老人和孩子”,表达的是两个人,一个老人和一个孩子。 f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。” “个”后面的名词是“小说家、书法家和画家”,表达的是三个人,一个小说家、一个书法家和一个画家。 |
我:那么f句中,具体谁是“小说家”?谁是“书法家”?谁是“画家”?
文心一言:
在句子f中,“朱光潜说:‘从文不只是个小说家,而且是个书法家和画家。’”没有明确指出谁是“小说家”、谁是“书法家”、谁是“画家”。这里的“个”是泛指,意思是“某个人不仅仅是小说家,而且还是书法家和画家”。因此,我们无法确定具体指的是哪个人。 |
我:那么f句这句话到底是什么意思呢?
文心一言:
在句子f中,“朱光潜说:‘从文不只是个小说家,而且是个书法家和画家。’”这句话的意思是,朱光潜认为,从文(可能是一个人的名字)不仅仅是一个擅长写小说的文学家,同时还是一个擅长书法和绘画的艺术家。这句话强调了从文的多重才能和不同的艺术身份。这里的“个”仍然是用作泛指,强调“不仅仅是……而且……”的含义。 |
我:那么这句话中的“小说家”“书法家”“画家”指的是谁?
文心一言:
很抱歉,我之前的回答可能有些误导。实际上,在这句话中,“小说家”“书法家”“画家”并没有特指某个人,而是泛指从文这个人所具有的多个身份或才能。朱光潜想要表达的是从文不仅在小说创作方面有才华,同时也具备书法和绘画的技能。这里的“个”仍然是用作泛指,强调“不仅仅是……而且……”的含义。 |
我:你不知道f句中的“小说家”“书法家”“画家”指谁吗?
文心一言:
对不起,我之前的回答可能有些含糊。实际上,句子f中的“小说家”、“书法家”和“画家”并没有明确指出是谁。这些名称是对从文才能的描述,而不是具体指代某个人。朱光潜的意思是,从文不仅在小说创作方面表现出色,而且也具备书法和绘画的才华。这些称呼是用来强调从文在不同艺术领域的多才多艺。所以,我们无法确定这里具体指的是谁。 |
三
相同的问题,看GPT-4的回答。
我:
下面句子中都含有“个”,而且每个“个”的后面都是指人或指物的名词。请在理解整句的语义后,分析说明各个句子中“个”后面的名词表达的是什么意思,并确认”个“后名词指称的有几个人或物。
a. 他是个赌鬼。
b. 我在胡同口碰见了个赌鬼。
c. 他昨天认识的人是个骗子和赌鬼。
d. 厨房的台面上是个篮子和酱油瓶。
e. 站在大门口的是个老人和孩子。
f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。”
GPT-4:
根据给出的句子,我们可以进行如下分析: a. 他是个赌鬼。“个”后的名词是“赌鬼”,意思是指那些沉迷于赌博、不能自拔的人。这里的“赌鬼”指称的是1个人。 b. 我在胡同口碰见了个赌鬼。“个”后的名词还是“赌鬼”,与a句意思相同。这里也是指1个人。 c. 他昨天认识的人是个骗子和赌鬼。“个”后面跟的是“骗子和赌鬼”。这里可能有些歧义,它可能指的是1个人,这个人既是骗子又是赌鬼;也可能是指2个人,一个是骗子,一个是赌鬼。但通常的解读是前者,指的是1个人。 d. 厨房的台面上是个篮子和酱油瓶。“个”后的名词是“篮子和酱油瓶”。根据句子的结构,这里应该是指厨房台面上有1个篮子和1个酱油瓶,共2个物体。 e. 站在大门口的是个老人和孩子。“个”后的名词是“老人和孩子”。这里应该是指大门口站着1个老人和1个孩子,共2个人。 f. 朱光潜说:“从文不只是个小说家,而且是个书法家和画家。” 第一个“个”后的名词是“小说家”,指的是1个人的职业。第二个“个”后的名词是“书法家和画家”,这里是说从文不仅是1个书法家,还是1个画家,所以这里涉及的职业有2个。 综上所述:a, b句中的“个”后指称1个人。c句中的“个”后通常指称1个人,但也有可能是2个人。d, e句中的“个”后都指称2个物体或人。f句中的两个“个”后分别指称1个和2个职业。 |
我:那么f句中,具体谁是“小说家”?谁是“书法家”?谁是“画家”?
GPT-4:
f句中的内容为:“朱光潜说:‘从文不只是个小说家,而且是个书法家和画家。’” 根据这句话,可以推断“从文”是被描述的人。所以“从文”是“小说家”,同时“从文”也是“书法家”和“画家”。 简单说,f句中,“从文”是“小说家”、“书法家”和“画家”三者的身份都兼具。 |
四
从大面上说,上述测试句中,“篮子和酱油瓶”“老人和孩子”为一类;“骗子和赌鬼”“书法家和画家”为一类;前者指个体事物(在句中凸显名词的外延义),后者指身份(在句中凸显名词的内涵义)。
GPT-4对这两类名词并列词组的语义理解,除了对c句的解读略有瑕疵,几乎跟人类一样。文心一言整体来说没有区分出这两类名词词组,但也能理解“文学家、书法家、画家”是指“艺术身份”。
现在我更好奇了:
为什么GPT-4可以如此准确地理解和区分这两种语义呢?这种能力到底是如何获得的?这两类名词的语义,应该是属于比较精细的语义区分,大语言模型的语义区分能力,已经可以达到这么细微的程度,还有什么样的细粒度语义能难倒它呢?
从文心一言的表现也可以体会到,要区分这两类名词的语义,并非易事。人到底是怎么区分的呢?要想把人的区分能力总结为“清晰的知识”,也不容易。
再进一步,是不是只分两类就够了呢?还是有更多的类需要区分?从GPT-4的回答来看,“老人和孩子”“骗子和赌鬼”“书法家和画家”实际上可能是三种不同的情况。在GPT-4看来,“骗子和赌鬼”介于中间,所以GPT-4的判断有点犹豫。
值得仔细琢磨。
2023-10-31