信息压缩的艺术

文摘   文化   2024-03-29 10:32   中国香港  
前几天跟家里领导散步,偶然提到之前看过的电影《年会不能停》,聊起来一个话题:电影中调侃的“颗粒度对齐”算不算职场黑话?


我的看法是:算,但有其存在的价值。
我可能需要先向你解释什么叫“颗粒度对齐”,这个行为,本身就已经暴露了“颗粒度对齐”的黑话属性。
在我的定义里,以我九年义务教育之学,不能一眼看懂的都叫黑话。
我贫瘠的职场生涯其实没有什么机会长出这么高级的词汇。
说它有存在的价值并不是为了辩解。
在我第一次看到这词时,凭着直觉猜测,这个概念指的应该是:
用一些方法去确保不同部门之间保持一致性和协调性,以此提高效率,减少错误和混淆。
中翻中可能就是:大家伙啊,有什么事都及时地互相通知一下。
很多人批评说,别人生造出这些词就是为了故意让人看不懂的。
我的看法是,事实很可能不是如此。
备选的原因至少包括:惯性驱使。
比如有了“粒度”和“对齐”这些概念,进一步延伸,渐渐有了这个约定的表达方式,我断言,这种表达方式在特定群体内很可能还提高了沟通的效率。
为了提高沟通效率而把一个场景或者一个故事提炼为几个字的做法,其实我们一点也不陌生。比如,羊车望幸,比如,杯弓蛇影。
没错,汉语里面的成语就是如此。
本质上,成语也是一种黑话,你要看得懂成语,需要一个学习的过程,这个过程跟学习什么是“粒度”、什么是“对”也没什么两样。
我之前提过,成语的本质是信息压缩,这是很多黑话的典型特征。
“颗粒度对齐”跟成语并没有本质区别。
那为什么使用成语会被视为“有文化”的象征,而使用“颗粒度对齐”又会被调侃呢?
其实,使用成语同样也有被嘲讽的风险,比如:
某日漫步于柳暗花明的公园,偶遇一顽童,正骑竹马之喜。
我驻足观赏,不料一叶障目,误入歧途,与顽童捉迷藏。真是塞翁失马,焉知非福,竟在花团锦簇中找回了童年的无忧无虑。
上面这段话中翻中大概是:

那天我去公园散步,看到个小朋友在那边玩得可欢了,就像骑在小马上一样。我停下来看,结果不小心走岔了路,跟着小朋友玩起了躲猫猫。没想到这一趟,我好像又回到了小时候,感觉特别轻松快乐。

这两种表达方式其实都没有错,只是目标读者不同。
事实上,我认为最终极的黑是数学,那可不是一般人想学就能学会的。而数学的目的是:以一种非常精确的方式交流思想和概念。
数学语言很可能是信息压缩比最高的语言。
比如你有一个仓库,里面有几万本书,每一页印的全是(1,3) 、(2,5)、(3,7)、(4,9)...,里面包含的信息量其实相当少。
小学保送初中的你肯定也能猜到,这几万本书无非表达了:
y = 2x + 1
我们能够进行信息压缩的前提是数据本身有规律性,而我们懂得这种规律,也就是:知识。
岔开说一句题外目前的大语言模型,使用几十PB的语料数据进行训练,得到几百G的参数文件,本质也是一种信息压缩。
OpenAI的首席科学家Ilya有个信念:如果你能高效压缩信息,你一定已经得到知识,不然你没法压缩信息。
也就是说,他相信人工智能模型在训练的过程中学到了真正的“知识”,而不仅仅是学会怎么操作那些字符,这也是他们相信AGI能够实现很重要的一个原因。
数学、成语、“颗粒度对齐”本身都没有什么问题,黑话也不是什么贬义词,黑话,是指在特定的社会群体、行业或组织中形成的一种非正式的、只有内部成员才能理解的语言或词汇。
典型的比如财务报表这种会计语言,你很容易批评它不讲“人话”,但谈到如何改进它却并不容易。比如说商誉,你咋一看不容易理解,学习了才知道它表达的是:企业在收购其他企业时支付的超出净资产公允价值的那部分金额。
想象一下,如果不使用这些黑话,在表达的时候会多么的“不精确"和繁琐?
我听过这样一个说法:聪明人容易被复杂性所引诱。
这是一句让赞成和反对它的人都不知所措的话。
意思大概是聪明人喜欢整那些没有必要的复杂性,容易把简单的事情复杂化。
我只想说,黑话是一种有必要的复杂性。
真正有问题的是,针对不同群体的沟通方式。
黑话只属于特定团体内部,如果你面对的是团体外的人,需要切换视角。这并不容易,我见过一些程序员在跨部门协作时、在跟外部客户沟通时,经常使用一些公司内部的专有术语而不自知。
我所理解的所谓表达能力强,就是知道听众不知道什么,然后能用匹配听众认知水平的方式进行表达。
那么如果听众是很多人,水平又参差不齐呢?
这就是写作者面临的永恒难题。
或许下面这段话就是一种解答:
如果所有观点都要被拉到力求每个人都能读懂的最低的共同标准上,那这对创作者而言也过于不公了。
这并不是在批评大众的无知,而是在提醒各位无论内容的载体或者媒介如何变化,知识壁垒从来没有消除,内容和受众间的双向筛选天然具有正当性。

哈读
顿悟只发生在有积累的头脑