信息压缩的艺术
文摘
文化
2024-03-29 10:32
中国香港
前几天跟家里领导散步,偶然提到之前看过的电影《年会不能停》,聊起来一个话题:电影中调侃的“颗粒度对齐”算不算职场黑话?
我可能需要先向你解释什么叫“颗粒度对齐”,这个行为,本身就已经暴露了“颗粒度对齐”的黑话属性。在我的定义里,以我九年义务教育之学,不能一眼看懂的都叫黑话。我贫瘠的职场生涯其实没有什么机会长出这么高级的词汇。在我第一次看到这词时,凭着直觉猜测,这个概念指的应该是:用一些方法去确保不同部门之间保持一致性和协调性,以此提高效率,减少错误和混淆。中翻中可能就是:大家伙啊,有什么事都及时地互相通知一下。很多人批评说,别人生造出这些词就是为了故意让人看不懂的。比如有了“粒度”和“对齐”这些概念,进一步延伸,渐渐有了这个约定的表达方式,我断言,这种表达方式在特定群体内很可能还提高了沟通的效率。为了提高沟通效率而把一个场景或者一个故事提炼为几个字的做法,其实我们一点也不陌生。比如,羊车望幸,比如,杯弓蛇影。本质上,成语也是一种黑话,你要看得懂成语,需要一个学习的过程,这个过程跟学习什么是“粒度”、什么是“对齐”也没什么两样。我之前提过,成语的本质是信息压缩,这是很多黑话的典型特征。那为什么使用成语会被视为“有文化”的象征,而使用“颗粒度对齐”又会被调侃呢?某日漫步于柳暗花明的公园,偶遇一顽童,正骑竹马之喜。我驻足观赏,不料一叶障目,误入歧途,与顽童捉迷藏。真是塞翁失马,焉知非福,竟在花团锦簇中找回了童年的无忧无虑。
那天我去公园散步,看到个小朋友在那边玩得可欢了,就像骑在小马上一样。我停下来看,结果不小心走岔了路,跟着小朋友玩起了躲猫猫。没想到这一趟,我好像又回到了小时候,感觉特别轻松快乐。
事实上,我认为最终极的黑话是数学,那可不是一般人想学就能学会的。而数学的目的是:以一种非常精确的方式交流思想和概念。比如你有一个仓库,里面有几万本书,每一页印的全是(1,3) 、(2,5)、(3,7)、(4,9)...,里面包含的信息量其实相当少。小学保送初中的你肯定也能猜到,这几万本书无非表达了:
我们能够进行信息压缩的前提是数据本身有规律性,而我们懂得这种规律,也就是:知识。岔开说一句题外话,目前的大语言模型,使用几十PB的语料数据进行训练,得到几百G的参数文件,本质也是一种信息压缩。OpenAI的首席科学家Ilya有个信念:如果你能高效压缩信息,你一定已经得到知识,不然你没法压缩信息。也就是说,他相信人工智能模型在训练的过程中学到了真正的“知识”,而不仅仅是学会怎么操作那些字符,这也是他们相信AGI能够实现很重要的一个原因。数学、成语、“颗粒度对齐”本身都没有什么问题,黑话也不是什么贬义词,黑话,是指在特定的社会群体、行业或组织中形成的一种非正式的、只有内部成员才能理解的语言或词汇。典型的比如财务报表这种会计语言,你很容易批评它不讲“人话”,但谈到如何改进它却并不容易。比如说商誉,你咋一看不容易理解,学习了才知道它表达的是:企业在收购其他企业时支付的超出净资产公允价值的那部分金额。想象一下,如果不使用这些黑话,在表达的时候会多么的“不精确"和繁琐?意思大概是聪明人喜欢整那些没有必要的复杂性,容易把简单的事情复杂化。
黑话只属于特定团体内部,如果你面对的是团体外的人,需要切换视角。这并不容易,我见过一些程序员在跨部门协作时、在跟外部客户沟通时,经常使用一些公司内部的专有术语而不自知。我所理解的所谓表达能力强,就是知道听众不知道什么,然后能用匹配听众认知水平的方式进行表达。如果所有观点都要被拉到力求每个人都能读懂的最低的共同标准上,那这对创作者而言也过于不公了。这并不是在批评大众的无知,而是在提醒各位无论内容的载体或者媒介如何变化,知识壁垒从来没有消除,内容和受众间的双向筛选天然具有正当性。