清代的文字狱与自我审查

文摘   2024-11-06 15:11   江苏  

『柏拉图说』是由南京大学计算传播学实验中心的成员们于20224月发起的论文精读与推介活动,我们将定期推送新闻传播学TOP期刊最新内容、新闻传播学前沿及相关量化研究方法论文。我们致力于深耕传播学领域,紧跟专业研究热点,延伸学术视角,拓展群体智慧。

柏拉图说 论文推介第 160 



Li, P. (2023). The sin of words: Censorship and self‐censorship in China during the Qing dynasty (1644–1911). Asia‐Pacific Economic History Review, 63(2), 145–165. https://doi.org/10.1111/aehr.12268


摘要

本研究探讨了清代中国大规模审查运动对知识分子著作的影响。该研究采用双重差分法分析了 23,000 首诗歌,结果显示受审查的知识分子所写诗歌中受审查词语的频率显著下降,没有通过同音字、分词和异体字来规避审查的可能。机器学习分析表明审查运动影响了知识分子的写作风格,并使其逐渐远离受审查的题材。这场运动造成了巨大的政治压力,导致了自我审查,但其对用词选择的长期影响微乎其微。

研究背景

1.审查制度的历史普遍性:审查制度在历史上多国有之,中国现今的审查制度有其历史根源,本研究旨在探究古代独裁者实现政治控制的方式,补充前人对清代审查制度影响社会资本的研究。

2.清代文字狱的背景与目的

o清朝为外族统治,面临统治合法性挑战,通过推行传统制度与严厉审查运动来巩固统治,1645 - 1790 年发起文字狱,打压知识分子不忠行为

o文字狱的审查标准包括涉及清朝统一中国的敏感记载、侮辱统治阶级非汉族的前朝、赞扬过去反对派的行为含有边境地理信息、著名“反贼”的著作、质疑儒家经典等,目的是压制异议、塑造意识形态。

o文字狱案件数量在乾隆时期达到顶峰,随着《四库全书》的编纂接近尾声,乾隆认为所有问题的书籍都已被审查,文字狱结束。多数案件集中在长江流域,与进士密度分布相符,主要针对低级知识分子或地方精英,处罚残酷,多数主要嫌疑人被处死或遭受重刑。

 

左图为文字狱案件的时间分布,右图为文字狱案件的地理分布。

研究数据

1.敏感词汇来源:从《清代文字狱档》和《清朝文字狱》两本书中手动收集文字狱案件信息,确定敏感词汇。

2.诗歌数据来源:使用 1911 年清朝灭亡后出版的《晚晴簃诗汇》,包含 27000 首诗、6159 位诗人,通过《中国历代人物传记资料数据库》补充诗人出生和死亡年份信息,筛选出 2790 位诗人,以其诗歌为研究对象,统计每个诗人诗歌中每个字的出现频率,将 84 个敏感词汇作为处理组,2183 个非敏感词汇作为对照组。

研究结果

1.baseline结果见下表。Word frequency为词汇的出现频率,第一个自变量表示作者i是否经历过词汇w的审查期,第二个自变量衡量作者i的词汇w被审查的程度,计算方法如下:

 

大致为两次审查之间的年份与作者从五岁(此时具有读写能力)到死亡的年份取并集,除以作者从五岁到死亡的年份长度,再乘上审查的次数,如作者经历了多次审查,则将结果加总。

结果表明,如果作者生活在某个单词的审查期内,则被审查的单词会显著(10%)减少 1.65-1.73 个标准差(系数除以标准差,下同)。此外,额外的审查经历显著(5%)地将审查词的频率降低了 2.01-2.06 个标准差。作者还发现,满族诗人和旗人首领未减少使用敏感词汇,因为审查主要针对汉人。与其他文学形式相比,诗歌受审查影响更大,可能因其最先被审查且更能表达情感(见Appendix)

2.局部效应

结果见下表。censored prefecture/county表示作者是否来自有文字狱案件的府/县,结果显示审查是全国性运动,虽存在局部效应(仅第三栏),但整体上全国影响显著,可能是因为知识分子能知晓被审查内容,或者家人、出版商在出版前修改了作品。

3.逃避审查的替代方式

o谐音双关:根据《康熙字典》确定敏感词汇的 7660 个谐音词,筛选出 688 个用于分析,结果显示无论是用还是作为处理变量,系数均不显著(见下表),表明知识分子未通过谐音双关逃避审查。

o拆分字和异体字:找到 41 个与敏感词汇相关的拆分字,测试结果系数为正但不显著;对异体字的测试也未发现知识分子广泛使用异体字替代敏感词汇的证据。

4.写作风格的转变:采用机器学习模型计算诗歌与 46 个敏感词汇的相似度(用 Jaccard、Cosine 和 Cosine TFIDF 三种方法计算),结果显示 Jaccard 相似度系数显著为负,Cosine 相似度和 TF - IDF 评分系数为负但不显著(见下表),表明若诗人遭遇了审查写作风格会发生整体偏移,而非仅避免敏感词汇。

5.审查运动结束后的持续性检验 1790 年后文字狱是否继续阻止知识分子使用经过审查的词语,结果如下:

没有显著的系数。结果表明,审查制度对词语选择的影响在审查制度正式结束后并未持续存在。十九世纪,清政府在许多领域逐渐失去控制,知识分子不再迫切需要在写诗时策略性地过滤他们的用词选择。

研究结论

1.清代文字狱使受审查作者诗歌中敏感词汇频率显著下降,引发自我审查,但审查运动结束后自我审查停止。

2.本研究揭示了清代审查制度对知识分子写作的影响,虽仅展示当时写作变化,但其对意识形态、社会资本和科学研究的长期影响值得想象,未来可研究 18 世纪大分流时期审查制度的作用。

文中提到的相关的计算历史叙事文献

检查诗歌中的态度与观点:Xue, M.M. (2020) High-value work and the rise of women: The cotton revolution and gender equality in China.

利用文本分析从民俗文学中得出文化特征:Xue, M.C.M. (2021) Autocratic rule and social capital: evidence from imperial China. SSRN 2856803.

 1911 年中国革命前夕的宣传中提取不同的情绪Li, P. (2022) Political Repression, Media Propaganda, and Nation-building. CU Boulder Working Paper in Economics No.22–04. SSRN 4424060.


作者信息

李佩源是昆山杜克大学政治经济学助理教授,他的研究涉及经济史、政治经济学和发展经济学的交叉领域。他在昆山杜克大学的教学兴趣包括中国的转型经济和应用统计方法的介绍。

分享者

张潇逸

XiaoyiZhang833.github.io

南京大学新闻传播学院2024级专业硕士研究生

南京大学计算传播学实验中心成员

研究方向:文本分析、新闻史

计算传播学园
寻找人类传播行为的基因,通往计算传播研究之路
 最新文章