师文、李锦辉 | 算法影响下的新闻多样性:基于预选与自选个性化的ABT研究

体娱   2025-01-21 00:02   浙江  


本期“算法研究”专题以编译的形式推荐论文News Diversity Under Algorithms: The Effects of Pre-Selected and Self-Selected Personalization on Chinese TikTok (Douyin)文章探讨了算法与用户行为交互下新闻多样性的动态变化。该文章发表在新闻学领域的国际顶级期刊 Digital Journalism 上,根据Journal Citation Reports(JCR)的数据,该期刊在传播学分区为一区,2023年影响因子为5.2,五年影响因子为7.2。


作者:师文,暨南大学新闻与传播学院副教授

李锦辉(通讯作者),暨南大学新闻与传播学院教授


【摘要】现有的新闻学研究已关注到,在算法驱动的社交媒体环境中,用户面临着新闻接触的有限性问题。本研究通过虚拟代理测试(Agent-based Testing, ABT),以国内某算法短视频平台为数据来源,探讨了算法与用户行为交互下新闻多样性的动态变化。研究结果表明,相较于无算法的随机推荐情况,算法驱动的个性化新闻消费呈现出更高的新闻类别多样性。此外,算法推荐比用户的自主选择更有效地促进用户接触不同主题的新闻内容。研究进一步探究了用户如何通过调整兴趣偏好范围和主动接触与其兴趣不匹配的信息内容,来实现更均衡的新闻消费。这些发现对于深入理解算法如何塑造用户的新闻消费模式,以及评估用户能否通过调整自身新闻接触行为来推动新闻环境的多样性,具有重要意义。


【关键词】新闻多样性;算法审计;用户能动性;个性化算法

------------------------------


原文首发于Digital Journalism,参考文献详见原文,学术引用亦请参考原文,DOI: https://doi.org/10.1080/21670811.2025.2450312


一、引言

个性化推荐算法如何影响新闻多样性仍缺乏充分研究。已有研究区分了预选个性化和自选个性化,预选个性化(Pre-Selected Personalization)指由算法决策驱动的个性化,通常没有用户的刻意思考和输入。自选个性化(Self-Selected Personalization)指的是人们倾向于接触志同道合的观点,这在心理学中常被概念化为选择性接触(selectiveexposure)或确认偏误(confirmation bias)。以往研究多将新闻多样性的缺失归因于自选个性化,认为算法只是放大了用户既有的偏好与信念。然而,越来越多的研究开始反思预选个性化的作用,强调了用户能动性在个性化传播中的局限性。在新兴的算法驱动型社交平台上,新闻多样性究竟在多大程度上由用户和算法决定,仍需要进一步的实证探索。


本研究通过虚拟代理测试(ABT),对国内某短视频平台进行审计,探讨用户行为与算法交互的复杂作用如何影响新闻多样性


二、研究问题


RQ1:新闻多样性在以下三种条件下是否有所不同?

(1)没有推荐算法(即随机推荐)时;

(2)仅存在预选个性化(即无用户明确兴趣偏好)时;

(3)同时存在预选个性化和自选个性化时。


RQ2:自选个性化广度的增加是否能有效提升新闻多样性?


RQ3:自选个性化强度的减少是否能有效提升新闻多样性?


三、研究方法


本研究开发了一种虚拟代理测试(ABT)实验方法,使用自动化程序脚本控制虚拟手机,模拟人类用户与推荐算法进行互动,该方法在严格控制变量的条件下,捕捉算法输出以推断其运作机制,其实验设计如下:


1. 预实验

目标是获取平台上用户可接触到的新闻来源,并获取新闻主题分类。实现方法为令对新闻的兴趣程度分别为高和低的虚拟用户浏览视频,记录其接触的新闻信源,并采集其发布的新闻视频,根据视频标签进行主题划分。


2. 控制实验

本研究通过三项控制实验探讨了不同条件下算法推荐的影响,以回答研究问题RQ1、RQ2和RQ3。


在实验1中,通过设置不同的观看策略条件,考察了预选个性化和自选个性化的交互作用。条件1–2和条件1–3分别代表代理对新闻相关视频表现出无兴趣和明确兴趣的情况,以展示仅预选个性化和预选个性化与自选个性化混合的情境。为建立基准比较,设定了两个随机场景(条件1–1a和条件1–1b),在这些场景中,用户从同期新闻池中随机抽取新闻,无个性化影响。


实验2探讨了自选个性化的广度对推荐内容的影响。广度通过代理明确表现兴趣的新闻主题数量操作化为2个、5个和8个,分别对应条件2–1、2–2和2–3(从已识别的10个新闻主题中选择)。


实验3则聚焦自选个性化的强度,以代理对非初始偏好新闻主题表现明确兴趣的概率操作化。高概率表示低强度的自选个性化。该概率在条件3–1、3–2、3–3和3–4中分别设置为0%、25%、50%和75%。

图1:实验组设计情况


3.新闻多样性的测量

本研究聚焦于用户接触到的新闻主题的多样性。“多样性”的测量通常基于两个维度:类别的数量和这些类别中元素的分布。理想的多样性状态是类别均匀分布。本研究采用了香农熵量化计算新闻类别多样性,具体计算公式为:


在公式中,pi表示第i个新闻主题类别的比例,其中类别i = 1到10。为了避免当pi = 0时公式结果未定义,加入了常数ε = 0.001。如果获推的新闻类别更多且这些类别的分布更加均匀,新闻多样性将增加。


四、研究结果

(一)预选与自选个性化对新闻多样性的影响


实验结果表明,实验1的三个条件下,新闻多样性存在显著统计差异(p < 0.001)。事后检验显示,相较于同时包含预选和自选个性化的条件(条件1-3),仅通过预选个性化的推荐(条件1-2)显著提高了新闻多样性。然而,这两种个性化条件下的新闻多样性均显著高于随机偶遇的场景(条件1-1a和条件1-1b)。因此,研究结果验证了算法在增强用户接触多样化新闻主题方面的有效性,尤其是在完全由算法决定推荐内容的情况下。


(二)自选个性化广度对新闻多样性的影响


实验2发现,自选个性化广度的变化显著影响新闻多样性(p < 0.001)。然而,进一步分析表明,只有当用户对更多主题表现明确兴趣(条件2-3)时,新闻多样性显著提高,而低等广度(条件2-1)与中等广度(条件2-2)之间,以及中等广度与高等广度之间并未表现出显著差异。这表明,除非用户在多个新闻主题上的兴趣显著增加,否则新闻多样性不会得到显著改善。


(三)自选个性化强度对新闻多样性的影响


实验3的结果表明,自选个性化的强度对新闻多样性有显著影响(p < 0.001)。有趣的是,只有当用户将自选个性化强度降低至最低水平(即对不匹配内容表现出明确兴趣的概率为75%)时,新闻多样性才会显著提高。例如,从0%到75%、从25%到75%以及从50%到75%的变化均提升了新闻多样性。然而,如果自选个性化强度未达到这一水平,新闻多样性则不会显著变化。


五、讨论

(一)个性化算法中的新闻多样性动态


结果表明,相较于随机推荐,基于算法的个性化新闻消费更具多样性和平衡性。这一发现与“自动化偶然性”理论相符,即算法推荐有助于用户接触到通常不会遇到的新闻来源。这一现象可能源于算法开发者为避免用户厌倦显而易见的推荐内容,而尝试提供更具差异性的新闻。研究还证实,用户偏好的介入可能削弱新闻多样性。因此,算法本身不应被简单地视为限制多样性的原因;相反,它可以成为提升新闻多样性的潜在推动力。


研究进一步揭示了社交媒体平台算法中“去中心化”与“多元化中心化”之间的内在张力。一方面,尊重个体选择的去中心化机制可能导致信息接触的碎片化和偏向化,从而削弱公共话语的基础。另一方面,注重多样性的算法能够集中公共注意力,防止用户沉浸于极端或错误信息中,提供一个兼具统一性与多样化的新闻内容集合。然而,需要警惕的是,算法策划的多样性依然受平台控制,并不一定是真正的多样性。


(二)新闻多样性问题中的算法-用户能动性


本研究对人类行为的两个重要维度,即自选个性化的广度和强度,对内容多样性的影响进行了概念化和建模。研究发现,尽管用户可以通过观看策略表达对新闻的兴趣,但其实际对新闻多样性的影响有限;当用户大幅增加自选个性化的广度或减少其强度时,新闻多样性会有所提升。然而,这种新闻消费行为的显著转变在现实中是否普遍存在仍待确认。上述发现表明算法在新闻策展中的 “家长制”作风,并呼吁对推荐算法中人类与机器行为之间的关系进行审查,以促进更大的知情性,并实现更加平衡的人机权力动态。




本文转自 | 清华大学智能与科技应用传播

再建巴别塔
青灯夜读,湖畔沉思。精读人文社科经典文献,探讨新闻传播学术问题。
 最新文章