本期“算法研究”专题以编译的形式推荐论文
作者:师文,暨南大学新闻与传播学院副教授
李锦辉(通讯作者),暨南大学新闻与传播学院教授
【摘要】
【关键词】新闻多样性;算法审计;用户能动性;个性化算法
------------------------------
原文首发于Digital Journalism,参考文献详见原文,学术引用亦请参考原文,DOI: https://doi.org/10.1080/21670811.2025.2450312
一、引言
个性化推荐算法如何影响新闻多样性仍缺乏充分研究。已有研究区分了预选个性化和自选个性化,
本研究通过虚拟代理测试(ABT),对国内某短视频平台进行审计,探讨用户行为与算法交互的复杂作用如何影响新闻多样性。
二、研究问题
RQ1:新闻多样性在以下三种条件下是否有所不同?
(1)没有推荐算法(即随机推荐)时;
(2)仅存在预选个性化(即无用户明确兴趣偏好)时;
(3)同时存在预选个性化和自选个性化时。
RQ2:自选个性化广度的增加是否能有效提升新闻多样性?
RQ3:自选个性化强度的减少是否能有效提升新闻多样性?
三、研究方法
本研究开发了一种虚拟代理测试(ABT)实验方法,使用自动化程序脚本控制虚拟手机,模拟人类用户与推荐算法进行互动,该方法在严格控制变量的条件下,捕捉算法输出以推断其运作机制,其实验设计如下:
1. 预实验
目标是获取平台上用户可接触到的新闻来源,并获取新闻主题分类。实现方法为令对新闻的兴趣程度分别为高和低的虚拟用户浏览视频,记录其接触的新闻信源,并采集其发布的新闻视频,根据视频标签进行主题划分。
2. 控制实验
本研究通过三项控制实验探讨了不同条件下算法推荐的影响,以回答研究问题RQ1、RQ2和RQ3。
在实验1中,通过设置不同的观看策略条件,考察了预选个性化和自选个性化的交互作用。条件1–2和条件1–3分别代表代理对新闻相关视频表现出无兴趣和明确兴趣的情况,以展示仅预选个性化和预选个性化与自选个性化混合的情境。为建立基准比较,设定了两个随机场景(条件1–1a和条件1–1b),在这些场景中,用户从同期新闻池中随机抽取新闻,无个性化影响。
实验2探讨了自选个性化的广度对推荐内容的影响。广度通过代理明确表现兴趣的新闻主题数量操作化为2个、5个和8个,分别对应条件2–1、2–2和2–3(从已识别的10个新闻主题中选择)。
实验3则聚焦自选个性化的强度,以代理对非初始偏好新闻主题表现明确兴趣的概率操作化。高概率表示低强度的自选个性化。该概率在条件3–1、3–2、3–3和3–4中分别设置为0%、25%、50%和75%。
图1:实验组设计情况
3.新闻多样性的测量
本研究聚焦于用户接触到的新闻主题的多样性。“多样性”的测量通常基于两个维度:类别的数量和这些类别中元素的分布。理想的多样性状态是类别均匀分布。本研究采用了香农熵量化计算新闻类别多样性,具体计算公式为:
在公式中,pi表示第i个新闻主题类别的比例,其中类别i = 1到10。为了避免当pi = 0时公式结果未定义,加入了常数ε = 0.001。如果获推的新闻类别更多且这些类别的分布更加均匀,新闻多样性将增加。
四、研究结果
(一)预选与自选个性化对新闻多样性的影响
实验结果表明,实验1的三个条件下,新闻多样性存在显著统计差异(p < 0.001)。事后检验显示,相较于同时包含预选和自选个性化的条件(条件1-3),仅通过预选个性化的推荐(条件1-2)显著提高了新闻多样性。然而,这两种个性化条件下的新闻多样性均显著高于随机偶遇的场景(条件1-1a和条件1-1b)。因此,研究结果验证了算法在增强用户接触多样化新闻主题方面的有效性,尤其是在完全由算法决定推荐内容的情况下。
(二)自选个性化广度对新闻多样性的影响
实验2发现,自选个性化广度的变化显著影响新闻多样性(p < 0.001)。然而,进一步分析表明,只有当用户对更多主题表现明确兴趣(条件2-3)时,新闻多样性显著提高,而低等广度(条件2-1)与中等广度(条件2-2)之间,以及中等广度与高等广度之间并未表现出显著差异。这表明,除非用户在多个新闻主题上的兴趣显著增加,否则新闻多样性不会得到显著改善。
(三)自选个性化强度对新闻多样性的影响
实验3的结果表明,自选个性化的强度对新闻多样性有显著影响(p < 0.001)。有趣的是,只有当用户将自选个性化强度降低至最低水平(即对不匹配内容表现出明确兴趣的概率为75%)时,新闻多样性才会显著提高。例如,从0%到75%、从25%到75%以及从50%到75%的变化均提升了新闻多样性。然而,如果自选个性化强度未达到这一水平,新闻多样性则不会显著变化。
五、讨论
(一)个性化算法中的新闻多样性动态
结果表明,相较于随机推荐,基于算法的个性化新闻消费更具多样性和平衡性。这一发现与“自动化偶然性”理论相符,即算法推荐有助于用户接触到通常不会遇到的新闻来源。这一现象可能源于算法开发者为避免用户厌倦显而易见的推荐内容,而尝试提供更具差异性的新闻。研究还证实,用户偏好的介入可能削弱新闻多样性。因此,算法本身不应被简单地视为限制多样性的原因;相反,它可以成为提升新闻多样性的潜在推动力。
研究进一步揭示了社交媒体平台算法中“去中心化”与“多元化中心化”之间的内在张力。一方面,尊重个体选择的去中心化机制可能导致信息接触的碎片化和偏向化,从而削弱公共话语的基础。另一方面,注重多样性的算法能够集中公共注意力,防止用户沉浸于极端或错误信息中,提供一个兼具统一性与多样化的新闻内容集合。然而,需要警惕的是,算法策划的多样性依然受平台控制,并不一定是真正的多样性。
(二)新闻多样性问题中的算法-用户能动性
本研究对人类行为的两个重要维度,即自选个性化的广度和强度,对内容多样性的影响进行了概念化和建模。研究发现,尽管用户可以通过观看策略表达对新闻的兴趣,但其实际对新闻多样性的影响有限;当用户大幅增加自选个性化的广度或减少其强度时,新闻多样性会有所提升。然而,这种新闻消费行为的显著转变在现实中是否普遍存在仍待确认。上述发现表明算法在新闻策展中的 “家长制”作风,并呼吁对推荐算法中人类与机器行为之间的关系进行审查,以促进更大的知情性,并实现更加平衡的人机权力动态。
本文转自 | 清华大学智能与科技应用传播