作者:何均懿
图一:平台与用户之间的交互
研究背景
在互联网经济的快速增长下,众多信息导向型和基于众包的平台(如Waze或 Xiaohongshu)应运而生。这些平台为每个兴趣点(PoI)维护与变化状态信息相关的信息记录。此外,这些平台通常以基于用户众包的方式运作,依赖于用户收集PoI的实时信息。然而,用户在提供信息时会承担成本,平台需要通过奖励机制来激励用户。在实践中,用户成本及其分布对平台来说是未知的,这使得确定最优奖励变得具有挑战性。
研究问题
本文研究信息平台如何激励用户获取新鲜信息。更大的奖励将激励更多的用户,并导致更频繁的信息提供,从而降低平台信息记录的年龄。然而,更大的奖励也会增加平台的费用。因此,平台的高效运行涉及两个关键的性能标准:信息年龄(AoI)和奖励支出(OpEx)。理想情况下,该平台希望在所需的权衡下(例如,最小化加权和)共同减少AoI和OpEx。然而,对于平台来说,实现这一目标是具有挑战性的。这是因为用户提供信息所产生的成本是他/她的私人信息,因此对他人来说是隐藏的。这就引出了本文的关键问题:如何奖励用户以实现AoI和OpEx之间的预期权衡。
研究结果
本研究提出了一种基于年龄的奖励机制,该机制将操作支出(OpEx)与未知成本分布解耦,使平台能够准确控制其OpEx。我们利用这种奖励机制,提出了一种指数离散化和学习(EDAL)策略,用于平台运营。我们证明了EDAL策略的性能渐近地等同于基于成本分布得出的最优决策。
图二:EDAL策略的累积遗憾
图2评估EDAL策略(基于基于年龄的奖励方案)在学习方面的性能。我们评估了EDAL政策产生的累计的遗憾。图2显示了EDAL策略的性能,其中每条带标记的曲线表示多次模拟运行的平均结果。每个子图中的三条曲线对应不同数量的POI,即N∈{1,2,3}。我们有两个方面的阐述:图2(a)显示了EDAL政策所取得的累积遗憾。总体而言,累积遗憾按照亚线性顺序增加,这意味着平台运营的渐近最优性。此外,更大的N将扩大操作决策的维度,从而导致图5(a)中更大的遗憾•图2(b)显示了EDAL政策实现的累计运营成本与最佳产出的比率。请注意,这三条曲线逐渐收敛为1。因此,EDAL政策(基于基于年龄的奖励方案)的表现与最佳情况一样好。
参考文献
[1] The Power of Age-based Reward in Fresh Information Acquisition. Zhiyuan Wang, Qingkai Meng, Shan Zhang, Hongbin Luo. IEEE INFOCOM 2023
写在最后
我们的文章可以转载了呢~欢迎转载与转发呦
想了解更多前沿科技与资讯?
点击上方入口关注我们!
欢迎点击右上方分享到朋友圈
香港中文大学(深圳)
网络通信与经济实验室
微信号 : ncel_cuhk