大语言模型的机制设计

文摘   科技   2024-01-30 11:10   广东  

作者:徐睿辰

大语言模型的机制设计(图片来自于网络)

研究背景

当前,网络生态系统主要依靠拍卖决定向用户展示哪些广告和商业信息。在拍卖过程中,广告商通过竞标获得向用户展示创意与内容的机会。许多常见的网络格式,如文本、横幅、视频、应用程序等,都其独特的特征。根据这些特征,广告发布商开发出相应的拍卖工具对它们进行拍卖。相比之下,目前AI生成内容格式作为一种新兴的潜在的广告载体,缺乏一套成熟有效的拍卖机制来进行广告的发布。本文作者探讨了如何利用拍卖机制影响大模型生成输出,从而实现广告的发布。


作为一项新兴技术,大语言模型在广告拍卖机制设计上提出了新挑战。大语言模型的一些新的特征以及需求包括:

  • 用户偏好的建模:拍卖理论通常通过价值函数对用户偏好进行建模,每个拍卖结果对应一种用户的效用。然而,大语言模型是生成模型,它们不会为每个拍卖结果分配效用,而是通过神经网络模型隐含地编码用户对分配结果的偏好,并输出连续概率分布。

  • 随机的必要性:大语言模型在很大程度上依赖于输出随机性。如果被大语言模型被强制输出确定结果,大语言模型的性能会因此变差。所以,聚合大语言模型输出的拍卖机制的输出结果也必须服从一个概率分布。

  • 技术的兼容性:拍卖解决方案应与当前的大语言模型技术保持技术兼容。它们应该仅使用当前模型可用的信息,并且易于集成到系统中。理想情况下,分配和支付应通过对大语言模型输出的简单操作获得。

  • 计算的高效性:由于大语言模型模型的查询成本很高,拍卖结果的计算不应增加过多的查询开销。具体来说,拍卖不应增加模型推理的调用次数。

研究方法

本文设计了针对不同广告商偏好概率的拍卖方法,该方法应该满足

  • 支付单调性:当一个广告商的出价增加时,他的支付金额不应减少;

  • 聚合一致性:当一个广告商的出价增加时,他会获得更高的效用。

基于这两个性质,本文设计了一种大语言模型的微调方法,可以通过以下目标函数重新训练大语言模型进行广告商偏好概率的聚合 

 其中,散度 代表两种分布距离的计算函数,  对应每个用户的竞标结果。

研究结果

本文作者在存在两个竞标者的场景下对大语言模型拍卖结果进行仿真,其中

  代表了两个广告商投标的比例。

图1 生成结果示例

两个竞标者分别对应了Alpha航空公司和Beta度假村,他们都希望自己的内容被展示。该结果表明,大语言模型可以根据竞标结果生成对应的广告信息。图1中展示了生成结果的示例。我们可以看到,对于两种聚合函数,当𝜆从1减少到0时,生成的文本大致遵循以下模式:“仅Alpha航空公司”→“Alpha航空公司和Beta度假村都有”→“仅Beta度假村”。这是因为𝜆从1减少到0相当于投标𝑏2从0增加到∞,而投标𝑏1保持不变(或者投标𝑏1从∞减少到0,投标𝑏2保持不变)。

参考文献

[1] Duetting, P., Mirrokni, V., Leme, R. P., Xu, H., & Zuo, S. (2023). Mechanism Design for Large Language Models. arXiv preprint arXiv:2310.10826.

写在最后

我们的文章可以转载了呢~欢迎转载转发

想了解更多前沿科技与资讯?

点击上方入口关注我们!

欢迎点击右上方分享到朋友圈

香港中文大学(深圳)

网络通信与经济实验室

微信号 : ncel_cuhk


网络通信与经济
介绍网络、通信和经济交叉领域的最新科研成果和活动 —香港中文大学(深圳)网络通信与经济学实验室
 最新文章