Google DeepMind的研究人员提出了MoE Tiebreak泄漏攻击,通过操控MoE路由行为来推断用户提示,该方法利用了模型在平局决策中的确定性行为,从而泄露提示信息。这一攻击过程包括三大组件:令牌猜测、专家缓冲区操作和路由路径恢复,展示了MoE架构中未被重视的侧信道攻击向量,并强调在优化模型时需要考虑隐私保护。
参考:
https://arxiv.org/abs/2411.02571
点个分享、点赞与在看,你最好看~
Google DeepMind的研究人员提出了MoE Tiebreak泄漏攻击,通过操控MoE路由行为来推断用户提示,该方法利用了模型在平局决策中的确定性行为,从而泄露提示信息。这一攻击过程包括三大组件:令牌猜测、专家缓冲区操作和路由路径恢复,展示了MoE架构中未被重视的侧信道攻击向量,并强调在优化模型时需要考虑隐私保护。
参考:
点个分享、点赞与在看,你最好看~