方法简介
感知系统:社交平台和事实检测平台依赖事先制定的虚假信息检测政策,来实现对虚假内容的有效识别和可信检测。TELLER的感知系统充分利用这些由人类专家提供的知识,生成逻辑谓词,并通过先进的语言模型进行推理。给定一则新闻文本,感知系统会基于文本内容为逻辑谓词赋值,生成可读的逻辑原子。对于每个逻辑原子 p,其真值 μ 由语言模型(如FLAN-T5 或 Llama 2)进行推理判断。我们测试了多种语言模型,包括未经过微调的FLAN-T5(780M、3B、11B版本)和Llama 2(7B、13B版本)。检测结果表明,对于依赖背景信息或者不涉及复杂推理的虚假新闻,当能够获取足够的背景信息时,即使是780M版本的FLAN-T5模型,也能有效驱动感知过程。
决策系统: TELLER的决策系统使用我们改进的可微分的神经符号模型DNF( Disjunctive Normal Form)来处理逻辑原子,通过梯度更新,从数据集学习可解释的逻辑规则,逻辑规则的语义包含了与,或,非三种常见的逻辑操作符和他们的组合。DNF的公式表达如下:
实验评估
论文信息