KDD 2025 | 新大、新国大等提出ProNoG：非同配图上的提示学习

科技 2024-12-13 12:12 北京

©PaperWeekly 原创 · 作者 | 于星橦

单位 | 新加坡管理大学博士后

个人主页 | https://xingtongyu.netlify.app/

摘要

现实世界中不同对象之间的复杂关系可以用图来表示，而图神经网络是图学习的主流技术，但其性能在很大程度上依赖于大量的标注数据。

为了减少对有标注数据的需求，预训练和提示学习方法已成为一种流行的解决方案。然而，现有的提示方法并未区分现实世界中图的同配和异配性：许多现实世界的图是非同配的，并非严格的同配或异配，而是混合了同配和异配模式，在不同的图和节点中表现出不同的非同配性质。

在本文中，我们提出了 ProNoG，一种针对这些非同配图的新型预训练和提示学习框架。

论文题目：

Non-Homophilic Graph Pre-Training and Prompt Learning

论文链接：

https://arxiv.org/pdf/2408.12594v2

代码链接：

https://github.com/Jaygagaga/ProNoG/tree/main

论文录用：

The ACM SIGKDD Conference on Knowledge Discovery and Data Mining Research Track 2025

首先，我们分析了现有的图预训练方法，提供了非同配图上预训练任务选择的理论分析。其次，我们认识到每个节点都具有独特的非同配特征，并提出了一种条件网络来表示下游任务中节点特定的非同配性质。我们通过在十个公共数据集上的广泛实验，评估和分析了 ProNoG，展现了其有效性。

理论分析：非同配图的预训练方法

本文理论分析了非同配图上图的对比学习预训练方法的优劣。首先，所有图对比学习方法可以定义为如下形式，其中为目标实例（节点/图），和分别代表的正负样本。

基于此，我们给出了两个定义：

定义 1：同配任务

在一个图上，一个预训练任务是一个同配任务，当且仅当：对于所有，所有，所有，满足以下条件：。相对地，不属于同配任务的任务被称为非同配任务。

定义 2：同配样本

在图上，考虑一个三元组，其中 , ，且。三元组是一个同配样本，当且仅当：。否则，它是一个非同配样本。

我们在下表中提供了一些常见的同配任务和非同配任务的细节。

基于此定义，我们证明了两个定理：

定理1：对于一个同配任务，加入一个同配样本总是会比加入一个非同配样本导致更小的损失。

定理2：考虑图上的标签映射函数，令为映射的标签。假设该标签映射满足以下条件：

。令表示图上同配任务的同配样本的期望数量。那么，随着相对于定义的同配率的增加，单调递增。

基于上述两条定理，我们可以得出结论：对于非同配图，特别是同配率低的图，使用非同配任务往往比使用同配任务具有更大的优势。本文中我们使用 GraphCL 作为预训练任务。

方法：非同配图的提示学习

我们提出了 ProNoG ：针对非同质性图的提示学习框架。其中包含两个部分：提示的生成和提示的优化过程。

3.1 提示生成

在非同配图中，不同的节点表现出独特的非同配性。具体来说，不同的节点通常具有多样的同配率，这表明它们与邻居节点之间存在不同的拓扑结构。此外，即使同配率相似的节点，其邻域分布也可能由于邻居节点的同配率不同而存在差异。

因此，与标准图提示学习中为所有节点学习单一提示的方法不同，我们设计了一个条件网络来生成一系列基于非同配特性的条件提示。由此，为每个节点都生成了自己独特的提示，旨在适应其独特的非同配特性。

首先，我们通过节点的多跳邻域来表示其非同配特性。具体来说，对于一个给定的节点，我们读取其 -跳的子图，包含节点及在最多步内可从到达的节点。

我们通过以节点 v 与其邻居之间的相似性作为权重读取子图表示，如图 2(c) 所示，从而获得子图的表示，其公式如下：

，其中，表示中节点的数量。

然后，对于每个下游任务，我们的目标是为每个节点分配一个唯一的提示向量。然而，直接对这些提示向量进行参数化会显著增加可学习参数的数量，这可能会导致在少样本场景中过拟。

为了以最少的参数满足每个节点的独特非同配特性，我们提出条件网络来生成节点特定的提示向量。

具体来说，以节点的子图表示作为条件，条件网络生成一个关于任务的节点的唯一提示向量，表示为，如下所示：，其中，是由参数控制的条件网络。它输出一个唯一的提示向量，该向量根据条件变化，表示节点的非同配特性。

需要注意的是，这是一种超网络的形式，它使用一个次级网络生成主网络中基于输入特征的参数。在我们的场景中，条件网络是次级网络，用于生成提示参数，而不会扩展主网络中可学习参数的数量。

3.2 提升优化

在本文中，我们关注两种常见的下游任务：节点分类和图分类。提示优化过程并不直接优化提示向量，而是优化条件网络，该网络随后为给定的下游任务生成提示向量。

我们利用基于节点/图相似性的损失函数，对于一个标注训练集 \）的任务，其中可以是一个节点或一个图，是来自类别集合的的类别标签。

下游任务的损失函数为：

其中，表示任务中节点 /图的输出嵌入。在提示调优过程中，我们仅更新条件网络的轻量化参数，同时冻结预训练 GNN 的权重。因此，我们的提示调优具有参数高效性，并且适合少样本场景。

实验

我们在八个基准数据集上进行了全面的实验，以评估所提出的 ProNoG 在少样本节点分类和图分类任务上的有效性。

4.1 少样本学习表现

4.1.1 1-shot节点分类和图分类

我们观察到：ProNoG 在所有设置中均超越了基线方法，节点分类的表现比最好的竞争方法高出多达 21.49%，图分类高出 6.50%。这些结果表明，ProNoG 在从非同配图中学习先验知识以及捕捉节点特定非同配特性方面具有很高的有效性。

4.1.2 有标签样本数目的影响

为了评估 ProNoG 在不同标注数据量下的性能，我们在下游任务中改变样本数量。需要注意的是，由于 Wisconsin 和 Cornell 数据集中节点数量有限，我们仅执行最多 3-shot 的任务。我们观察到：ProNoG 在标注数据非常有限的低样本场景（例如）下显著超越所有基线方法，展现了我们方法在这些情况下的有效性。

4.2 消融实验

为了全面了解 ProNoG 中每个部分的影响，我们进行了消融实验分析,证明了每个部件的重要性。

4.2.1 同配和非同配任务比较

我们分别对比了同配任务（两种不同的链接预测），以及两种不同的非同配任务（GraphCL 和 DSSL ）。我们观察到，对于具有低同配率的图，非同配任务显著优于同配任务。相反，对于具有高同配率的图，这两种方法的结果各有其优劣势。

4.2.2 不同同配特性的节点分析

我们计算了在具有不同同配率的节点组上的准确率，并观察到，ProNoG 在所有同配特性的节点上始终优于其他模型或有竞争力，无论其同配率如何。这些结果进一步证明了 ProNoG 在捕捉节点同配特性方面的有效性，并突出了我们提出的条件提示方法的优势。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

📝 稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道：

• 投稿邮箱：hr@paperweekly.site

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

最新文章

大语言模型的知识蒸馏（KD）应该用Reverse KL？

AAAI 2025 | 基于自适应图结构和动态原型对比学习的空间多组学解析框架

超越ControlNet++！腾讯优图提出动态条件选择新架构DynamicControl

北京内推 | 高通中国招聘端到端AI模型量化研发实习生

低秩近似之路（四）：插值分解（Interpolative Decomposition）

NeurIPS 2024 | 基于信息论，决策模型有了全新预训练范式统一框架

直播预告 | 香港中文大学王文轩博士：可信大模型的测试与评估

北京内推 | 微软亚洲研究院通用人工智能组招聘大模型算法实习生

GPT-4o掀起全模态热潮！一文梳理全模态大模型最新研究进展

南加大团队提出MARVEL：基于认知科学的多维抽象视觉推理基准测试

AAAI 2025 | 浙大、蚂蚁等提出全新跨域微调框架，构筑更好的大模型隐私保护

博后招募 | 复旦大学肖仰华教授课题组招聘大模型数据科学博士后研究员

今年顶会这情况。。。大家提前做准备吧！

NeurIPS 2024 | 如何缓解长文本情境下的中间信息丢失问题？

Tokenization不存在了？Meta最新研究，无需Tokenizer的架构来了

直播预告 | 香港中文大学王文轩博士：可信大模型的测试与评估

直播预约 | 字节跳动豆包大模型团队NeurIPS 2024中选论文今晚精讲！

北大团队提出ConsisID：基于频域分解的身份保真文本到视频生成模型

GPT-4其实根本听不懂声音？港中文、斯坦福等联合打造视觉听觉评估新基准

北京内推 | 阿里妈妈搜索广告算法团队招聘广告算法实习生

为什么说在中国做科研最忌讳踏实？

纯文本对齐就能解决多模态安全问题？上海AI Lab发布VLSBench给出否定答案

模仿、探索与自我提升：慢思考推理系统的复现之路

博士申请 | 密歇根大学计算机视觉实验室高俊老师招收3D生成方向博士生

AAAI 2025接收结果出炉！Mamba魔改再次爆发

KDD 2025 | 新大、新国大等提出ProNoG：非同配图上的提示学习

谷歌“狙击”OpenAI，发布新一代大模型Gemini 2.0！主打Agent+多模态

北京内推 | 启元实验室大模型团队招聘多模态大模型算法实习生

NeurIPS 2024 | 阿里云提出个性化提示策略IAP，突破大语言模型零样本推理局限

苹果发布视频生成大模型STIV，实现可扩展的文本与图像条件视频生成

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

博士申请 | 伊利诺伊大学香槟分校张欢老师招收人工智能全奖博士/硕士/博后/实习生

Muon优化器赏析：向量与矩阵有何本质区别？

NeurIPS 2024 | 中科院自动化所提出MetaLA！线性模型架构的大一统

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

上海内推 | 中国电信人工智能研究院招聘智能编码方向算法实习生

NeurIPS 2024 | 让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命

北理工重磅开启「流星雨计划」，深度探究大模型的自我进化能力

博士申请 | 香港城市大学苗宁老师招收LLM Reasoning方向全奖博士/RA

简单有效！Vector Quantization的又一技巧：给编码表加一个线性变换

CIKM 2024 | 通过学习相对偏好，利用预训练语言模型缓解流行度偏差

UCL、上交大等提出自然语言强化学习范式：可处理语言反馈的强化学习框架

北京师范大学智能技术与教育应用教育部招聘工程研究中心科研助理

ACL 2024 | 多快好省！上科大提出层间KV共享的大模型高效推理新方法

上海AI Lab提出Critic-V框架：提升视觉语言模型在多模态推理中的准确性与可靠性

NeurIPS 2024 | 哈工深提出新型智能体Optimus-1，横扫Minecraft长序列任务

博士申请 | 南京大学-NTU-CMU招收人工智能方向联培博士/实习生

【内含双12福利】今年读过最绝的一本LLM书！下载量10W+！看完少走一半弯路

阿里通义实验室发布IOPO，提升LLM复杂指令遵循能力

准确性超Moshi和GLM-4-Voice！端到端语音双工模型Freeze-Omni

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

​KDD 2025 | 新大、新国大等提出ProNoG：非同配图上的提示学习

摘要

KDD 2025 | 新大、新国大等提出ProNoG：非同配图上的提示学习