近日,第30届数据库系统高级应用国际会议(The International Conference on Database Systems for Advanced Applications, 简称DASFAA)在新加坡举办。我院题为《HBS-KGLLM: A General Framework for Generating Knowledge Graphs for Jailbreaking》的论文荣获DASFAA 2025最佳学生论文奖(唯一)。我院硕士研究生赵鑫喆为第一作者,李博涵副教授为通讯作者。
图1.大会程序联合主席、新加坡管理大学朱飞达教授为赵鑫喆颁奖
该论文提出一种通用且高效的LLMs安全边界探测框架HBS-KGLLM,首次以LLMs增强KG的方式,来挖掘LLMs中有关有害信息的结构化知识,最终越过LLMs的安全防护,实现内容安全边界探测。该方法由三部分核心组件构成:(1)有害行为替代(Harmful Behavior Substitution),(2)知识图谱模板嵌套(KG Template Nesting),以及(3)知识图谱转文本(KG-to-Text Conversion)。作者通过5款当前适用于测试的LLMs上对HBS-KGLLM进行了评估,涵盖开源与闭源模型。实验结果表明,与现有主流基线方法相比,HBS-KGLLM在显著提高攻击成功率的同时,亦大幅降低了时间与经济成本。以GPT-4为例,该方法在攻击成功率方面相比当前最优方法提升约25%,同时单样本成功攻击所需时间缩短近55%。HBS-KGLLM的提出为大语言模型安全性研究提供了高效、通用的安全边界探测新范式,有望推动模型防御机制和知识驱动对抗方法发展。
图2.HBS-KGLLM框架图
DASFAA是数据库领域的重要国际学术会议之一,具有广泛的国际影响力。该会议每年举办一次,吸引全球众多研究者和工程师参与,涵盖主题包括数据挖掘、大数据管理、人工智能与数据库融合、信息检索、区块链等前沿领域。本届DASFAA 2025会议共收到731篇论文投稿,236篇论文被接收,其中长文接收率为18.7%。经过DASFAA 2025程序委员会评审,本次会议评选出最佳论文奖1篇、最佳学生论文奖1篇、最佳论文提名奖1篇、最佳演示论文奖1篇。
图3.获奖证书(8位作者)