2025年11月16日至2025年11月20日,国际软件工程领域会议the 40th IEEE/ACM International Conference on Automated Software Engineering (ASE 2025)在韩国首尔举办。在本次会议中,我们派出了2位白泽ers,带来了5场论文报告。在此期间,我们认识了许多来自世界各地的优秀科研人员,与大家共同度过了难得的交流时光,送出白泽自制的小礼物在学术交流之外,白泽ers还领略了首尔独特的城市风光,品尝了当地的特色美食
论文分享
论文分享Security Debt in LLM Agent Applications: A Measurement Study of Vulnerabilities and Mitigation Trade-offs

在这一工作中,白泽ers 分享了关于大语言模型智能体(LLM Agent)应用安全性的首个系统性研究成果。
随着 LLM Agent 应用在各领域的广泛普及,其潜在的安全风险也日益凸显。为了有效应对未来的安全挑战,亟需对 Agent 应用特有的漏洞特征及其修复实践进行深入理解。
针对这一需求,白泽团队通过对 221 个真实世界漏洞的深度分析,首次对 Agent 应用的漏洞、开发者的修复策略以及其中的权衡挑战进行了全面研究。该研究识别并归纳了分布在 7 个核心组件中的 14 种漏洞类型及 15 种根本原因。此外,白泽团队还系统评估了各种防御策略的有效性,并揭示了开发者在漏洞修复过程中面临的实际困难。最终,研究提炼出 12 项关键发现,并为 Agent 应用的开发者、维护者及安全研究人员提供了针对性的建议与未来研究方向。
Algernon: A Flag-Guided Hybrid Fuzzer for Unlocking Hidden Program Paths

在这一工作中,白泽ers 分享了关于模糊测试的最新研究成果,针对程序状态中标志变量(Flag variables)难以触发的问题提出了创新解决方案。
模糊测试是发现软件安全漏洞的常用手段,但许多代码路径仅在特定程序状态下才可触达。受限于输入与内部标志变量之间隐含的数据依赖关系,现有的工具往往难以高效通过由标志变量保护的分支,导致测试效率受阻。
针对这一挑战,白泽团队提出了一种动态标志导向的混合模糊测试方法,并实现了原型工具 Algernon。该研究首先通过预模糊测试分析自动识别标志变量,并构建新型数据结构以刻画其对分支的影响;随后,通过将复杂的标志约束分解为原子约束并进行序列化求解,精准定位并触发目标执行路径。实验结果表明,Algernon 在代码覆盖率和漏洞发现能力上均优于 QSYM 和 AFL++ 等主流工具。在实际测试中,Algernon 成功发现了 20 个流行开源项目中的 30 个零日漏洞,并获得了 11 个 CVE 编号。
DeepExploitor: LLM-Enhanced Automated Exploitation of DeepLink Attack in Hybrid Apps

在这一工作中,白泽ers 分享了关于移动应用 WebView 安全性的最新研究成果,提出了一种针对 DeepLink 攻击的自动化漏洞利用生成框架。
现代移动应用广泛嵌入 WebView 以展示动态内容,然而,针对加载 URL 的输入校验不足或配置错误,常使应用面临 DeepLink 攻击的威胁——攻击者往往仅需诱导用户点击一个链接,即可触发漏洞。尽管开发者普遍采用了 URL 白名单等防御措施,但由于配置失当和实现不一致,漏洞依然广泛存在。
针对这一问题,白泽团队研发了首个针对 DeepLink 攻击的自动化漏洞利用生成框架 DeepExploitor。该框架克服了两大核心挑战:首先,它通过切片约束相关代码并结合大语言模型(LLM)解析,静态建模了应用特有的复杂路由封装与自定义 DeepLink 解析逻辑,实现了有效利用格式的大规模发现;其次,它通过识别并变异应用中的可信域名,成功绕过了基于域名的白名单等黑盒防御机制。在对 433 款主流 Android 应用的评估中,DeepExploitor 发现了 83 个零日漏洞,其中 24 个被评为高危或严重。目前,相关发现已全部提交至厂商,并获得了 35 个 CVE/CNVD 编号或致谢。
LLMPort: Cross-file Patch Porting via Task Decomposition and Self-correction

在这一 工作中,白泽ers 分享了关于自动化安全补丁迁移(Patch Porting)的研究成果,提出了一种基于大语言模型的新型框架 LLMPort。
安全补丁迁移对于维护软件系统的长期安全至关重要。然而,现有方法大多依赖预设规则,难以处理真实世界(尤其是 Java 应用)中涉及多文件、多行代码的复杂补丁迁移任务。
为解决这一难题,白泽团队开发了 LLMPort。该框架首先将复杂的迁移任务分解为多个原子化的代码单元,以增强模型的关注度;随后,通过提取最小相关上下文并结合领域知识引导模型生成目标补丁;最后,利用渐进式自校正系统自动评估并修复潜在错误。实验结果显示,LLMPort 在大规模 Java 补丁数据集上的迁移成功率达到 91.92%,且在 C 语言补丁迁移任务中同样优于 TSBPORT 和 FixMorph 等主流方法。此外,LLMPort 还发现了 5 个由于补丁不完整导致的零日漏洞,相关修复补丁已被官方接收并合并。
Exploring Static Taint Analysis in LLMs: A Dynamic Benchmarking Framework for Measurement and Enhancement

在这一工作中,白泽ers 分享了一种关于大语言模型静态污点分析能力测量及提升的方案。
尽管越来越多的研究尝试将 LLM 应用于污点分析,但目前仍缺乏对其核心能力的系统性认知。现有的基准测试常面临数据泄露、指标不当等问题,难以给出准确评价。
针对这一现状,白泽团队设计基准测试生成框架 LLMCapLens。该框架能够自动生成具有针对性、多样性且经过动态验证的测试用例,并基于测量结果提出了一种无需训练、适配特定模型的能力增强方法。通过对 10 种主流 LLM 的系统性测评,研究揭示了各模型在污点分析中的性能瓶颈与错误诱因。实验表明,该增强方法显著提升了模型的表现,在实际漏洞检测任务中,经过增强的 LLM 相比以往方法表现出了更强的实用性。
会议现场
会议现场汇聚了来自世界各地的研究人员。在 Poster 环节中,白泽ers 与多位科研同行进行了深入的学术交流,并送出了精心准备的自制小礼物,现场气氛十分热烈。

白泽博士生申卓祥在会议上分享论文

白泽ers与来自世界各地的科研人员深入交流

晚宴上的特色冰雕!

白泽ers将自制小礼物送给来自世界各地的科研人员们,大家都很喜欢!
首尔风光
学术交流之余,白泽ers也品尝了当地各种特色美食,欣赏了当地风光~

正宗的韩式炸鸡!

颇有特色的汉江江景

卖烤肉的韩国小哥哥