复旦大学-系统软件与安全实验室

2025年11月16日至2025年11月20日，国际软件工程领域会议the 40th IEEE/ACM International Conference on Automated Software Engineering (ASE 2025)在韩国首尔举办。在本次会议中，我们派出了2位白泽ers，带来了5场论文报告。在此期间，我们认识了许多来自世界各地的优秀科研人员，与大家共同度过了难得的交流时光，送出白泽自制的小礼物~~在学术交流之外，白泽ers还领略了首尔独特的城市风光，品尝了当地的特色美食~~

论文分享

论文分享Security Debt in LLM Agent Applications: A Measurement Study of Vulnerabilities and Mitigation Trade-offs

在这一工作中，白泽ers 分享了关于大语言模型智能体（LLM Agent）应用安全性的首个系统性研究成果。
随着 LLM Agent 应用在各领域的广泛普及，其潜在的安全风险也日益凸显。为了有效应对未来的安全挑战，亟需对 Agent 应用特有的漏洞特征及其修复实践进行深入理解。
针对这一需求，白泽团队通过对 221 个真实世界漏洞的深度分析，首次对 Agent 应用的漏洞、开发者的修复策略以及其中的权衡挑战进行了全面研究。该研究识别并归纳了分布在 7 个核心组件中的 14 种漏洞类型及 15 种根本原因。此外，白泽团队还系统评估了各种防御策略的有效性，并揭示了开发者在漏洞修复过程中面临的实际困难。最终，研究提炼出 12 项关键发现，并为 Agent 应用的开发者、维护者及安全研究人员提供了针对性的建议与未来研究方向。

Algernon: A Flag-Guided Hybrid Fuzzer for Unlocking Hidden Program Paths

在这一工作中，白泽ers 分享了关于模糊测试的最新研究成果，针对程序状态中标志变量（Flag variables）难以触发的问题提出了创新解决方案。
模糊测试是发现软件安全漏洞的常用手段，但许多代码路径仅在特定程序状态下才可触达。受限于输入与内部标志变量之间隐含的数据依赖关系，现有的工具往往难以高效通过由标志变量保护的分支，导致测试效率受阻。
针对这一挑战，白泽团队提出了一种动态标志导向的混合模糊测试方法，并实现了原型工具 Algernon。该研究首先通过预模糊测试分析自动识别标志变量，并构建新型数据结构以刻画其对分支的影响；随后，通过将复杂的标志约束分解为原子约束并进行序列化求解，精准定位并触发目标执行路径。实验结果表明，Algernon 在代码覆盖率和漏洞发现能力上均优于 QSYM 和 AFL++ 等主流工具。在实际测试中，Algernon 成功发现了 20 个流行开源项目中的 30 个零日漏洞，并获得了 11 个 CVE 编号。

DeepExploitor: LLM-Enhanced Automated Exploitation of DeepLink Attack in Hybrid Apps

在这一工作中，白泽ers 分享了关于移动应用 WebView 安全性的最新研究成果，提出了一种针对 DeepLink 攻击的自动化漏洞利用生成框架。
现代移动应用广泛嵌入 WebView 以展示动态内容，然而，针对加载 URL 的输入校验不足或配置错误，常使应用面临 DeepLink 攻击的威胁——攻击者往往仅需诱导用户点击一个链接，即可触发漏洞。尽管开发者普遍采用了 URL 白名单等防御措施，但由于配置失当和实现不一致，漏洞依然广泛存在。
针对这一问题，白泽团队研发了首个针对 DeepLink 攻击的自动化漏洞利用生成框架 DeepExploitor。该框架克服了两大核心挑战：首先，它通过切片约束相关代码并结合大语言模型（LLM）解析，静态建模了应用特有的复杂路由封装与自定义 DeepLink 解析逻辑，实现了有效利用格式的大规模发现；其次，它通过识别并变异应用中的可信域名，成功绕过了基于域名的白名单等黑盒防御机制。在对 433 款主流 Android 应用的评估中，DeepExploitor 发现了 83 个零日漏洞，其中 24 个被评为高危或严重。目前，相关发现已全部提交至厂商，并获得了 35 个 CVE/CNVD 编号或致谢。

LLMPort: Cross-file Patch Porting via Task Decomposition and Self-correction

在这一工作中，白泽ers 分享了关于自动化安全补丁迁移（Patch Porting）的研究成果，提出了一种基于大语言模型的新型框架 LLMPort。
安全补丁迁移对于维护软件系统的长期安全至关重要。然而，现有方法大多依赖预设规则，难以处理真实世界（尤其是 Java 应用）中涉及多文件、多行代码的复杂补丁迁移任务。
为解决这一难题，白泽团队开发了 LLMPort。该框架首先将复杂的迁移任务分解为多个原子化的代码单元，以增强模型的关注度；随后，通过提取最小相关上下文并结合领域知识引导模型生成目标补丁；最后，利用渐进式自校正系统自动评估并修复潜在错误。实验结果显示，LLMPort 在大规模 Java 补丁数据集上的迁移成功率达到 91.92%，且在 C 语言补丁迁移任务中同样优于 TSBPORT 和 FixMorph 等主流方法。此外，LLMPort 还发现了 5 个由于补丁不完整导致的零日漏洞，相关修复补丁已被官方接收并合并。

Exploring Static Taint Analysis in LLMs: A Dynamic Benchmarking Framework for Measurement and Enhancement

在这一工作中，白泽ers 分享了一种关于大语言模型静态污点分析能力测量及提升的方案。
尽管越来越多的研究尝试将 LLM 应用于污点分析，但目前仍缺乏对其核心能力的系统性认知。现有的基准测试常面临数据泄露、指标不当等问题，难以给出准确评价。
针对这一现状，白泽团队设计基准测试生成框架 LLMCapLens。该框架能够自动生成具有针对性、多样性且经过动态验证的测试用例，并基于测量结果提出了一种无需训练、适配特定模型的能力增强方法。通过对 10 种主流 LLM 的系统性测评，研究揭示了各模型在污点分析中的性能瓶颈与错误诱因。实验表明，该增强方法显著提升了模型的表现，在实际漏洞检测任务中，经过增强的 LLM 相比以往方法表现出了更强的实用性。