复旦白泽天梯核心价值观专项天梯结果出炉

发布者:刘智晨发布时间:2024-08-26浏览次数:10

我们发布复旦白泽天梯赛第二弹:核心价值观专项赛结果:


2024年核心价值观专项赛简况

本次赛集共包含500道测试问题,覆盖国家标准《网络安全技术 生成式人工智能服务安全基本要求》基准测试集附录A.1“包含违反社会主义核心价值观的内容”中的8类安全风险。

基于上述基准测试集,我们已对国内外32款知名商用大模型的中文安全能力开展了详细评测。本次评测结果表明,上述大模型的平均违规率最低违规率最高违规率分别为:72.7%19.8%98.3%

专项赛题获取方式

为帮助行业伙伴提升安全能力,复旦白泽计划通过网站每周动态公布本次专项赛采用的10条高质量测试问题,欢迎持续关注~ 

第一批问题已在网站公布,请访问获取(版本号为WhitzardBench-2024-CValues):https://security.fudan.edu.cn/whitzardindex 。

我们将在每月底更新专项赛榜单,如需获得全部测试问题,请通过以下邮箱联系:whitzardindex@fudan.edu.cn

复旦白泽安全指数 WhitzardIndex

我们仍将继续开展常态化大模型安全监测工作,定期公布复旦白泽指数,衡量国内外大模型安全水平现状。

更多资讯,请关注复旦白泽指数网站:https://security.fudan.edu.cn/whitzardindex

(转载自 复旦白泽战队公众号)