2025年9月26日,在云栖大会“AI安全前沿攻防技能论坛”上,全球首个面向通用大模型的AI安全攻防赛事。优胜选手现场收取奖杯与证书,并共享参赛经历与实战心得,展示了AI安全攻防范畴的前沿探究与立异思想。
据了解,本次大赛设有「大模型安全攻防双向对抗赛」、「模型使用线上环境缝隙赏金赛」、「AI安全产品挑战赛」三大赛道,招引了自全球3000余名顶尖选手报名参赛,在为期3个月的路程里累计收到有用陈述超万份,为构建系统化的AI安全技能系统供给了丰厚的实践参阅。
赛事技能总辅导、阿里云资深安全专家雄标明,本次大赛兼具研讨与使用价值,为提高根底大模型的内生安全、验证阿里系集成大模型事务的安全水位供给了实战参阅。相关攻防样本也将沉积至阿里云AI安全产品,持续反哺防护才能的实战建造。
实践标明,面临高度主动化的高档进犯,单一防护机制存在限制,亟需构建多层次协同防护。赛道三获奖选手苏永成在现场共享了三种极具代表性的非常规进犯方法:
经过越狱大模型主动生成数千条构思提示词,完结规模化绕过内容过滤;
经过系统侧信道的细小“活动熵”差异高效判别当时环境是否沙箱,躲避沙箱检测;
修正父进程为高可信进程提高安全评级,并结合小众注入方法和冷门API完结荫蔽进程注入。
此外,从技能层面来看,大模型自身引进了新的进犯面:提示词进犯或许诱导模型生成过错内容或履行非预期操作;企业事务集成大模型后,原有的关闭流程被打通,或许会引起灵敏信息走漏或安全管控失效;而RAG、Agent、MCP等新技能与架构的引进,更带来了潜在的系统级缝隙和调用链危险。
为了验证这一防护理念的实战作用,阿里云投入百万奖金举行本次专项攻防赛事。试验多个方面数据显现,经过安全加固的基模被攻破概率显着下降,叠加布置安全防护产品后,全体防护才能得到进一步提高。
阿里云安全专家王硕在赛后总结中指出,仅靠系统提示词束缚无法彻底防住高档进犯。AI年代的安全危险已从系统层延伸至事务层,单点防护难以见效,真实有用的防护,有必要经过根底设施层、模型层与使用层的纵深协同,构建掩盖全链路的动态防护系统。
在攻防作战才能方面,阿里云提出用大模型助力安全提效,用AI看护AI的理念。
阿里云商业化蓝军负责人晁巍在云栖大会讲演中说到,经过主动化东西和大模型技能的结合,助力阿里云蓝军完结攻防流程的优化提效:
财物搜集Agent可以高效整合网页、图片和链接等非结构化数据,比较传统人工搜集方法节约超越80%的时刻;
蓝军专属知识库结合RAG与大模型技能,可快速出现零星的攻防技战法,显着提高安全决议计划功率。
在人才部队建造方面,阿里云已首先组建了专业的AI安全蓝军部队。本次赛事不仅为发现和培育AI安全人才供给了重要渠道,更经过奖金激励机制推进了大模型安全技能立异,为构建系统化的大模型安全防护才能储藏了要害人才力气。
未来,阿里云将持续加大在AI安全技能和AI安全人才上的投入,致力于打造负责任的AI和全栈AI安全防护系统,让安全成为AI被大范围的使用的加速器,让AI真实成为推进社会进步的活跃力气。
国际抢先的云安全解决方案供给方,零信赖SASE、数据安全、流量安全等8大安全域百余项中心才能,助力百行百业在云上构建生于云架构,具有高度一体化、智能化、自我进化特征的原生安全维护系统。
2023年,在Forrester《根底设施即服务渠道原生安全Wave》陈述中,国内榜首;2022年,国际闻名咨询组织对全球云厂商解决方案才能评价中,阿里云的安全才能榜首;2020 年,国内仅有云厂商全体安全才能获国际三大组织(Gartner/Forrester/IDC)认可。
云原生安全技能的引领探究和实践者,经过安全才能与云紧耦合,完结双向技能的革新式打破,安万能效数倍提高,高弹高可用、安稳与协同;云服务内置天然免疫基因,与用户一同一起看护云上数字原生国际安全。

