关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01243人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

亚历山大:我要感谢雷霆让我做自己&感谢队友 这里有最棒的篮球

直播吧 浏览 3775 07-17

演完《与凤行》演《逍遥》,她减肥50斤

失宠的小野猪 浏览 173 01-07

老公狂亏150亿后,她出来挣钱还债了?

Yuki女人故事 浏览 10103 07-09

是时候换发型了!这4款显脸小还巨减龄,太撩了!

Yuki女人故事 浏览 10389 06-23

投资5亿难回本,这事不怪朱一龙,导演的“加料”,细扒一言难尽

皮皮电影 浏览 459 08-20

高市早苗比石破茂更激进 曾称日本应与中国"打热战"

看看新闻Knews 浏览 488 09-09

小米准车主遇30天尾款"通牒":不支付2万元定金不退

红星资本局 浏览 493 08-22

伊利契奇:有人出钱让我讲述经历;加斯佩里尼让我突破极限

懂球帝 浏览 285 10-15

中东多个海水淡化厂受损 引发饮用水武器化担忧

澎湃新闻 浏览 106 03-14

特朗普被指曾私下鼓动泽连斯基打击莫斯科 白宫回应

环球网资讯 浏览 2283 07-16

国安官方:张源左膝关节内侧副韧带拉伤,郑图罗手腕关节扭伤

懂球帝 浏览 3371 07-17

美国政府未偿国债首次突破30万亿美元,自2018年以来翻一番

华尔街见闻官方 浏览 236 12-05

倒计时7天 93秒超前感受盛大阅兵

央视新闻 浏览 238 08-28

特朗普被指私下鼓动乌加强对俄纵深打击

环球网资讯 浏览 4854 07-16

续航增加200公里,26.95万的Model 3,有2万的降价空间?

路咖汽车 浏览 3619 08-14

美国将打造全球首座可移动核反应堆工厂,落户“曼哈顿计划”旧址

IT之家 浏览 310 10-15

电动自行车强制性国标今日执行:超过25km/h自动断电

大象新闻 浏览 371 09-01

与普京会晤后 特朗普给泽连斯基上压力了:达成协议吧

澎湃新闻 浏览 506 08-17

2025美网中国军团整体签运佳 6+N出战单打正赛

体坛周报 浏览 467 08-23

对手注意到你了!杨瀚森首节4投2中得到4分1板1助 也有2失误2犯规

直播吧 浏览 2785 07-13

帕尔马官方:18岁边锋布里奇吉从卢塞恩加盟,签约至2030年

直播吧 浏览 392 08-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11