关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01359人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

突发!茅台真的换帅了

财通社 浏览 314 10-26

吉利汽车集团淦家阅:吉利新能源渗透率4年提升近10倍

贝壳财经 浏览 6076 08-10

小米王腾再回应被辞退:没有收受贿赂!曾被雷军点名“动不动泄密被罚款”

北京商报 浏览 434 09-09

“九天”通用基础大模型3.0发布

观察者网 浏览 7338 07-29

Grok正式登陆特斯拉 "脱缰模式"让车主上头

网易科技报道 浏览 6369 07-13

美伊"极限拉扯"伊朗拒绝谈判 特朗普作出重大让步

上观新闻 浏览 174 04-22

贾跃亭:FX又获1000台订单共3500台,天后玛丽亚·凯莉成FF 91车主

燃擎频道 浏览 5550 06-23

Fermín Soneira接棒兰博基尼CTO 7月1日正式上任

网易汽车 浏览 122 05-08

泡泡玛特摆件被当废品丢弃 租户起诉保洁员索赔2万元

红星新闻 浏览 7888 06-14

摩洛哥队长赛斯自宣从国家队退役,共代表摩洛哥出场86次

懂球帝 浏览 218 02-24

特朗普回绝伊朗新方案

界面新闻 浏览 127 05-05

组建大商业板块 小红书渴求更多转化

北京商报 浏览 550 08-14

涉58亿美元出口 "欧盟制裁以色列"或难实施:德未同意

澎湃新闻 浏览 449 09-19

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

天天汽车 浏览 253 01-29

蔚来又融100亿,股价暴涨100%!李斌打响翻身仗

象视汽车 浏览 408 09-15

剪发总翻车?30秒测额头类型!对应刘海公式 + 化妆技巧全拿捏

Yuki女人故事 浏览 4857 08-13

印学者回应印度将成世界第三大经济体:数据准确性存疑

红星新闻 浏览 7108 05-29

罗马仕员工称"停工突然":工资跌至1千出头 没法生存

第一财经资讯 浏览 10541 07-07

弗里克:来巴萨后我变了,我也不希望孙子看到爷爷是这样的

懂球帝 浏览 370 10-21

媒体:普京10年来首次赴美 乌克兰可能亏得一塌糊涂

新民周刊 浏览 3618 08-10

180亿公考龙头,努力上岸

21财闻汇 浏览 4979 07-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11