关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01527人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年最强阵容的大片,杀疯了

独立鱼 浏览 282 11-25

Token成本下降,订阅费却飞涨,AI公司怎么了?

机器之心Pro 浏览 7135 08-07

南京大学东思嘉博士疑自杀去世 本人活泼漂亮履历优秀

180视角 浏览 565 08-27

沃什问鼎美联储主席前路如何?

21金融圈 浏览 268 02-04

苹果AI"失血" 华人科学家被扎克伯格以超级待遇挖走

每日经济新闻 浏览 5241 07-09

小米REDMI Turbo 5 Max手机“续航耐力赛”直播战报出炉

IT之家 浏览 273 01-21

字节跳动:将按照中国法律要求,让Tictok继续服务美国用户

网易财经 浏览 317 09-20

21岁中国女孩独自赴埃及旅游失联6天 人目前已找到

红星新闻 浏览 388 09-27

中国元素!赌王之子何猷君入股凯尔特人 杰伦-布朗是其最爱

直播吧 浏览 408 08-20

油头粉面别演穷人!《命悬一生》几个镜头告诉你,真穷人是什么样

娱乐圈笔娱君 浏览 342 10-14

山东有小学老师转岗教高中:身不由己 教育局也没办法

潇湘晨报 浏览 554 08-24

开拓者公布2025夏联首战首发:杨瀚森领衔

懂球帝 浏览 10163 07-12

理想 L8 的配置卖 L6 的价格,昊铂 HL 增程版 26.98 万元起售,纯电续航 350km

爱范儿 浏览 520 08-21

硅谷迷恋“基因筛查”:“聪明人”才能应对AI威胁?

国际金融报 浏览 7417 08-14

小明 Q6 Neo 投影仪开启预约:首创转一转双臂云台,799 元

IT之家 浏览 7077 08-09

以色列议会初步通过吞并约旦河西岸法案 遭15国谴责

环球时报国际 浏览 377 10-26

鲁伊斯谈击败樊振东:我多变化就有取胜机会,希望他尽快适应德国

直播吧 浏览 597 09-01

蚂蚁阿福声明:问答结果中无任何广告推荐、不存在商业排名

三言科技 浏览 177 12-29

阿根廷0-1收官!世预赛近7轮首败,遭点杀+0射正,双方各1人染红

我爱英超 浏览 385 09-10

“白酒教父”吴向东要做啤酒,珍酒李渡股价逆势大涨

达摩财经 浏览 5656 08-07

德雷森:由衷希望穆勒能在未来回归,拜仁大门将永远为他敞开

懂球帝 浏览 288 01-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11