关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01529人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大带宽+低时延!F5G如何撑起城域“毫秒用算”?

览富财经网 浏览 390 10-21

罗斯、威少、沃尔、莫兰特,四大野兽控卫谁的身体天赋最逆天?

仰卧撑FTUer 浏览 241 03-11

男篮热身赛再挖奇兵!雷蒙防守奠定胜局,进攻把握三分,太香了!

篮球资讯达人 浏览 9255 07-30

2025最狠理财,惊呆百万散户!

米筐投资 浏览 258 11-05

一年关店3.9万家!老板套现、股东跑路…又一个暴利行业开始崩塌

深蓝财经 浏览 475 08-23

接雨水泡沫箱中现古老物种"仙女虾" 女主人:都不认识

极目新闻 浏览 3305 07-13

华尔街主流投行也要参与!高盛CEO称正在探索预测市场机会

华尔街见闻官方 浏览 336 01-16

何晴病重照流出,儿子跟前夫生活病中无亲属照顾,人生末路显凄凉

不八卦会死星人 浏览 260 12-19

吉利银河 A7 逆袭称王 单周狂甩 4195 辆

大象新闻 浏览 546 08-20

全国首个!华为、联通把5G-A上行速率飚到1Gbps

快科技 浏览 275 02-03

5岁女童被废弃电线杆砸中身亡 父亲:已不通电20多年

大风新闻 浏览 459 09-17

首家外商独资三级综合医院挂号费15元起 医保也能刷

每日经济新闻 浏览 2252 07-16

亚马逊美股盘前涨幅扩大至5%

证券时报 浏览 253 11-04

焦作万方319亿大并购:拟置入铝业龙头资产,浙江富豪在下什么棋?

时代周报 浏览 563 08-24

武汉交警通报一起交通事故:造成7人受伤 司机已抓获

澎湃新闻 浏览 476 09-07

子女不是985不值得关怀?兴业证券撞上“反内卷”枪口

深蓝财经 浏览 10119 07-30

真挚的祝福!祝广东男篮主帅杜锋44岁生日快乐!

直播吧 浏览 5572 07-30

菲非法"坐滩"57号舰释放小艇"碰瓷"挑衅 中国海警管制

界面新闻 浏览 442 08-23

4年半亏了165亿,百亿基金经理被告上法庭

深蓝财经 浏览 321 01-09

进博面对面|爱茉莉太平洋许达仁:深耕中国,本土创新是制胜关键

中国商报 浏览 377 11-09

秦PLUS DM-i加推128KM进取型 全系限时6.98万元起

网易汽车 浏览 382 09-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11