关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01423人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

OpenAI CEO奥尔特曼拉响警报:金融行业即将面临“AI欺诈危机”

IT之家 浏览 5956 07-24

什么才算好结尾?|对话《正当防卫》

价值星球Planet 浏览 3222 07-27

星光大赏残酷名利场:张国立赵露思坐第一排C位,座位图等级分明

娱乐圈笔娱君 浏览 164 12-23

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者 浏览 202 01-13

赵露思回应没戏拍:生病后都收到好几个本子

韩小娱 浏览 9584 08-07

冯巩被问为何缺席杨少华葬礼,沉默不回应?原因可能没那么简单

娱乐白名单 浏览 4993 07-21

接雨水泡沫箱中现古老物种"仙女虾" 女主人:都不认识

极目新闻 浏览 3191 07-13

乘龙卡车回应对撞试验中"撞不过理想i8":被摆了一道

红星新闻 浏览 2323 07-31

曝杨采钰疑似已生产,近照曝光小腹平坦,身材已回到最佳状态

扒虾侃娱 浏览 1235 07-29

针对配置进行升级 新款小鹏G9官图发布

车质网 浏览 203 01-08

航母“弹射三连”释放哪些信号

经济日报 浏览 338 09-28

泽连斯基时隔半年再次造访白宫 这回穿正装了

每日经济新闻 浏览 523 08-19

比亚迪双旗舰谍照来了!大汉/大唐,更大、更强

车市红点 浏览 179 12-21

新商家成立一年,月销破千万,做对了这些

电商在线 浏览 9936 07-13

王晶大谈力捧谢霆锋原因,狄波拉是恩人,谢贤更是讲义气

温柔娱公子 浏览 253 10-21

AI广告大爆发!AI能生成广告,广告在影响AI,用户惨了

雷科技 浏览 4256 07-18

人工智能应用让群众网球赛事更有“科技范”

环球网资讯 浏览 5602 07-13

轮圈选择丰富/金标开放选装 新一代SU7更多细节

网易汽车 浏览 134 01-10

这些地铁,在花式搞钱

花朵财经 浏览 402 08-20

本届温网中国金花夺双冠,一抹亮丽中国红!

网球之家 浏览 3554 07-15

单次车损大于购车价30%免费换新车 别克GL8家族加推金辉版

网易汽车 浏览 129 03-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11