参考指南

IT之家 8 月 28 日消息，据外媒 Engadget 今日报道，OpenAI 和 Anthropic 共同宣布，同意评估彼此公开系统的安全对齐情况，并共享分析结果。总体来看，两家公司产品各有缺陷，也提供了改进未来安全测试的思路。

Anthropic 表示，它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用，以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示，OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致，但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外，其他测试模型在一定程度上都存在谄媚行为。

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能，旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道，OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀，面临首起不当死亡诉讼。

OpenAI、Anthropic互评：GPT存在谄媚行为，Claude不易出现幻觉”

45岁张柏芝...

特朗普称实时...

大规模强化学...

保时捷911...

一度大火的洞...

俄总统新闻秘...

世体：霍安-加西亚恢复顺利，不排除入选本周末联赛大名单

闪崩！奶粉巨头飞鹤，也扛不住了？

超豪华小汽车消费税起征价格调整为90万元，哪些车型会受影响？

大带宽+低时延！F5G如何撑起城域“毫秒用算”？

罗斯、威少、沃尔、莫兰特，四大野兽控卫谁的身体天赋最逆天？

男篮热身赛再挖奇兵！雷蒙防守奠定胜局，进攻把握三分，太香了！

2025最狠理财，惊呆百万散户！

一年关店3.9万家！老板套现、股东跑路…又一个暴利行业开始崩塌

接雨水泡沫箱中现古老物种＂仙女虾＂女主人：都不认识

华尔街主流投行也要参与！高盛CEO称正在探索预测市场机会

何晴病重照流出，儿子跟前夫生活病中无亲属照顾，人生末路显凄凉

吉利银河 A7 逆袭称王单周狂甩 4195 辆

全国首个！华为、联通把5G-A上行速率飚到1Gbps

5岁女童被废弃电线杆砸中身亡父亲：已不通电20多年

首家外商独资三级综合医院挂号费15元起医保也能刷

亚马逊美股盘前涨幅扩大至5%

焦作万方319亿大并购：拟置入铝业龙头资产，浙江富豪在下什么棋？

武汉交警通报一起交通事故：造成7人受伤司机已抓获

子女不是985不值得关怀？兴业证券撞上“反内卷”枪口

真挚的祝福！祝广东男篮主帅杜锋44岁生日快乐！

菲非法＂坐滩＂57号舰释放小艇＂碰瓷＂挑衅中国海警管制

4年半亏了165亿，百亿基金经理被告上法庭

进博面对面｜爱茉莉太平洋许达仁：深耕中国，本土创新是制胜关键

秦PLUS DM-i加推128KM进取型全系限时6.98万元起