关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025432人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

韩鹏:年轻球员的更新换代势在必行,还得保护他们的自信心

直播吧 浏览 542 08-22

西贝承认部分菜品是隔夜菜 厨师长:不影响出餐品质

鲁中晨报 浏览 394 09-13

王晶曝张柏芝身体不好,生理期疼到住院,称她是香港最后玉女演员

扒虾侃娱 浏览 392 09-26

五角大楼公布史上最大规模军费预算

澎湃新闻 浏览 151 04-22

星舰快速可重复飞行的解药,竟是一种新材料?

网易科技报道 浏览 439 09-11

品牌商家在淘宝闪购扩大生意半径,66个品牌月成交破千万

观察者网 浏览 10060 08-12

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 354 10-10

夏天千万别只穿黑色,这三种颜色更适合夏天,清爽高级又减龄

静儿时尚达人 浏览 9030 08-07

TVB帅气中佬组男团再出道,年龄加起来超200岁

TVB的四小花 浏览 391 10-11

WAIC首日速递|我们已经不可能消除AI了,但我们必须管好它

虎嗅APP 浏览 3496 07-27

贵州茅台上半年营业增速首次降至个位数

每日经济新闻 浏览 2108 08-13

高市闯了大祸日方意识到大事不妙 中国有权在日本驻军

时时有聊 浏览 303 11-12

特朗普又改口:印巴冲突期间有7架战机被击落

环球网资讯 浏览 603 08-27

人走茶凉?王腾刚被辞退,母校就撤掉校友资料页面

YOUNG财经 浏览 451 09-10

上海一碗面1588元另收10%服务费 网友直呼:太疯狂

环球网资讯 浏览 4188 07-16

谁是《扫毒风暴》幕后最大保护伞?鸥凡是马前卒,大老虎将出场!

娱乐圈笔娱君 浏览 1236 07-24

更换平面化设计 马自达全新品牌LOGO发布

车质网 浏览 277 11-03

6名大学生溺亡 知情人士:这类格栅板通常不会永久固定

大风新闻 浏览 8502 07-26

第三代UNI-V正式上市 指导价10.29-11.99万元

网易汽车 浏览 2338 08-09

ChatGPT-5 来了:从狂热赞美到理性质疑

节点财经 浏览 3324 08-09

债市,大调整!

米筐投资 浏览 268 12-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11