关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025434人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

狼队官方:热身赛对阵塞尔塔、英超揭幕战对阵曼城将缅怀若塔

懂球帝 浏览 1748 07-15

国际化野心不减?信达生物拿下巨额BD,总额114亿美元创纪录,股价不涨反跌

时代周报 浏览 362 10-23

稀土是啥?为啥是中国王牌?

混知财经 浏览 271 10-13

搭载华为ADS 4.0 问界M8纯电版申报图发布 8月上市

网易汽车 浏览 2624 07-17

穆尼奥斯:会以最好表现回报深圳球迷,让对手难以在我们主场取胜

直播吧 浏览 2295 08-06

男子开锁坐地起价从60元升到820元 女主人拒绝被反锁

极目新闻 浏览 6875 07-30

胡塞武装称使用高超音速导弹袭击以色列

上观新闻 浏览 8652 07-03

拜仁官方:帕夫洛维奇开始跑步训练,为复出做准备

直播吧 浏览 501 08-12

上海海事局:长江口10日一大型船舶航行交通管制

中华人民共和国海事局 浏览 473 09-09

鲍威尔淡化9月降息预期 美大型科技股多数收跌

中新经纬 浏览 4238 07-31

华为鸿蒙第五界首车正式亮相

电动知家 浏览 2345 07-14

停火协议失效?一觉醒来中东再次开打

浏览 10582 07-14

中国联通卫星业务 10 元每月:8 省市用户可尝鲜

IT之家 浏览 431 09-09

大连有梅花鹿连续2天攻击游客 受伤女子:我没招惹它

极目新闻 浏览 518 09-22

如何选择儿童牙膏产品

人民网 浏览 8373 11-08

出道17年,他终于火了

独立鱼 浏览 10346 07-12

黄一鸣晒女儿喊王思聪爸爸 网友让她看宗家争产案

萌神木木 浏览 4632 07-16

拉夏贝尔起死回生了?都以为要倒的女装巨头怎么又活了?

江瀚视野 浏览 1948 08-07

国际空间站飞过"桦加沙"风眼:巨大白色漩涡翻腾

新京报 浏览 357 09-24

现货以太坊ETF交易火爆,过去五个交易日“吸金”是比特币十倍以上

华尔街见闻官方 浏览 500 08-29

世锦赛男单决赛:石宇奇19-21昆拉武特,大比分0-1落后

懂球帝 浏览 343 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11