关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025436人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

轮到以色列被打了 以最大城市被炸数百万人逃入避难所

起喜电影 浏览 562 09-16

金价算是彻底失控!不是因为涨到1000多,那些回收店排起了长队…

火山诗话 浏览 341 10-18

2026年了,最好看还是这件大衣!

LinkFashion 浏览 162 12-28

拿到泼天订单的YU7,让小米汽车既甜蜜又烦恼

禾颜阅车 浏览 556 08-11

广东U20 1-0上海U20,张志雄绝杀

懂球帝 浏览 328 11-11

NBA球星生涯总薪水排名:詹姆斯5.83亿居首 布克乔治已超杜兰特

罗说NBA 浏览 10425 08-13

为新能源再投10亿,苹果为何还不造车?

BT财经 浏览 331 10-21

空军航空开放活动今日举行 长春航空展有何看点

澎湃新闻 浏览 329 09-19

拉波尔塔:上赛季巴萨和巴黎最具竞争力,奉献了世界上最好的足球

直播吧 浏览 7549 08-07

中国核聚变技术获国际原子能机构肯定,“环流三号”亮相聚变能国际大会

上观新闻 浏览 358 10-20

希克:滕哈格上任后,训练课程甚至比在阿隆索手下还要密集

懂球帝 浏览 733 08-13

特朗普的“非洲裁缝”,正被关税逼上绝路

国际金融报 浏览 3296 07-30

男子买避孕药被药店联系到妻子导致离婚 律师:可起诉

极目新闻 浏览 554 08-16

美商务部长:特朗普几乎每天凌晨1点给我打电话聊八卦

极目新闻 浏览 6233 07-23

C罗罕见暴怒!一把推开球迷,唇语专家解读:希望他们滚开

奥拜尔 浏览 364 09-11

重庆试驾领克10 EM-P,开它撒野追辣妹子有戏吗?

车毂轆 浏览 472 09-06

苹果发布会前瞻:“史上最薄”iPhone亮相

澎湃新闻 浏览 427 09-10

红毯上40+女星状态,有姐弟恋有单亲妈妈,过得好不好写在脸上

萌神木木 浏览 415 09-09

3年1亿美元+末年球员选项!森林狼官宣续约兰德尔

直播吧 浏览 3781 07-17

金山办公登上《财富》最受赞赏的中国公司榜单

网易科技报道 浏览 446 09-10

刚刚,直线拉升!美国,重大宣布!

券商中国 浏览 578 08-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11