关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025341人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

72岁林凤娇近照认不出?

扶苏聊历史 浏览 353 09-09

走了下坡路?于正的话暴露任嘉伦的真实处境

观察鉴娱 浏览 401 09-08

文章近况曝光,当初毁掉他的从不是姚笛和马伊琍

往史过眼云烟 浏览 65 04-10

U23亚洲杯狂欢夜:日本5-0造惨案 韩国平伊朗 中国队首轮战伊拉克

侃球熊弟 浏览 179 01-08

媒体:巴基斯坦陆军元帅两个月内再访美 印度十分紧张

环球网资讯 浏览 910 08-12

更智能更豪华 乐道L90加配置会贵多少?

网易汽车 浏览 174 01-10

上海一小区骑手送餐保安全程陪同 骑手:以后再不来了

极目新闻 浏览 10273 08-07

帕金斯:美国队28年奥运会夺金概率为50% 他们会想念詹杜库

直播吧 浏览 2544 08-10

剑南春丨曼联1-1利兹联,阿伦森破门,齐尔克泽助攻库尼亚扳平

懂球帝 浏览 177 01-05

深铁再救万科220亿,暗藏的动作太多了

大猫财经Pro 浏览 248 11-04

俄罗斯空袭美国工厂

上观新闻 浏览 389 08-22

比变老更可怕的是乱穿衣,50岁女人掌握这3个技巧,好得体

静儿时尚达人 浏览 1582 07-21

谁说女人年纪大了就不能穿裙子?掌握这3点,轻松美出新高度

静儿时尚达人 浏览 4426 07-13

江汽集团董事长项兴初拜访任正非 送出尊界S800车模

快科技 浏览 205 01-06

华为与广汽“联姻”升级“启境”能否成为高端市场新王牌

大象新闻 浏览 302 09-20

胡塞武装称若加沙停火破裂将恢复袭击以色列

极目新闻 浏览 213 11-11

纯电续航215km 猛士M817 Max+版上市售36.99万元

网易汽车 浏览 325 09-30

锐评孙发京外卡事件:中网利益熏心还是中国网协卸磨杀驴?

网球之家 浏览 320 09-21

股价暴涨!又一超级风口来了?

财经锐眼 浏览 200 01-23

无人机群飞行规划员 驾驭天空的“幕后军师”

央广网 浏览 230 08-31

索尼耳夹式LinkBuds Clip耳机曝光:4种颜色、续航37小时

IT之家 浏览 182 01-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11