关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025431人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国众议员Luna发函司法部,称鲍威尔两次作伪证,提出刑事指控

华尔街见闻官方 浏览 1998 07-22

美军摧毁伊朗地下核设施方案披露

红星新闻 浏览 9916 06-20

很会赚钱的老铺黄金,还要继续涨价

豹变 浏览 499 08-22

你觉得如何?ESPN对公牛和吉迪4年1亿续约给出B-的评级

直播吧 浏览 442 09-10

金正恩回国五天后接到北京打来电话 中方连说三个"好"

现代小青青慕慕 浏览 691 09-11

女子误踩氢氟酸身亡 专家回应"为何遗弃10年仍致命"

上游新闻 浏览 471 09-20

财政部、税务总局对《中华人民共和国增值税法实施条例》草案征求意见

网易财经 浏览 557 08-12

李连杰讲述病情:62岁生日时发现颈部肿块 确定是良性

鲁中晨报 浏览 606 08-29

皮亚斯特里:在F1交到真朋友很难,大家基本来到围场就是竞争

懂球帝 浏览 158 04-29

于正前脚内涵任嘉伦,央视后脚出来打脸!

科学发掘 浏览 3930 07-08

特朗普向60国发出邀请之际 多国正商量怎么对付美国

新民周刊 浏览 289 01-20

上汽大众陶海龙:AUDI 首款车“只能成功,不能失败”

IT之家 浏览 409 09-21

50岁女人穿衣,记得色不过三、衣不紧身,照着穿想不气质都难

静儿时尚达人 浏览 286 10-31

从零做起 刘备扮演者孙彦军以"高校首任校长"身份亮相

鲁中晨报 浏览 526 09-26

提供两种动力 新款问界M7申报图曝光

车质网 浏览 525 08-11

或将易主!春兴精工实控人所持约1.7亿股将被二次拍卖

经理人杂志 浏览 414 09-10

AMD 确认 Radeon RX 9060 显卡仅限 OEM 渠道

IT之家 浏览 474 08-21

浙大青年教师坠亡背后:被忽视的学术界自杀危机

知识分子 浏览 548 08-12

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄还显贵

静儿时尚达人 浏览 280 11-26

张翰现身餐馆用餐被偶遇,与路人热情合影,寸头短裤清爽帅气

扒虾侃娱 浏览 6118 08-04

记者:一旦确定无法签下伊萨克,利物浦将迅速推进埃基蒂克的转会

直播吧 浏览 2640 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11