关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018231人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"续面事件"老板发视频向网友道歉 评论区"不买账"

上观新闻 浏览 516 08-19

赵露思解约背后的真底气:她的陪伴型父亲

老吴教育课堂 浏览 4694 08-08

沸腾!利好来了,暴增350%!

券商中国 浏览 5016 07-16

跟“雷尔法”一样豪华,再加个华为全家桶,卖35.99万元贵了吗?

吴佩频道 浏览 552 05-29

吴磊大瓜牵扯多位明星!爆料女主骂赵露思骚扰吴磊,曝何猷君出轨

萌神木木 浏览 181 01-19

AI产业迅速发展需求增长 光模块市场或仍将维持高增速

金证研 浏览 2139 07-17

演习第2天 东部战区组织实弹射击

央视新闻 浏览 202 12-30

北约或取消峰会 避免与特朗普冲突出现"戏剧性场面"

环球网资讯 浏览 22 04-29

AI“一路狂飙”,南京如何用产业攻坚书写答案?

现代快报 浏览 202 12-23

最酷的一批分析师,都离不开这张卡

远川研究所 浏览 3623 08-07

男子涉刑案被撤销后申请国赔 派出所所长个人转2.3万

澎湃新闻 浏览 417 09-21

AI杀入美股,DeepSeek又是第一!港大90后开源,AI股神人人都能造

新智元 浏览 278 10-26

刘强东朋友圈疑曝光,自嘲在老婆面前失去没自信

柠檬有娱乐 浏览 268 11-02

联合国特使就也门问题与胡塞武装及阿曼官员会谈

国际在线 浏览 188 01-14

“后妈裙”今年夏天火炸了,这样穿时髦精致又气质

LinkFashion 浏览 8667 06-21

登顶Hugging Face GAIA全球榜首!中兴超级智能体终结「AI黑盒」时代

新智元 浏览 284 10-15

"平民保时捷"衰落:曾年售33万辆 去年一年只卖了14辆

蓝鲸新闻 浏览 316 09-13

REDMI K90 Pro Max 可与 iPhone / 小米 17 Pro Max 通用钢化膜

IT之家 浏览 276 10-20

委内瑞拉总统马杜罗:美军事部署行为违反国际法

国际在线 浏览 446 08-22

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro 浏览 176 01-16

图片报:埃贝尔送走8将腾出7600万欧,最终节省3500万欧薪资成本

直播吧 浏览 359 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11