关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018320人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊核设施是否被毁 美政府与媒体又吵起来

国际在线 浏览 5961 07-01

“这件大衣”今年冬天又火了,怎么搭都高级!

LinkFashion 浏览 181 12-09

中美第4轮交锋 特朗普发长文破天荒承认"美国不行了"

博览历史 浏览 469 09-16

德约正式定居雅典,鲁内回应与卡林斯卡娅的“短信门”争议

网球之家 浏览 404 09-11

“湖北首富”难当?

野马财经 浏览 2165 07-29

委内瑞拉代总统:我“受够了”来自华盛顿的命令

扬子晚报 浏览 277 01-27

王涛揭阿根廷中国行没成行原因:足协没批,主办方10分钟就被打脸

直播吧 浏览 8173 08-10

泰国向中美俄等26国发函 并称对柬埔寨"可能开战"

每日经济新闻 浏览 7670 07-27

媒体:王毅鲁比奥首次会晤 美方被指正安排特朗普访华

上观新闻 浏览 9328 07-12

释永信背后的巨额财富,是一笔糊涂账……

功夫财经 浏览 3217 07-29

记者:亚沙里受伤,米兰可能重新启用并留下本纳塞尔或者阿德利

直播吧 浏览 471 08-29

MINI与Paul Smith合作推出设计师款 东京车展首秀

网易汽车 浏览 345 10-31

特朗普突然中止与加拿大贸易谈判 加元汇率直线跳水

每日经济新闻 浏览 336 10-26

杨超越最新状态曝光!身材颜值全满分!

草莓解说体育 浏览 403 10-12

但斌人气蝉联第1,邓晓峰热度上升!10月私募人气榜出炉!

私募排排网 浏览 368 11-08

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 399 09-29

8月造车新势力:零跑小鹏再创单月销量新高

时代财经 浏览 441 09-02

汪峰携女友日本游玩,森林北穿扮清爽

动物奇奇怪怪 浏览 5124 07-22

深夜美股三大指数下挫,中概股逆势飘红,小鹏汽车大涨超13%

21世纪经济报道 浏览 455 08-22

男子给18个月大婴儿灌酒致多处不适:我就是想逗逗孩子

潇湘晨报 浏览 6611 06-15

89岁相声名家李如刚去世!师承侯宝林

楠楠自语 浏览 244 01-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11