关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017401人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

开播第一晚收视率破2.5!连刷4集!我想说: 这部刑侦剧要火向全国

娱乐圈笔娱君 浏览 1460 07-14

俄称逮捕一名乌特工:用1.2公斤炸药、500克钉子制造炸弹

红星新闻 浏览 3007 06-05

中美博弈的本质:实体和虚拟经济的决战

睿知睿见 浏览 9782 07-13

国安官方:张源左膝关节内侧副韧带拉伤,郑图罗手腕关节扭伤

懂球帝 浏览 3465 07-17

红魔授权服务中心・售后网点最新进展公布,覆盖全国62城

IT之家 浏览 292 12-12

媒体:金民锡拥有三国学位 或是李在明找的合适"备胎"

新民周刊 浏览 4679 06-07

2024年结婚登记610.6万对

第一财经资讯 浏览 10554 07-31

向五角大楼匿名捐赠1.3亿美元"军饷"的富豪身份披露

鲁中晨报 浏览 331 10-28

两"虎"任上落马 女正部几天前还曾公开露面

上观新闻 浏览 582 08-26

高管职务调动,上半年净利降超30%,民生人寿如何“解压”?

Daily每日财报 浏览 7129 08-13

破防!冲场球迷怒斥C罗:后悔花2999元看球,更后悔支持伪君子

念洲 浏览 397 08-23

雷军们没来,这届广州车展有啥看头?

道哥说车 浏览 276 11-25

民航暑运旺季将至 客运规模有望创新高

财联社 浏览 6151 06-25

13.59万元起售,2026款深蓝L07上市

北京商报 浏览 6354 08-14

滴滴自动驾驶不甘落后

虎嗅APP 浏览 308 10-13

越来越流行的松弛感穿搭,照着穿就很好看

LinkFashion 浏览 166 04-10

"吉林一号"拍台湾影像 岛内:影像越清晰"斩首"越精准

澎湃新闻 浏览 311 11-09

名记:切尔西认为哈托可减轻库库的负担;他们无意签多纳鲁马

懂球帝 浏览 9859 07-29

普京批准谈判人员名单 俄乌会谈前景难料

浏览 8198 07-14

教育AI应用能力L1-L5分级亮相,“虚拟老师”加速到来丨新经济观察

封面新闻 浏览 574 08-21

2025前沿科学创新大会发布“人类面临的前100大挑战”全球问题征集

环球网资讯 浏览 7000 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11