关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017402人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

商米科技港股IPO:一边是巨头加持,一边捧着低毛利苦酒

Daily每日财报 浏览 4125 07-21

基金血亏57%,石油大王100岁才能出狱,清盘破产才是大佬的归宿?

金融八卦女 浏览 617 08-19

公安机关对"野人孩子"父母展开调查 孩子目前安全

中国新闻周刊 浏览 353 10-19

李凤刚出任北京现代总经理,20 年来首次由中国本土人才代表韩方

IT之家 浏览 303 11-10

何猷君入主凯尔特人队成为联合老板 球队估值61亿美元

每日经济新闻 浏览 612 08-21

2025光伏半年会侧记:反内卷尚未成功,仍须加倍努力!

赶碳号 浏览 5338 07-26

苹果华人AI大牛被挖走,为同济校友!硅谷抢人大战升级,薪酬开到10亿刀

智东西 浏览 7219 07-30

14分战胜新西兰男篮 中国男篮时隔十年再进亚洲杯决赛

澎湃新闻 浏览 621 08-17

美国一载115人波音客机空中襟翼脱落 坠入居民区

界面新闻 浏览 9146 07-04

牛市不言顶?

菜鸟理财 浏览 452 09-02

苹果M5芯片,击败高通新旗舰

半导体行业观察 浏览 354 10-18

罗永浩怒怼西贝,预制菜除了方便,我们还吃进了什么?

网易健康 浏览 456 09-13

哪种耳机最伤听力?专家教你这样做

网易健康 浏览 9941 03-04

恒大都要退市了,许家印仍拒绝交代资产去向,烂尾楼的业主怎么办

北向财经 浏览 450 08-19

谁说50+的女人不能赶时髦?掌握这3个技巧,优雅迷人一直到老

静儿时尚达人 浏览 3553 07-30

韩国投资者大举买入中国股票,他们嗅到了什么?

郭施亮 浏览 2238 07-21

5家奶茶品牌产品检出反式脂肪酸 霸王茶姬、喜茶回应

红星新闻 浏览 564 08-26

美联储报告:政策不确定性成头号金融稳定风险,央行独立性首次被点名,关注金融杠杆

华尔街见闻官方 浏览 289 11-08

B站2025年Q2财报:营收73.4亿 调整后净利5.6亿

网易科技报道 浏览 482 08-22

泽连斯基:乌美保持全天候、多层次接触

央视新闻客户端 浏览 7689 08-10

俄称打击乌军多处目标 乌称击退俄进攻

国际在线 浏览 267 11-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11