关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017403人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中东壕客下单:先订600台!飞行汽车海外最大订单来了

南方都市报 浏览 357 10-13

美联储,太太太……太扯了

路财主 浏览 479 08-26

阿里夸克发布教育计划,教师和大学生可免费领三大会员

DeepTech深科技 浏览 495 08-28

普京“搅局”美国大选:一场智慧与策略的较量

浏览 3373 07-14

伊朗总统:战争既不符合伊朗也不符合美国利益

国际在线 浏览 266 02-01

千亿资金大迁徙,头部基金公司规模增长和业绩坚挺的秘密

阿尔法工场 浏览 2032 07-24

将人分为"安卓人"和"苹果人" 网红户晨风账号全网封禁

扬子晚报 浏览 394 10-02

世上没有免费的豆包

光子星球 浏览 142 05-09

特斯拉车顶维权女车主终审败诉,被判赔偿17万元,媒体人封某被判赔偿25万元

红星资本局 浏览 8908 07-12

赛博朋克风格 全新小鹏P7实车曝光

车质网 浏览 6715 07-09

用AI演戏,Vidu 的三重进化,AI视频从碎片化叙事迈向复杂叙事新阶段

雷峰网 浏览 386 10-22

车机系统升级 新款吉利ICON将于7月11日上市

车质网 浏览 2402 07-04

撒谎成性婚内出轨,黄奕风波升级被人戳脊梁骨

林轻吟 浏览 549 08-17

没有顶级腰子,建议别来跑步

后厂村体工队 浏览 5225 08-13

2027年!关键技术将取得突破

中国基金报 浏览 3010 08-10

杨翼谈申花:球队状态出现明显的问题,阿马杜表现不尽如人意

直播吧 浏览 2464 08-10

结婚10年被丈夫出轨8次 年仅43岁抑郁烧炭自尽

不写散文诗 浏览 403 09-26

3岁男孩跌入炭堆全身烧伤85%尚未脱险 家人发声

封面新闻 浏览 384 10-22

卢卡申科:俄现在和过去都有打击泽连斯基某一官邸能力

鲁中晨报 浏览 281 01-02

江中药业:激励计划部分业绩考核指标或“开倒车” 子公司财务数据或现“不同版本”

金证研 浏览 316 10-29

15岁少年离家130多天疑被骗出境做电诈 曾向母亲求救

极目新闻 浏览 482 09-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11