关闭广告

MIT和斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘

科技行者2025-08-27 00:00:01480人阅读


这项由MIT脑与认知科学系的Greta Tuckute以及斯坦福大学计算机科学系的Klemen Kotar、Daniel L. K. Yamins等研究者共同完成的突破性研究,发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过arXiv:2508.11598v1访问完整论文。

说起人类的听觉系统,那真是一个令人惊叹的生物工程奇迹。我们能够在嘈杂的咖啡厅里轻松分辨出朋友的声音,能够从语调中听出说话人的情绪变化,甚至能够在听到一个陌生单词时大致猜出它的含义。然而,让人工智能系统达到人类这样的听觉理解能力,却是一个让科学家们头疼了很久的难题。

传统的AI语音处理系统就像是一个只会机械记忆的学生,它们要么专注于完美地复制原始音频信号的每一个细节,要么依赖复杂的对比学习机制来区分不同的声音片段。这些方法虽然在某些特定任务上表现不错,但却缺乏人类

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

GPT-Realtime-2上线!全球AI巨头加码,语音一夜成了AI圈香饽饽

雷科技 浏览 109 05-09

丰田该对特朗普说谢谢

虎嗅APP 浏览 1963 07-26

无人曝光?董璇二婚,意外推翻了宁静的话

可乐谈情感 浏览 5569 07-16

AI教育机器人首秀广交会!西班牙客商:科技水平太惊艳了

南方都市报 浏览 348 10-17

73岁唐国强的晚年:儿子医疗费成痛苦负担

不八卦掌门人 浏览 526 09-01

开普勒人形机器人实现全球首例“人机协作”高空焊接作业

IT之家 浏览 271 01-16

欧冠抽签:皇马战曼城利物浦 拜仁遇巴黎切尔西阿森纳

我爱英超 浏览 450 08-29

51岁张晋面容憔悴,自曝患心脏病做支架

乡野小珥 浏览 5518 08-10

涠洲岛观光车司机威胁游客称"杀人不犯法" 被拘留7天

扬子晚报 浏览 8292 08-14

铅污染,是连环杀手的产房?

虎嗅APP 浏览 2823 07-17

迪米特洛夫宣布退出美网,58次大满贯连续参赛纪录终结

网球之家 浏览 8364 07-30

世界杯超燃一夜:梅西戴帽创历史 姆巴佩+哈兰德双响 压力给到C罗

侃球熊弟 浏览 11 06-17

莫斯科大学突破:普通照片实现房间结构与物品识别

科技行者 浏览 296 10-22

中科大团队实现AI图表数学逻辑理解

科技行者 浏览 348 11-04

万宁突然关闭内地线上线下全部门店,连锁巨头这是怎么了?

江瀚视野 浏览 255 12-21

外媒披露普京在"普特会"上提出的停火条件 共有四项

上游新闻 浏览 571 08-22

辛巴“退出”后,初瑞雪首场直播卖出20亿元,辛选持续“去辛巴化”

红星资本局 浏览 468 09-01

潘江:大家的思想包袱还是太重,希望奈特能保持这样的状态

懂球帝 浏览 281 01-09

跟队记者:米兰本周六上午,将和未来队进行一场队内训练赛

直播吧 浏览 2532 07-16

刘晓庆更换头像上热搜!与第7个男人的官司被人扒

阿废冷眼观察所 浏览 1050 07-09

无限期推迟!奥特曼解释为何紧急叫停OpenAI开源模型发布

网易科技报道 浏览 1881 07-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11