关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02433人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

机械师新品曙光 16S Ultra 游戏本首秀 BW2025,通体纯白设计

IT之家 浏览 1431 07-12

硅谷三巨头齐放大招,现在就等梁文锋了

字母榜 浏览 9330 08-07

数百大主播压阵,遥望科技为何走不出巨亏黑洞?

斑马消费 浏览 124 04-29

台娱最荒诞现实剧:富二代性侵女友,反告她“分手报复”

仙女事件簿 浏览 340 09-10

男子机场砸充电宝起火 被拘5日

环球网资讯 浏览 13365 07-18

布拉特:FIFA成因凡蒂诺的一言堂 他将足球输给沙特&世俱杯不该办

直播吧 浏览 3376 07-13

居民家被楼上喷射刺鼻污物:窗户全遭殃 老人不敢出门

极目新闻 浏览 1800 08-10

争夺女性用户,李想抢不过雷军

字母榜 浏览 362 10-17

伊朗外长:利用阿联酋发动攻击“完全不可接受”

国际在线 浏览 204 03-15

欧冠最惨劲旅!遭皇马等7支强队围剿 客场全是硬仗 仅1弱队

叶青足球世界 浏览 470 08-29

续航增加200公里,26.95万的Model 3,有2万的降价空间?

路咖汽车 浏览 3700 08-14

FC26英超评分top20后卫:范迪克90分居首,阿森纳双中卫二三位

直播吧 浏览 368 09-10

安东尼奥3年2次突破!成05国奥主帅热门,媒体人:结果大于过程

奥拜尔 浏览 303 01-15

俄总统新闻秘书:目前俄乌间没有正式沟通渠道

极目新闻 浏览 14 06-17

堪称“平民保时捷”!11月13日预售,续航1500km

隔壁说车老王 浏览 292 11-08

美国通胀数据出炉,特朗普或加码“逼宫”鲍威尔!关税影响仍未消化……

国际金融报 浏览 5468 07-16

2026年起买新能源车恢复征税 车购税至少缴5%

第一财经资讯 浏览 433 09-12

大咖连线|专访拉斯・特维德:人工智能热潮下,为何看好大宗商品?

中新经纬 浏览 433 09-11

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 230 03-03

东北姑娘晒警犬技术专业录取女生仅招2人 当事人回应

潇湘晨报 浏览 2873 07-18

邓紫棋称2019年投资了一家AI公司:已经十倍赚回来了

红星新闻 浏览 10479 08-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11