关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02432人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

队报:比赛中拉门斯的长传频繁且精准,推动了曼联的战术转型

懂球帝 浏览 287 11-01

分开12年,他们居然还能合体?

陈天宇 浏览 7227 08-04

太阳报:英超对10月的多场比赛时间进行调整以方便转播

直播吧 浏览 509 08-22

今年秋冬最流行的外套竟然是它?谁穿谁时髦!

LinkFashion 浏览 242 10-12

鸿蒙智行第五界首车尚界 H5 搭载 32.6kWh 电池,纯电续航 181km

IT之家 浏览 5922 08-09

斯科尔斯回应利马:有人踢了一场好球,真替你感到高兴

懂球帝 浏览 271 01-19

郑丽文赴美前表态:不当"麻烦制造者" 不会拖美国下水

海峡导报社 浏览 91 05-28

千百惠告别仪式播放《走过咖啡屋》 黄安痛哭告别好友

潇湘晨报 浏览 595 08-24

四足机器人首次同时「思考+走路」,北大提出链式推理MobileVLA-R1

新智元 浏览 292 12-05

G7对中国提出三个“不许” 媒体质问:凭什么

上游新闻 浏览 358 12-02

FDA揭开药企“遮羞布”

虎嗅APP 浏览 3573 07-15

切费林:我认为球员在赛季结束后,至少应该有一个月假期

懂球帝 浏览 310 11-08

和AI聊完,我和爸妈“冷战”一年| 深氪lite

36氪 浏览 4432 07-12

广州农商行收编兴宁珠江村行获批,被顺德农商行收购的村行将开业

湘财Plus 浏览 459 09-11

女性更容易后悔?新研究揭示大脑决策机制

澎湃新闻 浏览 8272 07-21

23岁男子失联两月疑在柬埔寨 家属曾收到死亡威胁短信

封面新闻 浏览 583 08-21

二次元“入侵”金饰,“痛金”带火黄金“谷子”!某95后:打金更有性价比

时代周报 浏览 7652 08-10

特朗普为何要自废美国的“武功”?

浏览 2597 07-14

日本一股势力为战争罪犯翻案招魂 外交部回应

人民日报 浏览 294 08-29

本科毕业生为了一份更好工作回炉技校 入学一年后退学

南风窗 浏览 1034 08-20

北京银行业绩承压?放在行业中看就明白了

BT财经 浏览 1175 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11