关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02371人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"平民保时捷"衰落:曾年售33万辆 去年一年只卖了14辆

蓝鲸新闻 浏览 316 09-13

印度航空发表坠机声明 坠毁航班号为AI171

北京日报 浏览 4397 06-13

抽检五个,两个不合格!桃李面包因菌落总数超标道歉

国际金融报 浏览 7838 07-31

6-0!6-0!斯瓦泰克送双蛋,首夺温网冠军,还解锁大满贯第100胜

侃球熊弟 浏览 5905 07-13

还没从上周财报中缓过来!博通、甲骨文再下挫,AI基础设施板块继续遭抛售

华尔街见闻官方 浏览 200 12-16

周末全是利好!证监会:全力巩固市场回稳向好,世界人工智能大会发酵

看财经show 浏览 2587 07-28

男子凌晨脱衣拿出棍状物不停敲车 女业主对物业不满

潇湘晨报 浏览 1065 07-11

Meta超级智能实验室重组为四个部门,某些高管将离开

机器之心Pro 浏览 371 08-20

归化专家:陈达毅这个事难点在于他自己提供不了足够的法律文件

直播吧 浏览 2034 07-30

“90后”基金女员工“回家接班”,当选上市公司董事长

经理人杂志 浏览 404 08-20

清华新作ControlAudio:声音何时响、说啥话?都能按剧本可控生成

机器之心Pro 浏览 33 04-22

美军是怎么抓走马杜罗的

澎湃新闻 浏览 181 01-04

章小姐罕见谈婚姻,这个词用得太妙了

Yuki女人故事 浏览 190 01-23

美将向部分签证申请者收取最高1.5万美元保证金

浏览 100271 10-13

美军部署日本与那国岛 有何意图?

浏览 5317 07-14

黄奕对女儿妥协了!12岁黄芊玲正式在韩国训练

阿废冷眼观察所 浏览 5274 08-04

马斯克,重夺全球首富宝座

华尔街见闻官方 浏览 366 09-11

票房1100万,这次谢苗没等来奇迹,但6场打戏,仍拍出动作片良心

皮皮电影 浏览 155 02-05

63岁丁克17年的梁朝伟,坦白在日本养老真实原因

温读史 浏览 277 09-19

美联储主席:不打算先发制人地降息 将继续观望

澎湃新闻 浏览 3038 05-08

她一生跑龙套,87岁成观众心中最美女神

姩姩有娱 浏览 317 09-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11