人类什么时候能打败AI?北京大学的这场考试里,本科生战胜了AI!
创始人
2025-12-25 21:15:34

这场考试里,北京大学的本科生打败了AI!北大团队打造硬核化学评测题库SUPERChem,174名化学学霸与GPT、Gemini、deeppseek等顶尖AI同场竞技,500道防作弊高难度化学试题,暴露AI科学推理短板。

SUPERChem的诞生,填补了化学领域多模态深度推理评测的空白。

据悉,团队发布这项成果,并非为了证明AI的短板,而是为了推动它走得更远。目前,SUPERChem项目已全面开源。团队希望这套源自北大的“试卷”,能成为全球科学与人工智能领域的公共财富,去催化下一次技术的爆发。或许在不久的将来,当我们再次打开这张试卷时,AI能交出一份满分的答卷。

相关内容

热门资讯

福布斯中国研享行|在联想,聊聊... 我们无法抛开科技进步单独谈论女性进步,正如我们无法脱离AI去畅想女性的未来。 3月18日,福布斯中国...
江苏深网科技申请基于Linux... 国家知识产权局信息显示,江苏深网科技有限公司申请一项名为“一种基于Linux内核的零拷贝端口复用的方...
马斯克“扫货”光伏设备 AI加... 来源:财联社 “太空将是迄今为止放置AI最便宜的地方。在36个月内,或者更短,比如说30个月内,太空...
腾讯元宝AI更换Logo,长眼... 腾讯元宝 AI 今日官宣更换 Logo,采用了更拟人化的样式,在原版 Logo 的基础上添加了眼睛。...
All in AI后,手机正在... 文 | DoNews网站 雁秋 在位于巴塞罗那的2026世界移动通信大会(MWC)展馆内,荣耀展台...