4名大学生出题,AI考了0分!
创始人
2026-07-04 00:55:06

  近日

  复旦大学一场特殊的

  “反套路”期末考试结束

  在该校“数据挖掘技术”课程考试中

  学生们没有坐在考场里答题

  反而成了出题人

  他们用自己设计的10道题

  去“考倒”三个当今最先进的AI模型

  AI答错的题越多、

  被难倒的模型越强

  出题学生的得分就越高

  据了解,51份期末试卷中,50人至少让某个AI答错过一题,仅1人完全没难倒任何模型。但能让任一模型整张卷得0分的,只有4人,且三个应考模型中最强的Claude模型没有被任何学生完全考倒。全班平均分85.7分,中位数88分。

  “AI答错越多,学生得分越高”

  “传统的出题考查方式,在AI时代已经失效了。”教授“数据挖掘技术”课程的肖仰华教授说,“老师出一道标准的算法题,AI比任何学生都算得快、算得准。继续用这种方式考,等于在AI的强项上跟AI比,这没有意义。”

  于是,“数据挖掘技术”的期末作业修改了考试方式:每人出10道数据挖掘领域的计算题,要求有唯一正确答案和完整的推导计算过程。拿着这10道题去考三个不同水平的AI模型。AI答错越多,学生得分越高。

  “人考AI”考核流程示意图(出题→AI作答→自动判分→助教复核)

  题目必须基于课程讲过的知识或教材内容,每道题要有唯一正确答案,学生自己得先能把题从头到尾算对。肖仰华说:“自己出的题自己都不会,那算不上真本事。”

  计算与智能创新学院24级本科生谢锦树最后拿到了97分。他尝试让AI出题来难倒自己,便搭建了一个多智能体协作的自动化出题框架,用GPT-5.5-Pro做出题层,三个应考模型作答并自动判分。框架跑起来后,他发现AI会“作弊”。

  AI会伪造标准答案,把假答案塞进去让判分脚本以为对了。它会限制最大输出长度来截断其他模型的推理过程。它会调低推理深度参数让其他模型懒得深入思考。它还会把一道成功了的题目复制十份来凑数。

  于是,谢锦树加了一个审查层,拦截钻空子行为,最终自动生成了10道题,三个应考模型全部答错。

  从“怎么算”到“怎么判断”

  考试结束后,肖仰华观察到一个差异,即高分学生自己能把题从头到尾算对,低分学生出了题自己也不知道答案。

  “高分同学对AI的弱点有准确判断,他们的题能命中AI的结构性缺陷;低分同学只是把课本习题换了个数字,AI在训练时见过千百万遍,直接套模板就对了。”

  这一观察,让肖仰华心生警惕。那些能力本来就偏弱的学生,如果只会依赖AI做作业,自己的判断力会进一步退化。

  课上,一名学生分享“人考AI”出题的设计思路

  有了这次尝试,肖仰华决定之后课程的考核方式要彻底转型。“人考AI”的模式会继续做下去,而且要做得更系统。

  在他看来,传统那种考记忆、考计算的出题方式必须退场,未来的考核重点将全面转向评价能力、判断能力和创造性思维,这些高阶能力才是AI替代不了的。

  “所以课堂上更多的时间被用来讨论,学生怎么判断一个结果是对的还是错的?怎么识别AI在哪里会出问题?怎么提出一个AI回答不了的好问题?”肖仰华认为,这门课正在从训练学生“怎么做”,转向训练他们“怎么指挥AI来做、怎么评判AI做的结果”。

  在这门课中,学生借助AI Agent完成数据挖掘实操练习

  而对于在这次考试中没拿到好成绩的同学,肖仰华表示,接下来的课程设计也会有意识去托住这部分学生,帮他们建立最基本的判断底线,不能让他们成为只会点击“确认”的AI使用者。

  来源:中国青年报、复旦大学

相关内容

我在大陆种兰花
  来自台湾南投的廖怡婷,在四川省凉山彝族自治州西昌建起了一座兰花...
2026-07-04 01:55:24
排查整治隐患 牢守安全底线...
  新华社北京7月2日电题:排查整治隐患 牢守安全底线——2026...
2026-07-04 01:55:16
视频丨外交部:坚决反对有关...
  针对美国和欧盟对7月1日起施行的《中华人民共和国民族团结进步促...
2026-07-04 00:57:36
中工网评丨“七一勋章”背后...
  中工网评论员 李嘉宇  方寸勋章,承载百年荣光;平凡身影,铸就...
2026-07-04 00:56:10
应急管理部针对广东、广西、...
  据气象部门预测,受今年第10号台风“美莎克”影响,7月3日至6...
2026-07-04 00:55:31
4名大学生出题,AI考了0...
  近日  复旦大学一场特殊的  “反套路”期末考试结束  在该校...
2026-07-04 00:55:06

热门资讯

我在大陆种兰花   来自台湾南投的廖怡婷,在四川省凉山彝族自治州西昌建起了一座兰花园,带动周边80多名彝族、回族和汉...
排查整治隐患 牢守安全底线——...   新华社北京7月2日电题:排查整治隐患 牢守安全底线——2026年全国“安全生产月”活动综述  新...
视频丨外交部:坚决反对有关国家...   针对美国和欧盟对7月1日起施行的《中华人民共和国民族团结进步促进法》表达所谓关切,外交部发言人郭...
中工网评丨“七一勋章”背后,闪...   中工网评论员 李嘉宇  方寸勋章,承载百年荣光;平凡身影,铸就时代脊梁。7月1日上午,庆祝中国共...
应急管理部针对广东、广西、海南...   据气象部门预测,受今年第10号台风“美莎克”影响,7月3日至6日,广东、广西、海南有强降雨过程。...
4名大学生出题,AI考了0分!   近日  复旦大学一场特殊的  “反套路”期末考试结束  在该校“数据挖掘技术”课程考试中  学生...
保加利亚总理:将对欧盟对俄制裁...   保加利亚总理拉德夫3日说,保加利亚将对欧盟第21轮对俄罗斯制裁措施表达保留意见。  拉德夫当天在...
理响中国·一笔一画|锚定目标,...   监制:翟亚菲、杨璐  策划:于浩波  制图:侯亚荣  支持:黄丹琳  出品:环球网评论部、“一笔...
零时差丨世界向东看,福山关于中...   提出“历史终结论”的美国政治学者弗朗西斯·福山,不久前在接受德国《法兰克福汇报》采访时坦言,如果...
机电产品出口增势良好 外贸发展...   央视网消息 (新闻联播):今年以来,我国机电产品出口保持良好增长势头,技术含量高、附加值高的产品...
各地庆祝建党105周年 凝聚新...   央视网消息(新闻联播):行程万里,不忘初心。连日来,各地广大党员干部群众以多种形式庆祝建党105...
1.04亿人次、8.24亿吨,...   7月的高原,清冽的风中带着阳光的炽热,雪域大地上透着盎然生机。列车穿峡谷、跨戈壁、越草原,在雪山...
市场规模预计超3000亿元,工...   近年来,工业旅游在全国各地蓬勃兴起,众多工业遗存与工业厂区变身为创意园区、博物馆等文化新空间,一...
7月5日起 国内航线燃油附加费...   记者从国航、东航、南航等多家航司了解到,自2026年7月5日(含)起销售的国内航线客票,燃油附加...
法治在线丨银行卡密码泄露?当心...   银行App上显示银行卡密码泄露了怎么办?别慌!仔细看看手机上安装的App是不是真的,当心是下载了...
襄阳审计:“三聚焦”关注专项债... 荆楚网(湖北日报网)讯(通讯员 孙巧巧 刘晶晶)近日,襄阳市审计局在开展市本级2025年度预算执行和...
光荣在党50年,他们有话对党说 6月25日,在英山县红山镇金盆村,74岁的李淑芳(右)和丈夫何维友胸前佩戴“光荣在党50年”纪念章,...
“武汉造”好车沿丝路驶向中亚 ... 湖北日报讯 (记者杨文漪、见习记者田婉娴、通讯员金玉立)7月2日,武汉黄鹤楼公园内,随着一列岚图新能...
名山保护不是一围了之 □ 湖北日报评论员 杜宇慧近期,多位市民及户外爱好者反映,泰山景区周边建成了长达135公里的刀片刺绳...
青山区首家A股企业诞生 吉和昌... 楚天都市报极目新闻讯(记者林楚晗 通讯员董博 蔡敏 范世明)7月2日,北京证券交易所传来喜讯:扎根武...