4名大学生出题,AI考了0分!

近日

4名大学生出题,AI考了0分!-第1张图片

复旦大学一场特殊的

4名大学生出题	,AI考了0分!-第2张图片

“反套路 ”期末考试结束

4名大学生出题,AI考了0分!-第3张图片

在该校“数据挖掘技术”课程考试中

学生们没有坐在考场里答题

反而成了出题人

他们用自己设计的10道题

去“考倒”三个如今 最先进的AI模型

AI答错的题越多

被难倒的模型越强

出题学生的得分就越高

  据了解,51份期末试卷中 ,50人至少让某个AI答错过一题,仅1人完全没难倒任何模型。但能让任一模型整张卷得0分的,只有4人 ,且三个应考模型中最强的Claude模型没有被任何学生完全考倒 。全班平均分85.7分 ,中位数88分。

“AI答错越多,学生得分越高 ”

  “传统的出题考察方式,在AI时代已经失效了。”教授“数据挖掘技术”课程的肖仰华教授说 ,“老师出一道标准的算法题,AI比任何学生都算得快、算得准 。继续用这种方式考,等于在AI的强项上跟AI比 ,这没有意义。 ”

  于是,“数据挖掘技术 ”的期末作业修改了考试方式:每人出10道数据挖掘领域的计算题,要求有唯一正确答案和完整的推导计算过程。拿着这10道题去考三个不同水平的AI模型 。 AI答错越多 ,学生得分越高 。

  “人考AI”考核流程示意图(出题→AI作答→自动判分→助教复核)

  题目必须基于课程讲过的知识或教材内容,每道题要有唯一正确答案,学生自己得先能把题从头到尾算对。肖仰华说:“自己出的题自己都不会 ,那算不上真本事。”

  计算与智能创新学院24级本科生谢锦树最后拿到了97分 。他尝试让AI出题来难倒自己,便搭建了一个多智能体协作的自动化出题框架,用GPT-5.5-Pro做出题层 ,三个应考模型作答并自动判分。框架跑起来后 ,他发现AI会“作弊 ”。

  AI会伪造标准答案,把假答案塞进去让判分脚本以为对了 。它会限制最大输出长度来截断其他模型的推理过程。它会调低推理深度参数让其他模型懒得深入思考。它还会把一道成功了的题目复制十份来凑数 。

  于是,谢锦树加了一个审查层 ,拦截钻空子行为,最终自动生成了10道题,三个应考模型全部答错。

从“怎么算”到“怎么判断”

  考试结束后 ,肖仰华观察到一个差异,即高分学生自己能把题从头到尾算对,低分学生出了题自己也不知道答案。

  “高分同学对AI的弱点有准确判断 ,他们的题能命中AI的结构性缺陷;低分同学只是把课本习题换了个数字,AI在训练时见过千百万遍,直接套模板就对了 。 ”

  这一观察 ,让肖仰华心生警惕。那些能力本来就偏弱的学生,如果只会依赖AI做作业,自己的判断力会进一步退化。

  有了这次尝试 ,肖仰华决定之后课程的考核方式要彻底转型 。“人考AI”的模式会继续做下去 ,而且要做得更系统 。

  在他看来,传统那种考记忆 、考计算的出题方式必须退场,未来的考核重点将全面转向评价能力、判断能力和创造性思维 ,这些高阶能力才是AI替代不了的。

  “所以课堂上更多的时间被用来讨论,学生怎么判断一个结果是对的还是错的?怎么识别AI在哪里会出问题?怎么提出一个AI回答不了的好问题?”肖仰华认为,这门课正在从训练学生“怎么做 ” ,转向训练他们“怎么指挥AI来做、怎么评判AI做的结果”。

  而对于在这次考试中没拿到好成绩的同学,肖仰华表示,下面 的课程设计也会有意识去托住这部分学生 ,帮他们建立最基本的判断底线,不能让他们成为只会点击“确认”的AI使用者 。

  来源:新华社微信公众号综合中国青年报 、复旦大学

(文章来源:券商中国)

标签:

相关推荐

  • 文峰光电北交所IPO7月10日上会

    文峰光电北交所IPO7月10日上会

      根据安排,北交所上市委员会定于7月10日召开2026年第66次审议会议,审核淮南文峰光电科技股份有限公司(以下简称“文峰光电”)首发事项。  据悉,文峰光电主要从事高性能、高可靠性特种线缆及光电组件等产品的研发、生产和销售。公司IPO于2025年12月31日获得受理,并于2026年1月29日进入问询阶段。  本次冲击上市,文峰光电拟募集资金约为2.24亿...

    2026/07/05
  • 美国启动3亿美元锂采购计划 拟用于补充国家国防储备

    美国启动3亿美元锂采购计划 拟用于补充国家国防储备

      美国国防部后勤局(DLA)于7月2日发布招标公告,计划通过一项为期5年的不定数量不定期合同,采购电池级碳酸锂,用于补充国家国防储备。本次采购总量上限约为1.6167万吨,合同总金额比较高达3亿美元,最低保障采购金额约100万美元,投标截止日期为7月17日。该合同要求供应电池级碳酸锂纯度不低于99.5%,以粉末形态交付,并分阶段执行:首年采购约3657吨...

    2026/07/05
  • 1.2t国产车型(18t国产车)

    1.2t国产车型(18t国产车)

    出乎意料,为何雷凌的1.2T运动版会有那么大的反响?因为雷凌2T发动机动力性能超过8L发动机。之前广汽丰田雷凌车型搭载6L、8L两款自然吸气发动机,在更换2T发动机后,将取代6L车型。噪音控制:随着速度增加,胎噪会比较明显,虽隔音降噪处于同级别中等偏上水平,但仍有提升空间。雷凌作为卡罗拉的好兄弟,真身是美版的卡罗拉,本质上是一款汽车,不过丰田既然给区分开了...

    2026/07/05
  • cdv车型排名榜/cdv车型是什么意思

    cdv车型排名榜/cdv车型是什么意思

    cdv市场上有卖吗CDV在市场上有售卖,不过其销售情况因领域不同而有所差异,主要涉及汽车和宠物医疗检测两个领域,以下是具体介绍:汽车领域CDV作为一种基于轿车平台的厢式车,在全球范围内已被广泛接受。在中国市场,有世界化CDV车型在售。例如,郑州日产引入的NV200,这款车凭借其独特的设计和实用的性能,广受消费者欢迎。CDV,即CarDerivedVan...

    2026/07/05
  • 7.9限号没有(限号755出去)

    7.9限号没有(限号755出去)

    北京汽车限号是几〖壹〗、北京机动车尾号限行安排如下:星期一到星期五限行尾号分别为5和0、1和2和3和4和9,尾号为英文字母按0号管理。限行时间方面,载客汽车在工作日早晚高峰(7时至9时、17时至20时)限行,星期六日及法定节假日不限行;载货汽车每天6时至24时限行。〖贰〗、星期一:限行尾号1和6星期二:限行尾号2和7星期三:限行尾号3和8星期四:限行尾号4...

    2026/07/05
  • 传祺车型及报价图片/传祺汽车报价及图片易车网

    传祺车型及报价图片/传祺汽车报价及图片易车网

    传祺gs8新款2025款报价及图〖壹〗、025款传祺GS8领航系列报价如下:领航四驱豪华版(5座)官方指导价172,800元,经销商借鉴价157,800元起;领航两驱豪华版(5座)官方指导价159,800元,经销商借鉴价144,800元起。费用体系解析2025款传祺GS8领航系列提供两种动力配置选取。〖贰〗、费用:GS8厂商指导价198-298万,20...

  • 4名大学生出题,AI考了0分!

    4名大学生出题,AI考了0分!

    近日复旦大学一场特殊的“反套路”期末考试结束在该校“数据挖掘技术”课程考试中学生们没有坐在考场里答题反而成了出题人他们用自己设计的10道题去“考倒”三个如今最先进的AI模型AI答错的题越多被难倒的模型越强出题学生的得分就越高  据了解,51份期末试卷中,50人至少让某个AI答错过一题,仅1人完全没...

    2026/07/05
  • 【31省区市新增无症状感染者23例,31省区市新增42例无症状感染者】

    【31省区市新增无症状感染者23例,31省区市新增42例无症状感染者】

    31省新增本土确诊23例,具体情况如何?本土病例23例(河北20例,北京1例,辽宁1例,黑龙江1例);无新增死亡病例;新增疑似病例2例,其中境外输入病例1例(在上海),本土病例1例(在辽宁)。当日新增治愈出院病例21例,解除医学观察的密切接触者784人,重症病例较前一日增加1例。境外输入现有确诊病例285例(其中重症病例4例),现有疑似病例2例。累计确诊病...

  • 31省新增本土确诊35例/31省新增本土确诊55例

    31省新增本土确诊35例/31省新增本土确诊55例

    9月26日莆田无新增本土确诊病例及本土无症状感染者病例〖壹〗、莆田新型冠状病毒肺炎疫情情况9月26日0—24时,莆田市无新增本土确诊病例,无新增本土无症状感染者病例。全国疫情通报数据详见下文:9月26日0—24时,31个省和新疆生产建设兵团报告新增确诊病例35例。其中境外输入病例22例,含3例由无症状感染者转为确诊病例;本土病例13例。无新增死亡病例。无新...

  • 四川成都疫情最新情况(四川成都疫情最新消息2021)

    四川成都疫情最新情况(四川成都疫情最新消息2021)

    成都无新增!这些谣言不可信→截至6月6日24时,成都无新增新冠肺炎确诊病例,无新增无症状感染者。同时,提醒大家在疫情期间警惕以下6种收“智商税”的产品,切勿盲目购买:日本消毒卡号称佩戴在胸前或装在口袋内可持续散发二氧化氯,净化周围半径50厘米内的空气,隔离细菌、病毒等。成都3月15日无新增新冠肺炎确诊病例,网传“不戴口罩扣6分”等消息为谣言。月19日0-...

返回顶部