ChatGPT挑机文凭试　一分钟内答完获5级佳绩

（香港文汇报记者金文博）人工智能（AI）工具ChatGPT自推出以来引起广泛讨论，在教育界更引发激烈争议，海外及本港先后有大学禁止学生于课业中使用AI工具，同时亦有大学持较开放及积极的态度。事实上，除了大学外，生成式人工智能工具对基础教育以至公开试发展也同样带来挑战。

一年一度的中学文凭试（DSE）在今日（21日）开考。香港文汇报针对主要以文字答题的通识科和中史科考试，日前让ChatGPT作答2022年两份考卷的选答题，并分别邀得本港资深教育界人士为答案评分。结果显示，ChatGPT在不足一分钟时间内，通识科能取得足够升读大学的3级成绩，而中史科考试更获评5级佳绩。教育界人士表示，虽然公开试的试场监考形式暂不会受ChatGPT影响，但AI工具能轻易取得不逊于一般学生水平的成绩，可能会影响校本评核的结果。同时，随着各项AI工具的“进化”，答案将愈来愈精准，将会对中学教育及考核带来极大冲击。

未掌握通识卷应试要求

（香港文汇报记者叶子之）香港文汇报日前选取了2022年DSE通识科卷二延伸回应题第一题予ChatGPT回答。该题目提供了三项关于虚拟祭祀、电子红包及环保中秋的数据，要求考生根据数据1）回答并解释网上祭祀有哪些好处，及 2）表态并论证在多大程度上同意，在现代社会实践中国传统习俗时应优先考虑环保。

通识答题

在首部分中，ChatGPT的答案骤眼看头头是道。它提出了网上祭祀可减少环境污染风险，同时方便远离香港的家人和朋友参与纪念，表达对先人的思念和礼敬，同时促进家族间的联系和交流。在第二部分，ChatGPT表明同意环保因素应优先考虑，及列出三个支持理由，包括“保护环境是我们的责任”、“现代科技提供了一些环保的替代方案”及“环保是对下一代的责任”，并尝试逐一说明。（问答全文请扫码）

香港文汇报邀请资深通识科老师、立法会议员邓飞为答案评分。他表示，在共占8分的首部分中，有关答案可得到6分相等于4级的成绩，但ChatGPT所提供的答案未有理会题目提供的数据，只用“常识”作答。

缺正反两面论述

占12分的第二部分，评分则为仅仅合格（2级），两部分合计大约可得3级。邓飞解释，题目中的“多大程度上认同”除了要求明确回答认同与否的程度，还要求考生从正反两面论述对比，不应只说出一方面的观点。在ChatGPT答案中，只说出支持优先考虑环保的理由，却没有从反面说出质疑的理由，并不符合考试要求，所以只能仅仅合格。

他表示，从答案分析，ChatGPT最大的问题在于未能掌握应试及题型要求重点，因为有些答题技巧未必是从试卷题目中字面显示，而是通过日常教学及考评局与前线老师沟通等所得。

邓飞表示，根据目前的数据显示，ChatGPT及其他AI工具尚不知道考试要求，即使以它来作弊，可能只得到合格的分数，对学生考试“出猫”诱因看似有限，然而不能排除若将来各项AI工具能进一步“掌握”考试的答题要求，只要输入仔细的问题指令后，就可能提高答案准确度。

中史答卷全面援引稍不足

香港文汇报日前向ChatGPT发问了2022年文凭试中史科试题卷二单元三“时代与知识分子”的第七题。题目提供了两份数据，包括孔子辅佐鲁定公和齐景公会盟的“夹谷之会”，以及孔子处理鲁国中三家拥“百雉之城”贵族的“堕三都”事件，要求考生论析孔子1）对鲁国外交和内政的贡献，和 2）如何从周游列国、讲学授徒和整体典籍三方面实践政治理想。

中史答题

ChatGPT在答题时，依照了问题所指的外交和内政，及周游列国、讲学授徒和整体典籍三方面点列说明。其间，记者曾指示ChatGPT“tell me more”，它在短短一分钟内一举回答了2,000字内容（问答全文请扫码）。

香港文汇报记者邀请到教联会副主席、中史科教师穆家骏为有关答案评分，单以该题而言，ChatGPT获评DSE 5级水平，表现较通识卷为优。

就问题第一部分而言，穆家骏表示，ChatGPT能引用资料中有关“夹谷之会”的文字和史实，分析孔子的外交贡献，惟在内政方面单纯参照资料，没有引用史实解释“百雉之城”的意思和意义，以及孔子如何对付季孙氏、叔孙氏和孟孙氏这三个僭越自拥“百雉之城”的鲁国卿大夫，因此只能获得10分中的7分。

善用AI辅助而非倚赖

在第二部分，穆家骏表示，ChatGPT大致能够从周游列国、讲学授徒和整理典籍三方面回答题目要求，只是在史实援引方面稍有不足，例如并没有提出一些著名例子，来析论孔子如何透过讲学授徒来实践政治理想，包括其门下出了子路、子贡等后来都投身政治的学生等，「其余整体的表现都不错」，因此可获15分中的13分。

就ChatGPT等生成式AI对于中学教育带来的冲击和影响，穆家骏认为，很多情况下若学生只是利用AI工具作“头脑风暴”（brainstorming）之用，教师与学校确难以分辨，因此重要的是教育学生怎样善用AI辅助自己学习，而非完全倚赖AI作答，自己却完全不用脑去思考。

◆各项AI工具的答案将愈来愈精准，将会对中学教育及考核带来极大冲击。图为去年文凭试的一个试场。数据图片

邓飞：对文科或有利理科恐冇着数

ChatGPT等生成式AI工具的诞生和不断发展，邓飞直言，它们对中学教育与学生的学习行为和质量都一定会带来冲击，尤其是对语文科、人文社会学科及商科等影响更大。由于学校不可能要求学生留校在老师的监督下完成所有功课，因此当他们在家做功课时，就有机会利用AI工具“精准地、聪明地作弊（smart cheating）”，例如将AI工具给予的答案进行撮写，或是花费心力对它问出精准、仔细的问题，以获得满意和符合功课要求的答案。

◆邓飞直言，生成式AI工具对中学教育与学生的学习行为和质量都一定会带来冲击。香港文汇报记者万灵霜摄

邓飞表示，对理科知识和运算思维，如果学生平时透过生成式AI工具直接把题目输入，很快就可以获得答案，“但是当到了考试、测验时就一定会‘现形’，不懂得作答。”然而，如果学生于语言及社会人文科目利用AI工具，却不一定会有“现形”的情况，因为他们平日在“精准地、聪明地作弊”的时候，可能不知不觉中磨练出相当程度的语言和社会人文素养，这样他们的考试表现或比平日稍为逊色，却未至于会“现形”、“交白卷”。

可能破坏师生间信任

在谈到ChatGPT等生成式AI工具对学校带来的冲击，邓飞指出，其中一个重大挑战在于，中小学较难像大学般设置专门软件程序去检视、侦察学生的功课是否具有抄袭、作弊或经过AI生成的成分，因此要迫不得已做最坏假设，可能会将功课改成频繁堂课和测验，以确保学生有真正去学习而非倚赖AI。这样做的代价就是，一方面会扰乱学校的教学秩序，“什么时候家课、堂课、小测、大测和大考的规律会被打破，而频繁地测验也会增加学生的应考压力，对心理健康可能造成负面影响。”另一方面，也会引致师生间互相防备，破坏彼此间的信任。

邓飞认为，ChatGPT亦可带出“智者问得巧，愚者问得笨”效果，对教学有相应好处，“学习的关键就是要懂得‘问’问题，不是问一些空泛的问题，而是要问得精准。”

他解释，为令AI回答时更“对症下药”，学生需要向AI提出精准问题，其思维能力“唔会弱得去边，一定是‘醒目’的学生”，但如果学生只倚赖AI而懒得去思考、寻找答案，“如此会浪费了磨练和发挥其学习潜质的机会，十分可惜。”

考评局：AI作品当自创属违规

DSE笔试时不可使用ChatGPT，对考试影响不大，但邓飞表示，现时DSE的校本评核，例如中文科的阅读报告，形式与“浓缩版”的大学论文相似，同样会面对因ChatGPT而生的作弊风险与冲击。考评局在回复香港文汇报查询时强调，如考生把以AI工具构成的作品及由他人完成的习作，无论是部分或全部，将之当作自己的作品向教师递交，属违规行为。学生在完成课业过程中，可参考不同类别的数据，但不可触犯抄袭行为，并须在作业中注明所引用数据的来源并加以鸣谢。

指教师能核证学生作品

在今年DSE精简安排下，本届维持校本评核的科目由原有14科减至4科，即中文、英文、设计与应用科技及视觉艺术，分别占总分10%、15%、20%及50%。考评局提醒，在完成校本评核活动的过程中，学生须谨记不可触犯任何违规行为，而任教老师应密切留意学生的进度，以核证所评核的习作是学生本人的作品。

考评局解释，教师是最了解学生能力的人，只要透过适当监察，应能发现违规行为，而根据该局提供有关各科校本评核的评核指引，老师可参考不同措施以防止作弊情况，包括评核活动应大部分在学校环境进行，把校本评核融入日常学与教过程中，而非设计成课程的外加部分，以及把校本评核活动纳入校内日常评估措施的一部分。

责编：陈楚发

ChatGPT挑机文凭试 一分钟内答完获5级佳绩

正在加载评论……

ChatGPT挑机文凭试　一分钟内答完获5级佳绩