您的位置: 首頁 > 文化旅游 > 详情

ChatGPT挑机文凭试 一分钟内答完获5级佳绩

2023年04月21日 12:15:24  來源:文汇网

(香港文汇报记者 金文博)人工智能(AI)工具ChatGPT自推出以来引起广泛讨论,在教育界更引发激烈争议,海外及本港先后有大学禁止学生于课业中使用AI工具,同时亦有大学持较开放及积极的态度。事实上,除了大学外,生成式人工智能工具对基础教育以至公开试发展也同样带来挑战。

一年一度的中学文凭试(DSE)在今日(21日)开考。香港文汇报针对主要以文字答题的通识科和中史科考试,日前让ChatGPT作答2022年两份考卷的选答题,并分别邀得本港资深教育界人士为答案评分。结果显示,ChatGPT在不足一分钟时间内,通识科能取得足够升读大学的3级成绩,而中史科考试更获评5级佳绩。教育界人士表示,虽然公开试的试场监考形式暂不会受ChatGPT影响,但AI工具能轻易取得不逊于一般学生水平的成绩,可能会影响校本评核的结果。同时,随着各项AI工具的“进化”,答案将愈来愈精准,将会对中学教育及考核带来极大冲击。

未掌握通识卷应试要求

(香港文汇报记者 叶子之)香港文汇报日前选取了2022DSE通识科卷二延伸回应题第一题予ChatGPT回答。该题目提供了三项关于虚拟祭祀、电子红包及环保中秋的数据,要求考生根据数据1)回答并解释网上祭祀有哪些好处,及 2)表态并论证在多大程度上同意,在现代社会实践中国传统习俗时应优先考虑环保。

通识答题

在首部分中,ChatGPT的答案骤眼看头头是道。它提出了网上祭祀可减少环境污染风险,同时方便远离香港的家人和朋友参与纪念,表达对先人的思念和礼敬,同时促进家族间的联系和交流。在第二部分,ChatGPT表明同意环保因素应优先考虑,及列出三个支持理由,包括“保护环境是我们的责任”、“现代科技提供了一些环保的替代方案”及“环保是对下一代的责任”,并尝试逐一说明。(问答全文请扫码)

香港文汇报邀请资深通识科老师、立法会议员邓飞为答案评分。他表示,在共占8分的首部分中,有关答案可得到6分相等于4级的成绩,但ChatGPT所提供的答案未有理会题目提供的数据,只用“常识”作答。

缺正反两面论述

12分的第二部分,评分则为仅仅合格(2级),两部分合计大约可得3级。邓飞解释,题目中的“多大程度上认同”除了要求明确回答认同与否的程度,还要求考生从正反两面论述对比,不应只说出一方面的观点。在ChatGPT答案中,只说出支持优先考虑环保的理由,却没有从反面说出质疑的理由,并不符合考试要求,所以只能仅仅合格。

他表示,从答案分析,ChatGPT最大的问题在于未能掌握应试及题型要求重点,因为有些答题技巧未必是从试卷题目中字面显示,而是通过日常教学及考评局与前线老师沟通等所得。

邓飞表示,根据目前的数据显示,ChatGPT及其他AI工具尚不知道考试要求,即使以它来作弊,可能只得到合格的分数,对学生考试“出猫”诱因看似有限,然而不能排除若将来各项AI工具能进一步“掌握”考试的答题要求,只要输入仔细的问题指令后,就可能提高答案准确度。

中史答卷全面 援引稍不足

香港文汇报日前向ChatGPT发问了2022年文凭试中史科试题卷二单元三“时代与知识分子”的第七题。题目提供了两份数据,包括孔子辅佐鲁定公和齐景公会盟的“夹谷之会”,以及孔子处理鲁国中三家拥“百雉之城”贵族的“堕三都”事件,要求考生论析孔子1)对鲁国外交和内政的贡献,和 2)如何从周游列国、讲学授徒和整体典籍三方面实践政治理想。

中史答题

ChatGPT在答题时,依照了问题所指的外交和内政,及周游列国、讲学授徒和整体典籍三方面点列说明。其间,记者曾指示ChatGPTtell me more”,它在短短一分钟内一举回答了2,000字内容(问答全文请扫码)。

香港文汇报记者邀请到教联会副主席、中史科教师穆家骏为有关答案评分,单以该题而言,ChatGPT获评DSE 5级水平,表现较通识卷为优。

就问题第一部分而言,穆家骏表示,ChatGPT能引用资料中有关“夹谷之会”的文字和史实,分析孔子的外交贡献,惟在内政方面单纯参照资料,没有引用史实解释“百雉之城”的意思和意义,以及孔子如何对付季孙氏、叔孙氏和孟孙氏这三个僭越自拥“百雉之城”的鲁国卿大夫,因此只能获得10分中的7分。

善用AI辅助 而非倚赖

在第二部分,穆家骏表示,ChatGPT大致能够从周游列国、讲学授徒和整理典籍三方面回答题目要求,只是在史实援引方面稍有不足,例如并没有提出一些著名例子,来析论孔子如何透过讲学授徒来实践政治理想,包括其门下出了子路、子贡等后来都投身政治的学生等,「其余整体的表现都不错」,因此可获15分中的13分。

ChatGPT等生成式AI对于中学教育带来的冲击和影响,穆家骏认为,很多情况下若学生只是利用AI工具作“头脑风暴”(brainstorming)之用,教师与学校确难以分辨,因此重要的是教育学生怎样善用AI辅助自己学习,而非完全倚赖AI作答,自己却完全不用脑去思考。

◆各项AI工具的答案将愈来愈精准,将会对中学教育及考核带来极大冲击。图为去年文凭试的一个试场。 数据图片

邓飞:对文科或有利 理科恐冇着数

ChatGPT等生成式AI工具的诞生和不断发展,邓飞直言,它们对中学教育与学生的学习行为和质量都一定会带来冲击,尤其是对语文科、人文社会学科及商科等影响更大。由于学校不可能要求学生留校在老师的监督下完成所有功课,因此当他们在家做功课时,就有机会利用AI工具“精准地、聪明地作弊(smart cheating)”,例如将AI工具给予的答案进行撮写,或是花费心力对它问出精准、仔细的问题,以获得满意和符合功课要求的答案。

◆邓飞直言,生成式AI工具对中学教育与学生的学习行为和质量都一定会带来冲击。 香港文汇报记者万灵霜 摄

邓飞表示,对理科知识和运算思维,如果学生平时透过生成式AI工具直接把题目输入,很快就可以获得答案,“但是当到了考试、测验时就一定会‘现形’,不懂得作答。”然而,如果学生于语言及社会人文科目利用AI工具,却不一定会有“现形”的情况,因为他们平日在“精准地、聪明地作弊”的时候,可能不知不觉中磨练出相当程度的语言和社会人文素养,这样他们的考试表现或比平日稍为逊色,却未至于会“现形”、“交白卷”。

可能破坏师生间信任

在谈到ChatGPT等生成式AI工具对学校带来的冲击,邓飞指出,其中一个重大挑战在于,中小学较难像大学般设置专门软件程序去检视、侦察学生的功课是否具有抄袭、作弊或经过AI生成的成分,因此要迫不得已做最坏假设,可能会将功课改成频繁堂课和测验,以确保学生有真正去学习而非倚赖AI。这样做的代价就是,一方面会扰乱学校的教学秩序,“什么时候家课、堂课、小测、大测和大考的规律会被打破,而频繁地测验也会增加学生的应考压力,对心理健康可能造成负面影响。”另一方面,也会引致师生间互相防备,破坏彼此间的信任。

邓飞认为,ChatGPT亦可带出“智者问得巧,愚者问得笨”效果,对教学有相应好处,“学习的关键就是要懂得‘问’问题,不是问一些空泛的问题,而是要问得精准。”

他解释,为令AI回答时更“对症下药”,学生需要向AI提出精准问题,其思维能力“唔会弱得去边,一定是‘醒目’的学生”,但如果学生只倚赖AI而懒得去思考、寻找答案,“如此会浪费了磨练和发挥其学习潜质的机会,十分可惜。”

考评局:AI作品当自创属违规

DSE笔试时不可使用ChatGPT,对考试影响不大,但邓飞表示,现时DSE的校本评核,例如中文科的阅读报告,形式与“浓缩版”的大学论文相似,同样会面对因ChatGPT而生的作弊风险与冲击。考评局在回复香港文汇报查询时强调,如考生把以AI工具构成的作品及由他人完成的习作,无论是部分或全部,将之当作自己的作品向教师递交,属违规行为。学生在完成课业过程中,可参考不同类别的数据,但不可触犯抄袭行为,并须在作业中注明所引用数据的来源并加以鸣谢。

指教师能核证学生作品

在今年DSE精简安排下,本届维持校本评核的科目由原有14科减至4科,即中文、英文、设计与应用科技及视觉艺术,分别占总分10%15%20%50%。考评局提醒,在完成校本评核活动的过程中,学生须谨记不可触犯任何违规行为,而任教老师应密切留意学生的进度,以核证所评核的习作是学生本人的作品。

考评局解释,教师是最了解学生能力的人,只要透过适当监察,应能发现违规行为,而根据该局提供有关各科校本评核的评核指引,老师可参考不同措施以防止作弊情况,包括评核活动应大部分在学校环境进行,把校本评核融入日常学与教过程中,而非设计成课程的外加部分,以及把校本评核活动纳入校内日常评估措施的一部分。

责编:陈楚发

  • 相關新聞
  • 發表評論
以下留言只代表網友本人觀點,不代表本網站觀點

正在加载评论……

警队招募日吸逾400人即场交表
警队招募日吸逾400人即场交表警察招募体验日反应热烈,上午收逾400份即场申请。图为参观者在仿真靶场体验雷射射击。(香港文汇报记者郭木又...
澳门回归25周年|岑浩辉:深度
澳门回归25周年|岑浩辉:深度(香港文汇报记者康敬)澳门是联系国家与葡语系国家的重要桥梁,深度搭建好中葡平台是澳门未来着力发展的方向...