img

从今年春天开始,很多高校教师发现,AI已经悄然渗透进高校学生学业的核心考察环节。

越来越多的学生,开始借助AI完成自己的课程论文、毕业论文。AI「统一」了一部分人的写作风格,大话、套话、车轱辘话占据文章越来越多的部分。很多学校开始检测论文的AI率,但荒诞的场景也在出现:明明用了AI的,很可能不高;明明没用的,很可能挺高。

检测AI率,成了「玄学」;把AI率降到学校和老师规定的比例之下,同样是「玄学」。

用AI写论文,用AI检测论文的AI率,再用AI把AI率降下去。同学之间开玩笑说,世界像个巨大的机器人。

当AI入侵本该体现思辨力、创造力的毕业论文时,师生之间突然都进入到一种无序的状态……

入侵

周冉的毕业论文是在AI的帮助之下通过的。

她是四川一所二本院校法学系的学生,今年毕业。春天,由自己完成的初稿交给老师后,周冉没多久就收到了反馈:「写得非常差」。

于是在改稿时,周冉尝试使用AI。她把自己论文中的观点抛给AI,问它对此有怎样的看法,然后对自己的初稿做补充;同时根据AI的回答去找相关的论文,再把论文里的观点补充到自己的文章里。

最让她惊喜的,AI不止提供理论资料,还有案例。哪怕没有直接提供案例材料,也会给出相关的网站,周冉借此给自己的论文增加了很多全新的内容,弥补了初稿「太过理论,缺少实务」的不足。

CDT 档案卡
标题:人物|当AI入侵大学论文
作者:人物
发表日期:2024.8.27
来源:微信公众号“人物”
主题归类:学术不端
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

二稿提交后,除了一些格式、措辞方面的小问题,老师没再说什么。论文顺利通过了。

周冉说,在毕业季,身边几乎每个同学都会不同程度地借助AI完成论文,大家也会在私下里互相分享更好用的软件。

2022年11月,OpenAI公司推出ChatGPT,这款AI工具,能通过学习和理解人类的语言来进行对话,并且有很强的自然语言生成能力。通俗的理解就是:AI能帮你写文章了。近两年,国内的AI通用大模型例如文心一言、通义千问、Kimi等也陆续进入市场。AI离日常生活越来越近,不可避免地入侵到毕业论文。2024届毕业生,也成为第一波在论文中大规模使用AI的群体。

在很多高校的校内论坛中,总能看到互相租借ChatGPT账号的帖子;在其他社交媒体,也有很多关于如何在毕业论文中使用AI的攻略,例如「1小时写完论文的GPT指令」。有网友调侃,「毕业论文的致谢,最该感谢的是AI」。

一所重点高校的女孩楚楚说,不管是课程论文还是毕业论文,使用AI几乎成了学校里「公开的秘密」。

平日,期末考试周几乎是一个学期里最难熬的阶段,一周时间里要考几门试,同时要交大概三四篇、总数两万字以上的论文。「比如一篇6000字的作业,从零开始一篇一篇查论文,一点一点去写,对我来说是可行的,但对时间来说是不可行的,我需要更高效的产出方式。」楚楚说。

她最早接触到AI是在去年,同学们聚在一起闲聊,她感慨论文写得很痛苦。一旁的同学推荐了ChatGPT,说「GPT让我效率倍增」,她尝试着用了用,发现很高效,一路摸索着找到了适合自己的国产AI软件。

楚楚说,AI能帮人写一个几百字的小东西,但想要完成一篇完整的文章,它只能帮人在某些步骤上节省时间。大多时候,她拿AI当做一个「高级浏览器」使用。

写一篇综述性文章,楚楚往往需要精读十篇论文,再泛读二三十篇。「以往需要三四天时间看资料,真的是人肉在啃,看得我头都大了」,现在这个工作由AI替代,直接筛选出最有用的资料,同时,把一篇论文的PDF上传,就能迅速生成论文的框架和提炼后的内容,这样便可以跳读,而不必读完整篇论文了。如今,前期的阅读时间有两个小时就够了。

阅读完成后,楚楚会将筛选出的有效资料和自己生发出的灵感一起提供给AI,由它生成一个文章框架;紧接着为这个框架增添血肉,针对更详细的小标题,问AI能找到哪些资料,最后结合自己的想法补充完整,一篇文章的底稿就完成了。

「它生成的不是最出色的,但却是最保险的。」楚楚说。只不过,AI用多了,发现有时候自己动手写的东西也一股「AI味儿」——官方的、书面的语言风格,以及习惯性的「总分」结构。

img

「渡劫」

高校教师们也逐渐感受到了AI的入侵。在社交媒体上,一边是学生们的使用攻略,另一边也不乏老师们的观察。

有的老师质疑,「好多表达很奇怪,真的在想是不是AI生成的」;也有人分析,「有位学生用AI写的,是特别拙劣一眼就能看出的程度,比如国内外研究现状一篇论文都没有,都是大话套话,研究建议提的都是跟自己研究一点关系没有的空话」 ;有的老师感慨,「每年带毕业论文都感觉在渡劫,抄袭、AI、拼凑,自以为不露痕迹」……

毕业论文的字里行间弥漫着浓浓的「AI味儿」,越来越难闻到「人味儿」。是很多老师共同的感受。

中国政法大学人文学院的老师王敬雅发现,由AI生成的论文最大的特点,就是容易出现「假大空的车轱辘话」,给出一个论点,得到三个分论点;拿其中的分论点追问,再次得到三个分论点。但往往没有什么研究意义。

王敬雅平时和同事们交流时,大家还提起,如今马克思主义学院成了AI的「重灾区」,其他专业的作业、论文也同样,越是标准化、程式化的内容,学生越容易用AI替代完成。

像王敬雅老师遇到的那样,在一所双一流高校任教的李欣总结,从论文的写作风格就能「闻到AI味儿」——往往是结构很完整,语言很通顺,内容也面面俱到,但到了该深入论证进去的部分,始终停留在表面,反复缠绕、涂抹。

李欣说,以前批改论文,看到语句不通的、使用接近学生本人平时说话习惯但不符合学术规范用语的,会感到生气,但现在她看到,第一反应是开心,「至少说明是自己写的」。

论文致谢的部分往往是偏感性、有「人味儿」的内容,但现实情况是,连需要真诚、走心的这部分,很多学生都要找AI代劳,只留下一些官方的、空洞的文字。

img

李欣的一位同事遇到过类似的情况,看到学生的论文致谢很简单、敷衍,让其回去重写这部分,没想到最终交上来的还是AI帮写的,后来学生坦言,直接询问了「如何感谢老师」、「如何感谢同学」。

由AI操控的论文,致命的问题不只是鲜有独立思想、新的观点,对学术、事实也缺乏基本的尊重。

李欣的一个学生,撰写的论文关于某一类视频的传播策略,在「研究现状」部分,学生写:目前对这一主题的研究相对空白,没有相关文献。但一直看到最后,李欣发现学生还是列了整整十个参考文献,不仅和前述的「研究现状」矛盾,这些文献名称本身也过于相似:时间全部为2023年,题目中全部包含着共同的关键词,且每一篇文章都是双作者,以「XX&XX」的格式排列得整整齐齐。

李欣察觉到异常,拎出其中一篇去搜索。在知网搜,文章不存在;在浏览器搜,同样搜不到。她逐一搜索了这十篇,全部是同样的结果。这才意识到,原来全是围绕关键词,由AI编撰的——这十个参考文献,全是假的。

王敬雅说,语言逻辑类软件的工作原理,是根据语言构建信息,但不做事实检验,所以会有「胡编乱造」的风险。她所在的历史领域,AI也可能「编」史实,比如说「刘半农是中国近代的女性革命家」。

所以,在布置课程作业时,她会给学生「打预防针」:AI会编造一些事实性的内容,有的以本科生的知识储备或许看不出来,但老师一眼就能看出来。

北京外国语大学教师侯毅凌也曾发布微博:给研究生毕业论文开题时,一位组里的同事面色凝重地说,我今天会得罪人,但我不得不把这事情说出来。(对着6位学生)我把你们每个人的电子版的开题报告都用AI内容检测工具过了一遍,结果有的AI生成内容高达80%!我和另一位同事不由一惊,一眼看过去,学生们的脸色也变了,躲避着我们的目光。让人愁啊,那诱惑叫学生怎么抵制啊。

但无论如何,浪潮已经来了。

img

「玄学」

国家感知到了这股浪潮。2023年8月28日,我国学位法草案提请十四届全国人大常委会审议,对利用人工智能代写学位论文等行为,规定了相应的法律责任。其中明确,用AI代写学位论文属于学术不端行为,若是学生,或被撤销学位证。

今年春天,也陆续有高校发布了关于AI在论文写作中的规范。天津科技大学对「生成式AI检测结果超过40%」的学生发出警示,并要求自查自纠;湖北大学本科生院通知,在本科毕业论文审核过程中,试行加入对论文使用生成式AI风险情况的检测;福州大学称,对2024届本科论文进行AI代写的检测,并以此作为评奖评优的参考依据……

周冉所在的学院,规定AI率不能超过30%,她的论文指导老师提出了更严格的要求,不能超过20%。在检测之前,她有点忐忑,自己的论文里有不少来自AI的内容,万一数值太高,只能花工夫再和论文死磕一轮了。但没想到的是,显示在眼前的数字只有5%左右,她想,可能和自己没有完全复制AI提供的内容有关。

在很多学生眼里,AI率检测就是门「玄学」。明明用了的,很可能不高;明明没用的,很可能挺高。周冉的情况属于前者,新闻与传播专业的学生陈露则遇到了后一种情况。

刚刚过去的上半年,是陈露的大二下学期。她上了一门网络与新媒体课,老师对期末课程论文的要求很严格,一切按照毕业论文的标准来,要格式规范,也要查重。

临交作业前,陈露说,或许是考虑到AI率检测在将来会是一种趋势,老师突然通知,要求学生提交论文时要附带AIGC检测报告,且数据不得超过15%。

陈露将论文上传到老师要求的网站,没想到一篇完全纯人工走心写完的论文,被检测出AI率超过了30%。那些被标红标黄的段落或者句子,是她自己逐字敲出来的。

在社交媒体上,很多人在讲述类似的遭遇。比如在毕业前,接到学校关于查AI率的通知,学生将自己写作的论文上传到网站,最终却得到了一个高出学校要求的结果——「一个字一个字手打,被确诊AI」。

没人知道AI检测的具体逻辑是什么,也没有任何申诉的渠道,毕业在即,事关能否顺利毕业,大家只能去逐字改写那些明明是自己写的,却被AI识别成AI所为的文字。

陈露也经历了同样的情绪转变,由惊讶到无语,又到无可奈何。最后只能面对。

AI率是门玄学,降AI率同样是玄学。

陈露去网上看攻略,看到不少网友在分享建议,比如:暴露一些「人」的缺点,例如让语句不那么通顺,或是多一些口语化、接地气的内容——尽管这和论文本身的要求是相悖的。

还有人说,自己把「被判AI」的段落转换成了爱沙尼亚语,然后再转换成中文,就通过了。

陈露没有尝试,自己花了心思写的论文,再亲自弄成破碎、杂乱的样子,总归有点下不去手。

其实,在网上,这样的帖子有很多,但里面混杂着个人的建议和攻略,以及各种广告。在小红书平台,有人贴出醒目的招揽:「AI率从87%→2%,我是怎么做到的?」从简介中能看出,降AI率,用的也是AI工具,「一键成文」,但在评论里,发帖人则说出了「打折券」、「教程」的字样。

陈露也遇到过,网友热情分享一款可以降AI率的软件,她按照对方提供的步骤操作,最后发现软件需要付费。陈露也尝试过一些免费软件,发现并不好用,逻辑被打破,句子被改得七零八落,很多甚至都不通顺了,只好放弃。

用AI写论文,用AI检测论文的AI率,再用AI把AI率降下去。同学之间开玩笑说,世界像个巨大的机器人。 

img

战争

在学业最紧的时期,降AI率无异于一场战争。

那段时间恰逢考试周,陈露要一边备考,一边给自己的课程论文降AI率。网站每天提供一次免费检测机会,每天早上起床,她的第一件事就是登录网站,上传论文,检测,然后用这一天的空余时间,来和那些标红标黄的句子搏斗。

不止是她,全宿舍四个人,AI率全都超了,大家每天钉在各自的椅子上,空气里回荡着吐槽的声音。去考试的路上遇到同学,打招呼的方式都变成了:降下来了吗?

但更让陈露痛苦的是,室友确实使用了AI,也检测出了60%多的AI率,但没多久就降下去了;自己完全没有用,不仅被测出30%,还迟迟降不下去。不仅如此,中间有段时间,甚至还「不降反升」了。「精神状态」屡遭打击之后,她跑去网上发帖吐槽:我是什么AI吗?配图是三张检测报告,数据从28.5%到26.41%,又到27.63%。

发布动态后,她收到了一些来自网友的建议,同时也收到了一些「问候」:需要人工降吗?她发现,如今已经衍生出了人工降AI率这种新「工作」。

img

正在读大学的男生卢凯,给不少参与这场战争的人做过「外援」。如今,他就在用业余时间靠帮别人降AI率赚外快。四五月份是他最忙的时候,临近答辩,几乎每天都有人「下单」。

卢凯的工作流程是,先由对方发来AI检测报告,然后根据「疑似AI生成文字」字数定价(每千字收费30到40元),对方支付定金,卢凯将被标注的句子重新改写,完成后重新进行AI率检测,达到标准后截图报告给对方,支付尾款,发送修改后的论文。如果有人介绍别的同学过来,卢凯会发红包致谢。

过去几个月里,卢凯的订单有百余元的,更常见的费用在400元左右。他接过最「艰巨」的一单,是一篇一万余字的文章,疑似AIGC占全文比达到88%。

明明是自己写的文章,被判定为疑似AI,还要把数据降低下去。陈露不想为这样一件荒谬的事情付费,但又不得不面对,最终只能继续自己「降」。

后来,她慢慢总结了一些有效的办法,比如:去掉每小段前的总结,忌模式化的总分结构;多变换句式,避免重复词语;一定要给句子加主语;别用太多逗号,多用句号断句,多分段;短句变长句,「首先其次」变「其一其二」,「和」变「与、并且、以及、等」……

尽管只是一篇课程论文,但因为老师要求严格,陈露也足够重视,前期她在它身上花了不少功夫:查资料、写作、修改润色,每个环节都尽了心。过程中时间和精力都花了不少,但文章肉眼可见地变好了,也就觉得「值了」。但降AI率的那几天,她每天都在怀疑人生,因为明知道在做的事情毫无意义,却又不得不做。

到第九个早上,登录网站,上传论文,检测。跳出来的数据终于降到了老师规定的范围内。陈露没有丝毫成就感也并不开心,只觉得如释重负,「一个烫手山芋终于扔了」。

img

退化

AI来势汹汹,但迎接它的人还处于无序和探索中。

有的学生得知学校查AI率,于是努力降下去;有的学校不查,但学生又担心查,怕影响毕业,每天四处打探消息。

新华财经曾报道,为避免AI写作的影响,一些国外高校正在减少课后完成的开放式作业,更加强调课堂作业、手写论文、小组作业和口试。

国内的高校教师们也不得不面对这个新的挑战。重新思考和调整自己的训练方式和考核方式,哪些是有意义的,哪些是没有意义的,怎么考察过程而非结果。

围绕AI和毕业论文的各种讨论中,有学生在社交平台吐槽:本科生写论文,无非是制造学术垃圾;不要指望我一个小小本科生写出多么高深多么有学术意义的东西;AI写的都比我写的好。

AI来袭后,李欣还特意和同行讨论过。

如果说,一个学生对一个话题是有想法的,但不会表达、说不清楚,借助一款软件来表达更清楚,这样可不可以?

——但想了想,她还是觉得,把思考的过程和结果用大家都能理解的语言表达清楚,是一个受过高等教育的人应当具备的能力之一,也是教育应该培养的目标之一。

如果说,学生把AI当做高级浏览器使用,只是借助它来检索文献、提炼重点,减轻自己看文献的压力,这样可不可以?

——李欣也想过,最终的结论是,看文献过程中寻找和激发自己的兴趣点也很重要,是机器无法替代的,同时,在海量资料中筛选自己需要的信息,在各种论述中寻找自己的研究线索,同样是一种研究能力的培养。

「传统手艺都还好用,只是效率问题。一旦有一个更方便的办法,就回不去了,只会追求越来越高效,越来越方便,而这个过程中的损失很难去评估。」李欣说。

李欣从教15年了,关于技术对人的影响,始终保持着觉察。

她回忆,以前上课的时候,偶尔还需要维持课堂秩序,因为学生之间会小声聊天,讲台上的老师则需要在课程中加一些学生感兴趣的话题,来吸引他们的注意力。而现在,底下常常一片死寂,无论上课下课,几乎都没人说话,大家埋头在手机和平板里,即使是讲段子也很难吸引学生的注意了,让他们「抬头」成了很多老师的难题。

同时正在发生的是,在互联网和智能手机环境下成长的一代,有的学生已经很难用一个完整的句子表达一个完整的想法了,「很多时候都是在蹦词、蹦短语」。更别说一篇毕业论文,用一万字左右的篇幅,分几个部分,有逻辑地论证、推理,然后把一个问题讲清楚,「有的学生已经做不到了」。

前不久,李欣读到一篇关于宿舍投毒案的深度报道,在事件之外,还探讨了关于人际关系等等话题。但她注意到,文章在社交媒体传播时,很多年轻人评论:文章怎么这么长?到底是不是他干的?「大家只想要一个直给的结论,但没有能力和耐心去理解一个相对复杂的事情,和中间关于人性细微幽暗的部分。」

李欣记得,前段时间她的同事,一位硕士生导师,在改学生论文时写了大段大段的批注。后来学生改了一版论文发来,同事发现很多地方没有改动。学生很坦诚,说:「老师你写得太多了,我看不完。」

「思维方式和思考能力是需要训练的,如果不用也会退化,而毕业论文,在一定意义上就是对逻辑能力和思考能力的训练和检验。」李欣认为。

而碎片化的侵袭还在进行中,AI又来了。AI的能力在一点点进步,而人的能力不能越来越退化。

img

应对

必须要有应对之策,而且越来越迫切。新技术不会停止脚步,科技的发展无法阻挡,李欣说,作为老师,她还在尝试和探索,如何了解它、应用它。

今年学院有一笔针对硬件设备的经费,由各个专业申报。李欣想给每个老师申请一个文心一言的账号,让老师们先了解,以便更好地引导学生。但后来,申请还是被砍掉了——一台电脑或是一台摄像机可以,但一个虚拟账号,一旦失效,验收时无法证明这笔钱花在了哪里。

上海交通大学的教授赵思渊也和同行聊起过,或许在将来,一些课程将会不得不回归传统的考察方式,比如以随堂测验、闭卷考试的方式来观察学生的学习进度,「有些考核内容在课后的确很难知道学生是如何完成的」。

对于AI的使用,从事多年数字人文研究的赵思渊持更积极、开放的态度。

「如果一个人想要应付一件事,他能找到一万种方法。」赵思渊说,在没有AI的年代,想要敷衍论文的人也可以找「枪手」,「每个时代都会有人试图投机取巧以实现目的,这是亘古不变的社会现象,只是在不同技术环境下,用不同的技术手段实现。」而如今在新的技术环境之下,教师的引导作用也就显得更重要。

这些年,赵思渊在校内开设一门关于论文写作的课程。2022年底,ChatGPT横空出世,他意识到这一定会显著改变学术写作的工作方式,所以从2023年起,会在每学期的课程中专门拿出一节课来,从技能角度和伦理角度,和学生一起探讨如何恰当使用AI。

过去的时间里,赵思渊尝试和探索了一些关于AI的应用场景。他觉得,AI可以代替人完成一些低难度、重复性的工作,比如制作表格、PPT;在处理程式化、标准化的文本方面也可以提供帮助,尤其在发表英文论文时,赵思渊曾读过一个实验室学者写的文章,对方说,如今用GPT做论文润色的成本大概0.3美分,但过去可能要付几百美元做这件事。

但同时,该读的史料还是要读,该做的田野调研还是要做,包括在电脑里跑数据、在桌前做实验,永远是人要做、该做的事。「人工智能不能替代对真实世界的真实性的检验。」

「技术带来的变化,是每一代人都要面对的。」赵思渊说,但只是训练方式在发生变化,工具永远是学术训练的辅助,文章写得好不好,不取决于用什么样的工具,取决于研究者是否想清楚了自己的研究问题。

中国政法大学人文学院教师王敬雅也觉得,目前AI可以替代一部分「手」的工作,但永远无法代替「脑子」。

以ChatGPT为主的AI产品,背后的语言生成机制,是依据已有语料精炼出的概率模型,换句话说,它们可以利用已有的知识来回答问题,但是很难创造出全新的内容,提出新的想法和观点。王敬雅说,而最珍贵的,往往是「跳」的那一下。

什么是「跳」的那一下?她举例了田余庆先生的经典作品《东晋门阀政治》。

在这本书中,作者梳理了大量史料,构建了一个庞大的关系网——豪强大族的交替,他们和皇权的关系,他们怎么支持某个皇帝,怎么进行家族联姻,怎么实现自己的家族利益。

王敬雅说,事实上,这样的关系网在如今是可以借助技术实现的,比如在新兴学科「数字人文」领域,有非常便捷的资料库,「谁是谁的姻亲,谁是谁的门生,谁和谁祖籍相同,很多细节是人容易忽略的,但数据可以做到,可以给研究提供帮助。」王敬雅说,但是,在构建关系网之后,田余庆先生基于对文化的理解、对政治的敏感性,实现了那珍贵的一「跳」:分析了当时的门阀世家如何以自己的关系网络,影响当时的政治格局。

「这是AI做不到的。」

img

(文中周冉、楚楚、李欣、陈露、卢凯为化名)