機(jī)器批高考作文：有效禁止背作文和套作文

2017-11-30 13:10:51澎湃新聞

　　在高考評(píng)分中，作文往往是最耗費(fèi)工作量，也最具爭(zhēng)議的一項(xiàng)。近年來(lái)，由于高考作文評(píng)價(jià)體系屢遭質(zhì)疑，相關(guān)領(lǐng)域的專家學(xué)者開始思考運(yùn)用機(jī)器評(píng)分，來(lái)取代準(zhǔn)確度不高且耗時(shí)耗力的人工批改。11月26日，華東師范大學(xué))中文系副教授徐默凡，在華東師范大學(xué)一場(chǎng)有關(guān)“應(yīng)試作文寫作質(zhì)量的計(jì)量和計(jì)算”的研討會(huì)上，就機(jī)器在作文評(píng)分中的實(shí)現(xiàn)可能性進(jìn)行了探討，并對(duì)當(dāng)下的應(yīng)試作文評(píng)分進(jìn)行了反思。

　　通過(guò)數(shù)據(jù)統(tǒng)計(jì)可找出背題套題的作文

　　據(jù)徐默凡介紹，目前有望運(yùn)用于機(jī)器評(píng)分的自然語(yǔ)言處理模型有三類，分別是基于規(guī)則識(shí)別、數(shù)據(jù)統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理。

　　所謂基于規(guī)則識(shí)別的自然語(yǔ)言處理，是基于一定的規(guī)則對(duì)作文進(jìn)行句法分析和語(yǔ)義分析，從而掌握對(duì)語(yǔ)言的理解和表達(dá)。徐默凡認(rèn)為，這條路對(duì)于作文機(jī)器評(píng)分是走不通的。因?yàn)槭紫龋祟愖陨聿⑽唇?gòu)起準(zhǔn)確的作文評(píng)分標(biāo)準(zhǔn)；其次，作文評(píng)價(jià)標(biāo)準(zhǔn)涉及到的因素比句子理解更多，思想、邏輯、結(jié)構(gòu)、語(yǔ)言等要素難以規(guī)則化。

　　第二種模型則是基于神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理。它的原理在于運(yùn)用腦科學(xué)和仿生學(xué)，模仿人腦對(duì)信息的處理方式。然而在徐默凡看來(lái)，這種模型也不適合用于機(jī)器評(píng)分。除了訓(xùn)練復(fù)雜度高，費(fèi)時(shí)費(fèi)力之外，無(wú)法對(duì)它的信息處理過(guò)程進(jìn)行探測(cè)和評(píng)估，因而結(jié)果的可解釋性差。

　　更重要的是，這種模型牽涉到了關(guān)鍵的智能倫理問(wèn)題。AlphaGo的橫空出世令人驚詫，而相比圍棋，作文更是人類智能的體現(xiàn)。如果將作文評(píng)分交給人工智能，很容易引起倫理上的反感甚至恐慌。高考這一事關(guān)很多人前途的重大考試，若完全交由人工智能去判斷評(píng)分，很有可能會(huì)造成“機(jī)器將會(huì)主宰人類社會(huì)”的聯(lián)想。

　　于是相比之下，基于數(shù)據(jù)統(tǒng)計(jì)的自然語(yǔ)言處理才是更適合機(jī)器評(píng)分的模型。這種數(shù)據(jù)統(tǒng)計(jì)的基本原理是，一個(gè)句子是否合理，不必了解它的句法語(yǔ)義，只需要考察它在人類說(shuō)過(guò)的話中出現(xiàn)的可能性大小如何：出現(xiàn)的可能性越大，即越合理；可能性越小，則越不合理。理論上，進(jìn)行這種自然語(yǔ)言處理時(shí)，需要把人類講過(guò)的所有話都統(tǒng)計(jì)一遍；然而在現(xiàn)實(shí)中，進(jìn)行詞頻統(tǒng)計(jì)就已綽綽有余。“詞頻統(tǒng)計(jì)現(xiàn)在已經(jīng)是比較成熟的研究成果了，”徐默凡說(shuō)，“在實(shí)際中，也可以考慮到前后文的關(guān)聯(lián)和影響。只是考慮的詞越多，意味著計(jì)算也會(huì)越復(fù)雜。”

　　徐默凡指出，數(shù)據(jù)統(tǒng)計(jì)可以有效禁止背作文和套作文的行為。如今中高考已成為了背作文和套作文的重災(zāi)區(qū)，同一個(gè)教師教出的學(xué)生背誦了一樣的范文，因而考試時(shí)寫出相似的作文，這一普遍現(xiàn)象若依靠人工力量是很難被察覺(jué)的。這里就是機(jī)器大顯身手的地方了。它可以通過(guò)統(tǒng)計(jì)給出重復(fù)率百分比，并自動(dòng)摘要出不同考生所寫的相同事例，再由人工鑒定是否是作弊。

　　此外，作文的語(yǔ)言規(guī)范度也可以使用統(tǒng)計(jì)測(cè)量。通過(guò)計(jì)算每篇作文的概率值，概率值越高說(shuō)明語(yǔ)言用法越常規(guī)，以此就可以識(shí)別不規(guī)范的語(yǔ)言用法。“當(dāng)然，概率低也有一種可能，那就是作文在語(yǔ)言上進(jìn)行了創(chuàng)新，使用了一些新穎的表達(dá)。在此使用統(tǒng)計(jì)法，至少可以挑出概率低的表達(dá)，進(jìn)而進(jìn)行人工篩查，重點(diǎn)關(guān)注，再根據(jù)不同類型的作文要求賦分。”徐默凡說(shuō)。

　　作文能否代表語(yǔ)文水平

　　在對(duì)現(xiàn)有的技術(shù)成果在實(shí)現(xiàn)機(jī)器評(píng)分的可行性上進(jìn)行分析討論后，徐默凡又引入了一個(gè)話題：作文真的可以測(cè)量考生的語(yǔ)文水平嗎？

　　高中語(yǔ)文老師主要將精力用在了總結(jié)應(yīng)對(duì)高考作文的技巧上，只教學(xué)生應(yīng)付考試的方法，而疏忽了真實(shí)語(yǔ)文能力的培養(yǎng)。因?yàn)閷W(xué)生只要掌握了應(yīng)試技巧，就能夠在高考作文中拿到高分，然而這并不足以證明其語(yǔ)文能力的優(yōu)秀。從另一方面看，這也證明了現(xiàn)今的高考作文命題與評(píng)分機(jī)制在衡量考生語(yǔ)文水平的高低上存在一定的困難。因而作文能否體現(xiàn)語(yǔ)文水平，又是怎樣測(cè)量語(yǔ)文水平的，成為了一個(gè)值得深思的話題。

　　徐默凡表示，很多人認(rèn)為作文水平只能整體感知，因此機(jī)器無(wú)法勝任，人類也無(wú)法公正。但這一問(wèn)題并非無(wú)解。他犀利地指出，既然目前的作文評(píng)價(jià)量表可以將考生的作文水平分解為語(yǔ)言表現(xiàn)、思想內(nèi)涵等等，為何不為每一項(xiàng)能力的評(píng)估專門設(shè)計(jì)一套試題？讓作文從繁瑣而模糊的評(píng)分體系中解脫開來(lái)，換以更清晰也更有針對(duì)性的試題，豈不更好？

　　對(duì)于這一頗具革命性的提議，現(xiàn)場(chǎng)專家學(xué)者不盡贊同。“能寫出一篇篇幅較長(zhǎng)的文章，就是對(duì)考生能力的最大肯定。并且中國(guó)有漫長(zhǎng)的寫文章的傳統(tǒng)，不可輕易中斷。”在場(chǎng)的一位學(xué)者說(shuō)。看來(lái)，有關(guān)應(yīng)試作文的命題評(píng)分體系的改革，還有很長(zhǎng)的路要走。

高考院校庫(kù)（挑大學(xué)·選專業(yè)，一步到位！）

關(guān)注高考網(wǎng)公眾號(hào)

機(jī)器批高考作文：有效禁止背作文和套作文

相關(guān)信息：

高考院校庫(kù)（挑大學(xué)·選專業(yè)，一步到位！）

高考院校庫(kù)（挑大學(xué)·選專業(yè)，一步到位！）

高校分?jǐn)?shù)線

專業(yè)分?jǐn)?shù)線

高考全程導(dǎo)航家長(zhǎng)入口 學(xué)生入口

熱門關(guān)鍵詞

高考網(wǎng)微信

特別策劃

最新資料下載

2021高考最新資訊

高考幫工具箱

高考關(guān)鍵詞