首頁>要聞>沸點(diǎn) 沸點(diǎn)
機(jī)器可批高考作文?至少能有效禁止背作文和套作文
在高考評分中,,作文往往是最耗費(fèi)工作量,,也最具爭議的一項(xiàng),。近年來,,由于高考作文評價(jià)體系屢遭質(zhì)疑,相關(guān)領(lǐng)域的專家學(xué)者開始思考運(yùn)用機(jī)器評分,,來取代準(zhǔn)確度不高且耗時(shí)耗力的人工批改,。11月26日,華東師范大學(xué)中文系副教授徐默凡,,在華東師范大學(xué)一場有關(guān)“應(yīng)試作文寫作質(zhì)量的計(jì)量和計(jì)算”的研討會(huì)上,,就機(jī)器在作文評分中的實(shí)現(xiàn)可能性進(jìn)行了探討,并對當(dāng)下的應(yīng)試作文評分進(jìn)行了反思,。
研討會(huì)現(xiàn)場,。
通過數(shù)據(jù)統(tǒng)計(jì)可找出背題套題的作文
據(jù)徐默凡介紹,目前有望運(yùn)用于機(jī)器評分的自然語言處理模型有三類,,分別是基于規(guī)則識(shí)別,、數(shù)據(jù)統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)的自然語言處理。
所謂基于規(guī)則識(shí)別的自然語言處理,,是基于一定的規(guī)則對作文進(jìn)行句法分析和語義分析,從而掌握對語言的理解和表達(dá),。徐默凡認(rèn)為,,這條路對于作文機(jī)器評分是走不通的。因?yàn)槭紫?,人類自身并未建?gòu)起準(zhǔn)確的作文評分標(biāo)準(zhǔn),;其次,作文評價(jià)標(biāo)準(zhǔn)涉及到的因素比句子理解更多,,思想,、邏輯,、結(jié)構(gòu)、語言等要素難以規(guī)則化,。
第二種模型則是基于神經(jīng)網(wǎng)絡(luò)的自然語言處理,。它的原理在于運(yùn)用腦科學(xué)和仿生學(xué),模仿人腦對信息的處理方式,。然而在徐默凡看來,,這種模型也不適合用于機(jī)器評分。除了訓(xùn)練復(fù)雜度高,,費(fèi)時(shí)費(fèi)力之外,,無法對它的信息處理過程進(jìn)行探測和評估,因而結(jié)果的可解釋性差,。
更重要的是,,這種模型牽涉到了關(guān)鍵的智能倫理問題。AlphaGo的橫空出世令人驚詫,,而相比圍棋,,作文更是人類智能的體現(xiàn)。如果將作文評分交給人工智能,,很容易引起倫理上的反感甚至恐慌,。高考這一事關(guān)很多人前途的重大考試,若完全交由人工智能去判斷評分,,很有可能會(huì)造成“機(jī)器將會(huì)主宰人類社會(huì)”的聯(lián)想,。
于是相比之下,基于數(shù)據(jù)統(tǒng)計(jì)的自然語言處理才是更適合機(jī)器評分的模型,。這種數(shù)據(jù)統(tǒng)計(jì)的基本原理是,,一個(gè)句子是否合理,不必了解它的句法語義,,只需要考察它在人類說過的話中出現(xiàn)的可能性大小如何:出現(xiàn)的可能性越大,,即越合理;可能性越小,,則越不合理,。理論上,進(jìn)行這種自然語言處理時(shí),,需要把人類講過的所有話都統(tǒng)計(jì)一遍,;然而在現(xiàn)實(shí)中,進(jìn)行詞頻統(tǒng)計(jì)就已綽綽有余,?!霸~頻統(tǒng)計(jì)現(xiàn)在已經(jīng)是比較成熟的研究成果了,”徐默凡說,“在實(shí)際中,,也可以考慮到前后文的關(guān)聯(lián)和影響,。只是考慮的詞越多,意味著計(jì)算也會(huì)越復(fù)雜,?!?/p>
徐默凡指出,數(shù)據(jù)統(tǒng)計(jì)可以有效禁止背作文和套作文的行為,。如今中高考已成為了背作文和套作文的重災(zāi)區(qū),,同一個(gè)教師教出的學(xué)生背誦了一樣的范文,因而考試時(shí)寫出相似的作文,,這一普遍現(xiàn)象若依靠人工力量是很難被察覺的,。這里就是機(jī)器大顯身手的地方了。它可以通過統(tǒng)計(jì)給出重復(fù)率百分比,,并自動(dòng)摘要出不同考生所寫的相同事例,,再由人工鑒定是否是作弊。
此外,,作文的語言規(guī)范度也可以使用統(tǒng)計(jì)測量,。通過計(jì)算每篇作文的概率值,概率值越高說明語言用法越常規(guī),,以此就可以識(shí)別不規(guī)范的語言用法,。“當(dāng)然,,概率低也有一種可能,,那就是作文在語言上進(jìn)行了創(chuàng)新,使用了一些新穎的表達(dá),。在此使用統(tǒng)計(jì)法,,至少可以挑出概率低的表達(dá),進(jìn)而進(jìn)行人工篩查,,重點(diǎn)關(guān)注,,再根據(jù)不同類型的作文要求賦分?!毙炷舱f,。
作文能否代表語文水平
在對現(xiàn)有的技術(shù)成果在實(shí)現(xiàn)機(jī)器評分的可行性上進(jìn)行分析討論后,徐默凡又引入了一個(gè)話題:作文真的可以測量考生的語文水平嗎,?
高中語文老師主要將精力用在了總結(jié)應(yīng)對高考作文的技巧上,,只教學(xué)生應(yīng)付考試的方法,而疏忽了真實(shí)語文能力的培養(yǎng),。因?yàn)閷W(xué)生只要掌握了應(yīng)試技巧,就能夠在高考作文中拿到高分,然而這并不足以證明其語文能力的優(yōu)秀,。從另一方面看,,這也證明了現(xiàn)今的高考作文命題與評分機(jī)制在衡量考生語文水平的高低上存在一定的困難。因而作文能否體現(xiàn)語文水平,,又是怎樣測量語文水平的,,成為了一個(gè)值得深思的話題。
徐默凡表示,,很多人認(rèn)為作文水平只能整體感知,,因此機(jī)器無法勝任,人類也無法公正,。但這一問題并非無解,。他犀利地指出,既然目前的作文評價(jià)量表可以將考生的作文水平分解為語言表現(xiàn),、思想內(nèi)涵等等,,為何不為每一項(xiàng)能力的評估專門設(shè)計(jì)一套試題?讓作文從繁瑣而模糊的評分體系中解脫開來,,換以更清晰也更有針對性的試題,,豈不更好?
對于這一頗具革命性的提議,,現(xiàn)場專家學(xué)者不盡贊同,。“能寫出一篇篇幅較長的文章,,就是對考生能力的最大肯定,。并且中國有漫長的寫文章的傳統(tǒng),不可輕易中斷,?!痹趫龅囊晃粚W(xué)者說??磥?,有關(guān)應(yīng)試作文的命題評分體系的改革,還有很長的路要走,。
編輯:曾珂
關(guān)鍵詞:機(jī)器可批高考作文
更多
更多
更多
- 福建泉州碳九泄漏:海域清理已完成 企業(yè)配合調(diào)查
- 團(tuán)伙制造假冒國際產(chǎn)品銷往粵蘇等20省份 案值千萬
- "山寨"林俊杰年入百萬?當(dāng)事人:是模仿 雙方已和解
- 讀幼兒園3歲寶寶被粗心叔叔送進(jìn)小學(xué):我找不到教室
- 男子在酒店洗澡時(shí)被電擊癱坐 酒店:未發(fā)現(xiàn)漏電
- 男子輕信"神醫(yī)"可消晚期癌癥 一周暴瘦十斤險(xiǎn)喪命
- 部分查分App弊端不少:考試前上傳試題增加泄題風(fēng)險(xiǎn)
- 快卸載!這53款A(yù)PP涉惡意捆綁等問題 被工信部下架
- 川影"女生入男寢"事件續(xù):校方追責(zé)宿管員 加強(qiáng)教育