回到頂端
|||
熱門: 柯文哲 京華城 葡萄桑颱風

作文改不完 機器人出手相救

立報/謝雯伃 2012.04.22 00:00
【編譯謝雯伃整理報導】美國高中生的寫作能力低落,一個教改團體認為,機器人可能可以成為他們的寫作救星。據《路透》報導,更準確一點來說,他們希望倚靠機器人讀者,也就是配備特殊程式的電腦,掃描學生文章,根據程式判別學生成績。他們所依據的理論是,如果教師不必閱讀每一份學生的作業,就可以給學生更多寫作練習。而學生寫作練習做得越多,就會對寫作越來越拿手,儘管他們的第一個讀者是一連串程式演算法。對阿克隆大學(University of Akron)教育學院院長謝米斯(Mark Shermis)而言,這樣的說法頗具邏輯。他目前管理威廉與福洛拉.休勒特基金會(William and Flora Hewlett Foundation)主辦的一項競賽,該競賽提出10萬美元的獎金給寫出最佳自動評分軟體的程式設計師。「如果你是一名高中老師,給了學生一份寫作作業,你帶回家的會是150份作文。」謝米斯表示。「你一定需要一些幫助。」「天呀!」哈佛大學寫作計畫主任湯馬斯.任(Thomas Jehn)表示。初聞這個構想的當下,他有幾秒無法反應過來。「這太嚇人了。」他最後這麼說。客觀批改 全年無休文章評分自動化的概念最早是在1960年代所提出,然而當時的電腦技術並無法承擔這項重責大任。到了1990年代晚期,隨著科技的進步,數間教科書及測驗公司開始投入這個領域。時至今日,電腦自動評分系統已用於南達科達州的學生寫作作業;另外諸如外籍學生考的托福測驗等部分高階測驗,也開始使用自動評分系統。不過,在兩大大學入學測驗SAT和ACT的寫作評分上,並未用到電腦。美國教師大部分也都對於把學生的作業交給機器人批改一事感到興趣缺缺。休勒特競賽的目的是要改變現狀,向教師們展示電腦批改評分可以做到和英語教師一樣的水準,只是批改得更為快速,也不需要在作業上用紅筆塗塗改改好幾回。謝米斯表示,電腦批改文章是「不帶任何偏見的,而且可以全年無休,如果學生在晚上10點完成作文,他們在10點1分就可以得到批改完的結果。」舉智慧作文評分員(Intelligent Essay Assessor)這個由皮爾森教育公司(Pearson Education Inc)所行銷的網路工具而言。在數秒內,軟體就能分析一篇文章的拼字、文法、組織能力和其他特點,讓學生依此修改。這個軟體能夠掃瞄文中關鍵字,分析其語意模式。皮爾森教育公司甚至宣稱該軟體「了解文章內容涵義的程度與真人相仿」。文章創意 電腦顧不到哈佛大學寫作教師湯馬斯.任對此持存疑態度。他認為教導寫作的最佳方式,是幫助學生處理想法和論點,至於拼字錯誤和語法錯誤是其次。「試著找出過濾過的想法,」他說:「然後再來檢查,你的逗號是否放錯位置了。」他說,沒有一台電腦能夠做到這種教學方式。更甚者,湯馬斯.任表示他擔心如果學生知道他們的文章沒有人會讀,只是靠電腦程式掃瞄個幾秒,就不會再費心想出一個漂亮的譬喻或是具洞察力的類比了。「我喜歡我正在為一個有血有肉讀者書寫的感覺,我會想像他因為頁面上的字句感到激動興奮,」湯馬斯.任表示:「我確信孩子們也這樣想。」就連機器人批改系統的支持者也承認,這種方式有其限制。如果有心想作弊,只要在文章裡打上許多關鍵詞彙,不論排列是否有其意義,大多數評分系統都會給予高分。謝米斯表示,一篇關於哥倫布的文章要是被寫成伊莎貝拉女王(Queen Isabella)帶著1,492名士兵航向菲迪南島(Island of Ferdinand),在評分時還會獲得深為切題的評語。電腦在處理實驗性的散文時也面臨困難,電腦評分系統較擅長處理一致性而非創意。「電腦恨詩歌。」非營利的教育測試服務(Educational Testing Service)資深研究主任威廉森(David Williamson)表示。教育測試服務於2010年取得一項自動作文評分系統(Automatic Essay Scoring System)專利。然而,威廉森表示,自動評分系統的設計不是用來辨別下一個詹姆斯.喬伊斯(James Joyce)的。它們無法判斷藝術成就,它們評斷的是一個作者是否能有效地溝通基礎概念。這是許多美國學生缺乏的技能。在最新一次全美寫作能力評鑑中,只有1/4高三學生被評為熟練此技能。人工評分亦有偏頗休勒特基金會評分機器人大賽從測試市面上已有的幾套軟體開始,數週後才會正式公布結果。但是,休勒特基金會高層指出,市面上軟體表現得非常好。休勒特基金會接下來邀請業餘者提出自己的程式。由資料科學網站Kaggle.com所統籌的比賽已吸引數百名來自各行各業的參賽者。在4月30日前,參賽者需寫出能夠替含有「我把包包掛在肩上」或「我的傷口在縫合時很痛」之類奇特詞句評分的程式。他們的目標是希望程式給每篇文章的分數與真人評分者所給的分數能夠一致。密西根大學冰河科學家歐萊瑞(Martin O'Leary)數週來一直忙於書寫參賽程式。他鑽研一篇篇範例論文,發現真人評分者通常不會給使用複雜詞彙的學生額外分數。於是他捨棄了原本要讓電腦掃瞄艱難詞彙的計畫。於是,他改讓他的評分機器人計算標點符號。「逗號的數量是分數評定上非常重要的依據。」歐萊瑞表示。「這聽起來有點奇怪。但逗號數量越多,文章就越好。」隨著參考的資料越來越多,歐萊瑞發現了一個令人感到挫折的事實:他一直試圖想要模仿的「真人評分者其實常常前後矛盾。關於一篇指定文章,不同評分者會有不同的評定標準。他們給分數的方式其實相當隨機。的確,研究顯示真人閱讀者常會被一些不相干的因素給左右,比如說學生的字寫的好不好看。」「事實是,人類對於評分並不擅長。」專研寫作評分技術的范德堡大學(Vanderbilt University)教授葛拉罕(Steve Graham)表示。「這是無可避免的。」他說,總有一天評分機器人會全面取而代之。歐萊瑞不介意那天的到來。他利用自己寫的程式替一些已經被教師評分過的作文進行掃瞄。當成績出現分歧時,歐萊瑞會仔細閱讀文章,找出何以出現差異。「大部分的狀況是,」他說:「我同意電腦所作的決定。」

社群留言

台北旅遊新聞

台北旅遊新聞