新托福寫作評分標準 八大批改得分要點

北京新浪網 07-07 10:48

2010年初,ETS決定對新托福寫作兩篇文章分別採納“一人一機”相結合的評分方式,改變以往均由兩人評分之後取其折中的評價方式。經過這樣改變,新托福寫作的整體得分(holistic score)是由兩位閱卷人和兩台機器評價綜合分析而產生的。當然,考生拿到的成績分析中會分別對綜合寫作(integrated writing) 及獨立寫作部分(independent writing)進行詳細說明。其實,對於較早瞭解托福產品的教師來說,電腦評分系統(e-raters)已經不是什麼新鮮事了。

自從2006年新托福考試正式進入中國大陸以來,TPO(TOEFL Practice Online)逐漸在國內盛行,日益受到考生的青睞。TPO是一套線上模擬測試托福考試的系統,考生線上完成測試後,ETS會憑藉網路立刻生成相應的得分及評價體系。其中作文考試就是我們所熟知的“E-raters”。可見,ETS在今年伊始採納電腦評分作為托福寫作的主要依據之一併不是“前無古人”的憑空想像,而是基於近五年研究所獲得的一個結論:“機器和人工評分相結合的系統更能夠真實的(realistic)、客觀的(objectified)反映考生的實際交流寫作(communicating essays)水平”。雖然目前從官方網頁上看不到相關信息,但是這種改革已經如火如荼的展開了。這也許是ETS工作人員還不自信,希望等到測試結果令人滿意才正式發佈。

電腦評分主要關注作文的哪些方面呢?

通過對ETS官方的一些文件進行閱讀分析,我們不難發現E-raters對寫作的以下幾個信息點非常關注:

新托福寫作批改一:語法得分(Grammar)

ETS工作人員可以事前通過電腦程式輸入寫作中不同難度的語法現象及常犯的語法錯誤事例,因而對於考生的任何一篇文章電腦可以自動識別該習作是否犯了類似的語法錯誤及其是否使用了較為高級的語法現象。具體來講,語法能力考查涵蓋以下幾點:動詞使用是否錯誤、代詞指代是否不明、物主代詞是否使用正確、主謂是否一致、是否存在不完整句、是否存在粘連句等。毋庸置疑,電腦對於如上語法的判斷要比人為操作更為嚴謹、準確。因為寫作是依賴鍵盤操作,故需要對句子完整性和粘連現象進行評定。但依據筆者的經驗,很多考生在短短30分鐘是難以達到“語法完美”的程度的,但是他們的作文得分並不低。由此可見,雖然E-raters關注寫作的語法得分,但是其重要性位階是低於ETS 的評分原則的。

新托福寫作批改二:內容表達載體得分(usage score)

該考查點主要關注學生能否用“較為正式的文體”來闡述自己的觀點以及單詞本身是否使用恰當。該評價並不關注內容是否全面、論證是否有效,而僅僅關注表達文章信息的載體語言是否滿足以下幾點:表達中冠詞是否出現錯誤、是否使用不准確的辭彙、單詞使用形式錯誤(排除拼寫)、比較信息表達錯誤、表達信息偏向口語或者不正式。這些信息點的測試也是通過ETS官方人員事先輸入相應程式來實現的。通過電腦評價,這些缺憾更容易被識別,因為個人的主觀見解在評分中是容易出現偏差的。但是這裡需要提醒一點:我們不能把這些考點的重要性過於誇大,過於苛求我們的學生在托福作文考試中做到正式文體加正式的表達。根據趙質明校長的教學經驗,雖然很多學生在托福作文中使用了諸如 “let me take an example of myself”, “okay, that’s very amusing”之類非正式的語言,但是其習作依舊有可能獲得滿分的成績。

新托福寫作批改三:文章文體得分(mechanic score)

這個評分主要考查學生是否能夠正確的使用英語的標點符號,是否能夠滿足基本的寫作文體要求。具體來講有如下幾點:單詞拼寫、大寫表達是否恰當、標點符號使用是否正確、正確的合成詞使用等。一般而言,人為的評價方式對如以上項目的考查和電腦評分無異,差別並不大。由此可見,新的評分方式中加入電腦審查只不過是再次核實人為評價是否可靠、科學。

新托福寫作批改四:文章語言風格得分(style score)

這是從表達載體的宏觀角度全面衡量一篇文章的語言風格,比如:被動語態的使用、某些單詞的重覆現象、單詞或者表達信息使用不恰當 、是否頻繁使用短句或者長句等。這也就是趙質明校長上課常常給學生講的“word and sentence variety”。這一點托福考試的關注度要遠遠重於能力類的考試科目。當然,這也是很多考生最難以勝任的一項。根據筆者的教學經驗,很多學生雖然有好的構思和充實的論據,但是由於文章表達方式沒有符合托福必備語言風格要求的能力,其獨立寫作僅僅只有3分。

新托福寫作批改五:文章組織架構得分(organization)

講的通俗一點,組織架構重點考查文章某段話內信息是否銜接得當,段落之間是否邏輯清晰,不存在重覆論述的現象。也就是說,文章要讓讀者看起來“順暢,不產生疑惑”。這一點正是托福考試評價原則中“coherence”的體現。此外,組織結構得分還要求考生的托福作文符合一般的論文結構,即文章有總論點、分論點及分論點展開等等。這就要求我們考生的文章結構要清晰,論點邏輯關係嚴謹,字數要基本符合考試要求。

新托福寫作批改六:文章論述觀點展開度評價(development)

我相信寫作老師一定對development 這個能力不陌生。無論是哪一類國外考試寫作部分都涵蓋了對文章觀點展開詳細程度的考查。而這一點恰恰也是漢語文章思維和英語的最大差異之一。漢語的句子之間類似於平行結構,而英語是樹狀的展開架構。如果套用漢語的思維來完成托福寫作,那麼文章邏輯是呈跳躍式發展的,故考官讀起來會比較費力氣。此外,這裡還存在一個問題:根據對官方文件的閱讀,我們可以看到電腦評分對文章展開的審查力度是有缺憾的。電腦主要是通過對段落內部的邏輯信息表達來判斷。也就是說,即使這位考生在觀點後附加了評價性語言或者使用了較為充分全面的例子,但是電腦E-raters是不能判斷該例證或者因果分析是否符合托福寫作之“統一性”原則,即缺乏對文章信息邏輯聯繫是否合理、嚴謹的審查能力。比如學生在托福作文中出現如下類似的表達:因為我父親在家,所以我很愛他,電腦是不能自行進行糾正的。故我們不難看出為什麼ETS依舊不願意完全捨棄主觀人為因素在評閱中的積極作用。

新托福寫作批改七:語言表達難度等級評價(lexical complexity)

一篇好的文章不僅其論述手段過人,而且語言的載體功能完美地符合論文一般性要求。所以對於考生的表達辭彙難度進行評價是應有之義。簡而言之,如果考生能夠在文章中展現自己對辭彙較為高級的駕馭能力,那麼他就有可能獲得較高的作文分數。比如big 和enormous兩種表達,後者的難度繫數要大於前者。當然,我在這裡需要澄清一個誤區:單詞量越大,作文分數越高。在托福考試的考查原則中有一項叫做“無歧視原則”,即“托福考試中不能因為某類學生對相關學科有所瞭解而使得他在考試中具備有內容意義上的優勢。”或者說托福考試不希望看到學生故意地在炫耀自己的辭彙量。所以,我希望在教學一線的老師們不要把語言類的模板直接授予學生,這樣學生就不能真正的領略什麼是寫作,就缺乏用自己已有的語言來寫出一篇符合托福評分標準文章的意識。筆者曾經教授過一名高中生,他的單詞量並不大,但是由於其文章符合評價體系最後是4分。所以我不建議考生或者是我的同事在寫作課上故意炫耀自己的辭彙量。當然,應對托福寫作,考生應該至少具備大學四級水平的辭彙量 。

新托福寫作批改八: 分論點表達能力評價(specific-topic vocabulary usage)

這是從微觀角度來衡量考生能否將其分論點闡釋清晰、語言得當的標準。可以這麼講,該評價體系是對organization的細化表達,要求考生對某一個分論點進行詳細的論述。需要註意一點的是:托福作文電腦評分中僅僅從單詞的使用角度來考查,而沒有對文章內部展開的邏輯進行驗證。其原因主要是文章展開能力評測可以實現,故這裡不再贅述。

新通外語校長對托福備考學子溫馨提示:

通過以上介紹,我相信讀者和廣大同仁對電腦評分系統有了一個梗概性的認識。簡而言之,電腦評分偏重於“機械性判斷”,它側重於對文章的錶面現象進行程式的邏輯認證,缺乏對文章表達內容及邏輯是否恰當的推理、驗證過程 。換言之,我們的一線教師在日常教學中不必苛求學生一定要用深奧的觀點或者發人深省的例子去證明前者。筆者曾經教授過一名學員,他是大學二年級學生,文章的論點不僅顯得很膚淺,而且論據內容無不怪誕(主要是我上課主張學生自己編造觀點及例子),但是最後該名學生依舊取得了不錯的成績。換用一句考官的話作為小結:“我們能夠接受任何觀點”。

本文選自《新通外語趙質明》的博客,查看原文請點擊》》》

分享至FB
分享至微博
LINE it!
轉發mail
更多分享方式

即時新聞

臉書評論