首頁(yè)>檢索頁(yè)>當前

ETS首席執行官阿米特·塞瓦克:

考試評價(jià)正在經(jīng)歷從知識到能力的轉向

發(fā)布時(shí)間:2023-07-03 作者:本報記者 梁丹 來(lái)源:中國教育報

1995年,時(shí)任外交學(xué)院訪(fǎng)問(wèn)學(xué)者的阿米特·塞瓦克第一次來(lái)到中國。騎著(zhù)飛鴿牌自行車(chē),他隨著(zhù)北京街頭浩蕩的自行車(chē)流,打量著(zhù)這座古老又快速變化的城市。

“那是一個(gè)非常令人興奮、充滿(mǎn)活力的時(shí)期,人們對像我這樣的外國人充滿(mǎn)了新鮮感和好奇?!卑⒚滋鼗貞浀?。在他到來(lái)前不久的1981年,ETS(美國教育考試服務(wù)中心)旗下的托??荚?,作為首個(gè)被引進(jìn)中國內地的國際化標準語(yǔ)言測試,剛剛迎來(lái)第一批723名中國考生。

作為擁有托福、GRE等諸多測評產(chǎn)品的世界知名專(zhuān)業(yè)化教育考試評價(jià)機構,ETS在考試技術(shù)的運用和教育評價(jià)觀(guān)念的引領(lǐng)方面一直處于領(lǐng)先水平。在全球教育經(jīng)歷轉型的當下,ETS如何看待今天考試評估的新變化、新趨勢?在人工智能技術(shù)崛起的背景下,教育評價(jià)會(huì )有何變化?

2023年春,阿米特·塞瓦克作為ETS新任首席執行官再次來(lái)到北京。中國教育報記者就這些問(wèn)題采訪(fǎng)了阿米特。

考試測評將更關(guān)注如何全面地評價(jià)人

中國教育報:我們了解到,這次您來(lái)中國的一個(gè)重要行程是,參加托福iBT考試改革發(fā)布活動(dòng)。這一次托福改革的背景是什么?

阿米特·塞瓦克:今年4月中旬,我們在北京召開(kāi)發(fā)布會(huì ),介紹了托??荚嚫母锏南嚓P(guān)情況。簡(jiǎn)單來(lái)說(shuō),從今年7月26日起,托??荚嚂r(shí)長(cháng)將由3小時(shí)縮短至2小時(shí)以?xún)?,并且我們將精?jiǎn)考試流程說(shuō)明與操作導引、將現有獨立寫(xiě)作試題替換為更為簡(jiǎn)練的全新寫(xiě)作題型“學(xué)術(shù)討論寫(xiě)作”、縮短閱讀部分時(shí)長(cháng),并取消所有不計分的加試題。

首先,我們想讓考試對考生來(lái)說(shuō)盡可能地舒適、方便,我們想讓他們能以一種壓力更小的方式進(jìn)行評估,并讓他們對參加測試有信心。正如我上大學(xué)時(shí)一位教授所說(shuō)的那樣,考試不應該是一件煩人的事,它應該是對你學(xué)到的知識和能力的鼓勵。其次,我們希望測試體驗更加對用戶(hù)友好。當然,我們在縮短時(shí)間的情況下,依然保持了考試的高質(zhì)量和嚴謹??偠灾?,我們希望托??荚嚫臃奖?,更加友好,同時(shí),也依然擁有和此前一樣的高標準。

中國教育報:不僅是托福,從全球來(lái)看,考試評估都在經(jīng)歷著(zhù)改革重塑。您認為將有哪些變化趨勢?

阿米特·塞瓦克:過(guò)去,世界上的大多數考試關(guān)注的都是知識的積累程度和掌握水平。但現在,企業(yè)招聘主管與大學(xué)招生官更關(guān)注“你是否掌握了能力”,而非“你是否掌握了知識”。我們把這稱(chēng)為對“ABC能力”的重視。A是情感能力,B是行為能力,C是認知能力。

以前,大部分考試集中于邏輯推理等認知能力,這也是標準化考試中著(zhù)重考查的內容。情感能力則涉及你的行為表現,比如你的情商。行為能力則是你如何應用知識的具體行為。舉個(gè)例子,英文語(yǔ)法被歸類(lèi)于認知層面,理解情緒與語(yǔ)義則被歸類(lèi)于情感層面,與他人使用英語(yǔ)交流則是一種行為能力。隨著(zhù)世界的發(fā)展,我們認為對ABC能力的關(guān)注將日益加深,對如何以更全面的方式來(lái)衡量和評價(jià)一個(gè)人的關(guān)注也會(huì )更多。

今天,我們已經(jīng)看到,越來(lái)越多的企業(yè)希望求職者具備良好的溝通能力、協(xié)作能力、團隊合作能力和高情商等非知識性能力,而這些能力在傳統的教育體系中得到的重視和培養還不夠。

中國教育報:這一變化趨勢意味著(zhù)什么?

阿米特·塞瓦克:總的來(lái)看,為了評估考生的這些非知識性能力,會(huì )有越來(lái)越多的考試產(chǎn)品出現。以ETS為例,未來(lái),除了托??荚囃?,我們也會(huì )對旗下的其他測評產(chǎn)品進(jìn)行升級。比如,長(cháng)期以來(lái),GRE(美國研究生入學(xué)考試)更偏向于是一種認知測試,主要被用來(lái)測試考生解決問(wèn)題和邏輯推理的能力。但我們也發(fā)現,越來(lái)越多的大學(xué)希望GRE考試對考生的溝通能力、團隊協(xié)作能力等也進(jìn)行評估。因為大學(xué)也日漸發(fā)現,在研究生階段,團隊協(xié)作能力對于學(xué)術(shù)研究也是十分重要的。

我認為,未來(lái)的大學(xué)入學(xué)考試和結業(yè)考試,不僅有大型的標準化考試,還會(huì )嵌入越來(lái)越多的能力測評。例如,當考生參加一項考試后,不僅會(huì )得到一個(gè)分數,還會(huì )獲得相應證書(shū)和不同能力的評價(jià)。我們可以把能力測評和相應結果納入到成績(jì)報告中,這是值得一做的嘗試。

技術(shù)全面影響和改變著(zhù)教育評價(jià)

中國教育報:正如您所說(shuō),能力型、素養型評價(jià)越來(lái)越被重視,但對能力和素養如何有效評估依然是難點(diǎn)。

阿米特·塞瓦克:我認為技術(shù)的發(fā)展將解決這個(gè)問(wèn)題。目前我們已經(jīng)有了越來(lái)越多的工具可以用于能力的測評,而這些工具和技術(shù)在十年前甚至是五年前都還沒(méi)有出現。在我看來(lái),借助這些技術(shù),我們對于能力、素養的測評會(huì )更容易實(shí)現。未來(lái),我們會(huì )有越來(lái)越多的工具支撐我們開(kāi)展更好的測評。

應該看到,今天,技術(shù)的發(fā)展已經(jīng)給我們帶來(lái)了更多樣的檢測工具,比如,一些可穿戴設備能夠實(shí)時(shí)地監測用戶(hù)的心率和步數。我們認為,未來(lái)測評產(chǎn)品也會(huì )是這樣的發(fā)展方向。在技術(shù)的支持下,越來(lái)越多的人能積極、定期地評估自己能力的發(fā)展,而不是只能通過(guò)周期更長(cháng)的標準化考試。

隨著(zhù)數字化存儲技術(shù)的發(fā)展,已經(jīng)有一些公司在做這方面的嘗試。借助數字化工具,我們對能力的測評間隔將更短,會(huì )生成更多形成性、過(guò)程性的評價(jià)。當今的世界正在朝著(zhù)科技含量更高、速度更快的方向發(fā)展,這表明了社會(huì )的進(jìn)步,也將使人們對自己已經(jīng)掌握的能力和想要培養的能力擁有更多的掌控權和更清晰的認知。

中國教育報:技術(shù)給考試測評帶來(lái)了新的想象。但是,以ChatGPT為代表的人工智能技術(shù)也對傳統考試評估帶來(lái)了挑戰。您怎么看待這種影響?

阿米特·塞瓦克:包括教育在內的許多行業(yè)正在受到以ChatGPT為代表的AI技術(shù)影響。在考試測評領(lǐng)域,AI已經(jīng)深刻影響著(zhù)我們。

一般而言,我們可以把考試測評分為設計、實(shí)施、評分和分析四個(gè)階段。今天,AI正改變和影響著(zhù)考試測評的每一階段。比如,在考試設計階段,AI可以通過(guò)生成式內容技術(shù)幫助研究人員更好地開(kāi)發(fā)不同類(lèi)型的試題;在考試實(shí)施階段,AI可以幫助考試變得更加多樣和更具個(gè)性化;在評分階段,我們已經(jīng)可以用AI技術(shù)工具進(jìn)行自動(dòng)評分;在分析環(huán)節,憑借大量數據,人們可以通過(guò)AI來(lái)尋找和發(fā)現數據背后的規律和模式。另外,AI技術(shù)還被很多大學(xué)和企業(yè)用于面試環(huán)節,比如把面試人的表現記錄下來(lái),通過(guò)AI對其表情、說(shuō)話(huà)和溝通的方式進(jìn)行分析。

現在一個(gè)有趣的現象是,在大學(xué)招生中,很多面試官都在思考如何更好地向學(xué)生提出問(wèn)題。以短文寫(xiě)作為例,由于ChatGPT已經(jīng)完全可以勝任短文寫(xiě)作,因此,當面試官提問(wèn)時(shí),就得重新考慮,如何以一種機器無(wú)法替代的方式考查學(xué)生。因此,我認為AI不僅會(huì )影響到測評本身,還將影響到教育的整個(gè)過(guò)程。

考試評估正在進(jìn)行更多樣化的探索

中國教育報:隨著(zhù)技術(shù)的不斷發(fā)展,傳統的標準化考試會(huì )消亡嗎?

阿米特·塞瓦克:其實(shí)歷史上人們不止一次提出過(guò)這個(gè)問(wèn)題,不少人也曾認為,標準化考試會(huì )逐漸消亡。但時(shí)至今日,我們也看到,標準化考試并沒(méi)消失,反而一直在發(fā)展延續。

今天,當我們再一次思考這個(gè)問(wèn)題時(shí),更應該需要考慮的問(wèn)題是,除了標準化考試之外,我們還有其他哪些測評方式的選項,并確保其在不同的國家、州或省份享有同樣的有效性和公平性。我認為這是一個(gè)值得思考的問(wèn)題。如果我們取消標準化測試,在面對兩個(gè)背景截然不同的申請者時(shí),院校應如何有效、公平地評估并比較他們呢?圍繞這一問(wèn)題所展開(kāi)的討論,是今天教育界所關(guān)注的。

與此同時(shí),我們也要看到不同國家、社會(huì )的情況不同,對考試評價(jià)的需求也不同。今天,世界上一些國家和地區仍然是需要標準化測試的。但在另外一些國家和地區,人們正在思考和探索標準化測試之外的其他選項。正如我們關(guān)注到的一樣,一些國家和地區的教育評價(jià)中需要更多的標準化元素,但在另一些地方則可能希望更少的標準化色彩。

對我們來(lái)說(shuō),ETS作為全球最大的教育測評機構之一,我們既可以提供標準化測試,也可以提供個(gè)性化測試,還可以進(jìn)行定制化測試。我們對不同的測評類(lèi)型持開(kāi)放的態(tài)度,并能靈活應對。

中國教育報:近年來(lái),美國很多高校采取“標化考試可選”,有些大學(xué)甚至不再要求提交SAT、GRE等標準化成績(jì)。這是一種多樣化的探索嗎?

阿米特·塞瓦克:最近幾年,美國這一政策的發(fā)展勢頭越來(lái)越強勁。一方面,美國許多大學(xué)正感受到不小的財政壓力,他們需要增加入學(xué)人數,以保持經(jīng)濟上的可持續性。對于許多大學(xué)來(lái)說(shuō),標化考試可選政策允許更多的申請人提交申請。此外,許多大學(xué)也日益看重多樣性,該政策可以幫助大學(xué)建立一個(gè)更為廣泛、多樣化的候選人儲備庫。大學(xué)正在把這一政策作為向社會(huì )開(kāi)放和增加進(jìn)入大學(xué)機會(huì )的方式。

中國教育報:在中國,高校也有強基計劃等多樣化的招生選拔方式。面對更加多元的考試招生方式,您怎么看?

阿米特·塞瓦克:我認為關(guān)鍵問(wèn)題是招生考試的目的是什么。在我看來(lái),招生考試的目的之一就是幫助申請人和學(xué)校能有一個(gè)共同的框架。對于大學(xué)而言,他們最大的希望是確保評價(jià)客觀(guān)、公正并且合理。因此,當大學(xué)決定改變或者摒棄某種測試時(shí),都面臨著(zhù)一個(gè)核心的問(wèn)題——用什么標準來(lái)替代原有的測試。

幾十年來(lái),標準化測試重要的功能是提供了這樣一個(gè)衡量標準。例如當大學(xué)同時(shí)面臨來(lái)自中國成都、法國巴黎和美國得克薩斯的學(xué)生時(shí),怎么評價(jià)和比較呢?傳統的標準化測試就提供了一種標準。當然,這并不是唯一的,但這的確是一個(gè)有效的方法。因此今天,當我們思考把標準化考試替換成其他考試時(shí),我們面臨著(zhù)的新的挑戰是,如何再造一個(gè)評估候選人的新范式。

《中國教育報》2023年07月03日第4版 

0 0 0 0
分享到:

相關(guān)閱讀

最新發(fā)布
熱門(mén)標簽
點(diǎn)擊排行
熱點(diǎn)推薦

工信部備案號:京ICP備05071141號

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024

中國教育新聞網(wǎng)版權所有,未經(jīng)書(shū)面授權禁止下載使用

Copyright@2000-2022 www.tubemateyoutubedownloaderapps.com All Rights Reserved.

京公網(wǎng)安備 11010802025840號