2015年11月24日 星期二

教局在TSA的角色衝突 - 《經濟日報》

近日關於全統性系統評估(TSA)的爭議愈演愈烈,學者、校長、教師及不同社會人士均已指出現時TSA的種種問題,如學校認為評估並非單純診斷,而是學校資源分配的依據;教師和家長則較多認為部分題型過深、無助促進學習等等。

持份者提出了不同類型的建議,到底這些建議反映着哪些疑慮?實行起來又能否解決目前困難?

強調診斷性質 未說服校方

第一類建議從宣傳入手,假設了學校盲目操練乃因認知不足所致,故此認為政府應加強宣傳TSA屬診斷性評估,不會有任何影響,毋須特意操練。

事實上,過去政府在新聞公報、報章媒體、以至《政策正面睇》系列文章,均一直強調TSA的診斷性質,只是針對教與學的弱點予以改善,而非用於賞罰的問責機制。學校與教師有充足渠道接觸信息,但多年來操練依然,顯示這並非單純的認知問題。雖然2014年起,教育局取消發放學校的TSA達標率,並把TSA從小學「表現評量」中剔除,但壓力並不止於教育局。筆者接觸的一些校長和教師反映,部分較強調競爭的辦學團體,依舊能從各題的綜合評價自行加總,比較轄下各校,再透過周年大會或校董會代表,向校長與教師問責。

第二類建議從取樣入手,他們假設操練源於取樣過多,只要減少取樣範圍和次數,便能遏抑操練風氣。故相關人士認為教育局應把樣本數目盡量減少,例如參考韓國或日本等,只在每校小六或中三級抽取5%以下的學生,並限制隔年取樣。可是,樣本足夠才能確保研究公信度,讓當局針對學生弱點和教學策略作精確診斷。如取樣過少(按此比例每級將不多於10人),結果又是否具足夠公信度,能如實反映學校整體的教學質素,給出有效改善建議?

第三類建議從題型入手,假設操練源於試題過深,故認為教育局應減少一些被視為「刁難」或過於複雜艱深,無助診斷教學成效的題型。這也許有助緩解壓力,但考試制度依然,操練風氣不一定減少。加上如果題型過淺,大部分學生毋須任何操練也能輕鬆完成,則TSA的結果便不能呈現出明顯差異(因所有學生也接近滿分),當局亦難以對教與學的弱點作精確診斷。

「考試必要之惡」 助教學

誠如作家梁實秋所言:「考試乃必要之惡。」不管是為了篩選、問責、還是診斷,考試的功能是難以被取代的。解決目前困境,我們也許應該反過來思考,為何其他系統性評估,如學生能力國際評估(PISA)、國際數學與科學教育成就趨勢調查(TIMSS)等不會掀起操練風氣?在美國部分學校,哪個學生有空閒,甚或誰最快吃完午飯的,便被推薦完成系統性評估,師生均無壓力可言,這是否因為美國學校和教師對系統性評估的認知特別充足?抑或這些系統性評估的取樣和試題設置完美得無懈可擊?

也許,TSA帶來壓力的根本並非評估本身,而是評估者的角色衝突。畢竟,經濟合作與發展組織(OECD)和國際教育成就評量協會(IEA),並沒有集「行政監察」、「研究調查」及「資源分配」權力於一身,教師和學生自然沒有操練需要。




梁亦華(2015.11.22)︰〈教局角色衝突 TSA問題元兇〉,《香港經濟日報》。

沒有留言: