2015年11月24日 星期二

教局在TSA的角色衝突 - 《經濟日報》

近日關於全統性系統評估(TSA)的爭議愈演愈烈,學者、校長、教師及不同社會人士均已指出現時TSA的種種問題,如學校認為評估並非單純診斷,而是學校資源分配的依據;教師和家長則較多認為部分題型過深、無助促進學習等等。

持份者提出了不同類型的建議,到底這些建議反映着哪些疑慮?實行起來又能否解決目前困難?

強調診斷性質 未說服校方

第一類建議從宣傳入手,假設了學校盲目操練乃因認知不足所致,故此認為政府應加強宣傳TSA屬診斷性評估,不會有任何影響,毋須特意操練。

事實上,過去政府在新聞公報、報章媒體、以至《政策正面睇》系列文章,均一直強調TSA的診斷性質,只是針對教與學的弱點予以改善,而非用於賞罰的問責機制。學校與教師有充足渠道接觸信息,但多年來操練依然,顯示這並非單純的認知問題。雖然2014年起,教育局取消發放學校的TSA達標率,並把TSA從小學「表現評量」中剔除,但壓力並不止於教育局。筆者接觸的一些校長和教師反映,部分較強調競爭的辦學團體,依舊能從各題的綜合評價自行加總,比較轄下各校,再透過周年大會或校董會代表,向校長與教師問責。

第二類建議從取樣入手,他們假設操練源於取樣過多,只要減少取樣範圍和次數,便能遏抑操練風氣。故相關人士認為教育局應把樣本數目盡量減少,例如參考韓國或日本等,只在每校小六或中三級抽取5%以下的學生,並限制隔年取樣。可是,樣本足夠才能確保研究公信度,讓當局針對學生弱點和教學策略作精確診斷。如取樣過少(按此比例每級將不多於10人),結果又是否具足夠公信度,能如實反映學校整體的教學質素,給出有效改善建議?

第三類建議從題型入手,假設操練源於試題過深,故認為教育局應減少一些被視為「刁難」或過於複雜艱深,無助診斷教學成效的題型。這也許有助緩解壓力,但考試制度依然,操練風氣不一定減少。加上如果題型過淺,大部分學生毋須任何操練也能輕鬆完成,則TSA的結果便不能呈現出明顯差異(因所有學生也接近滿分),當局亦難以對教與學的弱點作精確診斷。

「考試必要之惡」 助教學

誠如作家梁實秋所言:「考試乃必要之惡。」不管是為了篩選、問責、還是診斷,考試的功能是難以被取代的。解決目前困境,我們也許應該反過來思考,為何其他系統性評估,如學生能力國際評估(PISA)、國際數學與科學教育成就趨勢調查(TIMSS)等不會掀起操練風氣?在美國部分學校,哪個學生有空閒,甚或誰最快吃完午飯的,便被推薦完成系統性評估,師生均無壓力可言,這是否因為美國學校和教師對系統性評估的認知特別充足?抑或這些系統性評估的取樣和試題設置完美得無懈可擊?

也許,TSA帶來壓力的根本並非評估本身,而是評估者的角色衝突。畢竟,經濟合作與發展組織(OECD)和國際教育成就評量協會(IEA),並沒有集「行政監察」、「研究調查」及「資源分配」權力於一身,教師和學生自然沒有操練需要。




梁亦華(2015.11.22)︰〈教局角色衝突 TSA問題元兇〉,《香港經濟日報》。

2015年11月12日 星期四

TSA的優化空間 - 《信報財經新聞》

近日救恩學校(小學部)宣布退出全港系統性評估(Territory-wide System Assessment, TSA),重新引起教育界對TSA改革及存廢與否的討論。學校聲明指出TSA屬較機械化的評核,對學生無明顯好處,亦佔用教師精力,構成壓力;對此,教育局一如既往地重申評估目的及非競爭性的設計理念。多年以來,學界對TSA的批評涉及什麼層面,當中存在什麼優化空間?

兩大類批評

綜觀社會各界意見,對TSA的批評大致分為兩類︰第一類批評關注政策層面,焦點在於TSA數據的用途,及校方如何看待TSA的角色。TSA設計的本意為診斷性評估,旨在讓教師知道學生的弱項,從而優化教學策略,促進學與教。它之所以帶來壓力,源於學校把診斷性測驗視為問責性測驗,從而催谷操練,尤其在一片殺校潮下,任何可供外界比較的指標均極為敏感,加上一些研究顯示部分教育局官員、辦學團體、校董會,確實以TSA成績來評價校長和老師表現,乃至成為資源分配的依據。這號稱低風險的測驗,對學校而言無疑是高風險的。

第二類批評關注考核題型本身,這多見於前線教師群體。筆者在工作中接觸不少中文教師,均指出TSA題型與語文能力無關,取分要點在於審題、速記及機械化描述,無助高階思維、賞析能力或文學素養,意義不大;部分數學老師亦反映題型過深,絕非教局所指只為測量「最低而可接受的知識與技能的水平」。這與教協2011年的研究結果,指TSA「評卷挑剔,有刁難學生的傾向」一致。一項評估的優劣,並非與艱深程度相關。如評估(被認為)影響重大,試題又過深,則教師不得不對題型作針對性操練,TSA題型甚至成為學校考試,以致日常課程的參照對象。久而久之,其他培養求知欲、創作力、學習態度、朋輩相處技巧等小學階段的潛課程均須讓路,語文數學堂亦不再教授與考核無關的內容(如英語會話、文化等),改為操練語文及數學樣本試題。

針對數據挪用的問題,近年教育局取消發放小三及小六級的學校達標率、把 TSA從小學「表現評量」中剔除,避免數據掀起校際惡性競爭,這無疑是進了一步。可是教師對TSA題型的疑慮卻依舊存在。筆者認為,如TSA的存在是為讓教育局了解「學生弱項」及是否具備「基本能力」,那題型該以分布性評估,題型深淺各異,才能準確區分各類的學生。過去艱深刁鑽的題型發展,只會助長題型操練,偏離診斷性評估的原意,要優化TSA,必須從數據發放及題型設置上小心考慮,如有持份者偏離原意,把TSA數據視為評價師生的依據,冀以此施壓來提高學教效能,則盲目操練的問題便難以根治。



梁亦華(2015.11.13)︰TSA的優化空間,《信報財經新聞》,C04,優質教育。

Room for improvement for the TSA
-          In an article contributed to HK Economic Journal, Mr Leung wrote about the current problems surrounding the TSA and he said the EDB should find ways to improve the system. He said the EDB should be aware of how to distribute the data obtained from TSA and how to design the questions. He added that if the stakeholders used the data as assessment for teachers and students and the test was used to pressure the students, it would be hard to solve the problem of drilling.