中時專欄:林建甫》戳破學測15級分制的國王新衣

近2年學測數學滿級分人數相關統計資料。(王雅芬攝)

109年度學測成績日前公佈,沒有鑑別度又是一大問題!尤其是數學滿級分超多,達到14489人,比率是其他科的2、3倍,使得大考中心的主任辭職負責。對此,大考中心表示,這次數學科難度確實不符預期,未來將設定學測各科滿級分人數目標,並加強行政檢核,落實試題鑑別度與穩定性

數學科滿級分佔考生人數11.22%,因此被認爲沒有鑑別度,但其實從級分人數分佈表會發現在國、英、社、自也有好些級分的人數佔比是超過11.22%的。例如國文12級分的佔比高達17.66%,社會10級分佔15.51%。數學除了滿級分,其他級分反而都沒有超過10%。英文最好,全部級分都低於10%。若超過11.22%就沒有鑑別度,那一缸子都有問題。

級分是一種標準化的量尺排序。其實要設計一份有鑑別度的試題,有一定的難度。以爲題目難度均勻分佈,但最後可能天不從人願,因爲量尺太粗,大部分的學生又差不多,最後當然是鑑別度低落。現在的15級分制就是以該科成績前1%考生的原始平均得分除以15,作爲級距計算的根本。原始分數0分者爲0級分。因此數學科6.6分(100/15)就是1個級差距。而五標的制定爲「頂標」、「前標」、「均標」、「後標」、「底標」分別是該科成績位於第88、75、50、25、12百分位數之考生級分。

題目簡單,難題甚少,又因級分是分數等距切割,有唸書的原始分數都集中在高分端,因此頂標、前標級分就都很高,人數也很多。數學科頂標、前標今年就分別爲14及13級分。國文科有幾個題目比較難,滿分人數少,但整體題目結果對有唸書的考生來說是會的大家都會,不會的大家都不會,因此國文頂標、前標均爲13級分,這表示前25%的考生都沒鑑別度。去年也是如此。

再仔細研究級分人數分佈表,會發現一個有趣的現象,就是前面級分集中度很高。例如國文頂標13級分,均標11級分,連底標都有8級分,可見88%的人集中在5個級分(8到13)。自然頂標13級分,均標8,底標5,比較有拉開,但88%也是集中在8個級分。爲什麼?因爲學測是基本能力測驗,不能出太難,最後就集中在前面級分。這能反映什麼鑑別度?

級分制的用意原本是要模糊化分數,讓大家不要每一分都斤斤計較。但一個級分就是上萬人,在級分轉換邊緣的原始分數就很倒楣。以數學而言,93.4以上是15級分,93.3就是14級分。原本只差0.1分,但在級分制下卻差了1個級分。而且若有人不小心多錯1題,可能差了2、3級分,公平性變得很差。

過去看百分的原始分數計分,大家數學都考不好,可能平均是30、40分,有天縱英才,數學特別好,考了近滿分,一看就是奇才,靠這科彌補不擅長的科目,照樣「脫穎而出」。如果用這15級分制,就是牛驥同一皁、雞棲鳳凰食。

15級分的問題,這兩年屢被檢討,不能更改的原因據悉是違背學測的基本精神。主事者認爲基本能力測驗,級分只是參考,大學應以更多元面向或資料評估學生的能力與潛力,進行選才,而不是隻憑級分數篩選學生。

問題是,立意良善,執行困難。甄試學生就只能填區區6個志願,解決了重榜,就限制了適性的機會。學生上傳的備審資料,大都制式格式的少數幾頁,口試時間又非常有限,系所如何選才?筆試臺大工學院就是把報名旗下各系的學生找來,再來一次會考。考什麼?題目設計得好不好?有沒有鑑別度?也沒有人追究。口試要問什麼問題?能否獲得更多訊息?我在當系主任時參考醫學院跑臺的考試方法,設計讓學生要過4關,由不同的老師羣進行「拷問」。我的感想是形式很棒,但多元入學就是多錢入學,對低收入者、社會的弱勢家庭相當不利。

教改有理想的正當性,但目前的結果就是國王新衣,只是沒有人想去戳破。頂尖大學甄選招生比率都早已超過7成、指考分發不到3成。清大、交大爲搶學生,不少系所的指考名額甚至剩不到1成,例如交大電機更只有4%。甄試成了最重要的大學入學管道。沒有鑑別度的15級分制真該考慮修改。大學入學在臺灣一直是社會很重視的關卡,一個有鑑別度的考試,公平公正,纔是大家所期待的。

(作者爲中信金融管理學院講座教授、國立臺灣大學經濟系名譽教授