抽樣誤差的困惑與解決
藍白合因雙方對民調評估、抽樣誤差未達共識而卡關,預定廿二日「定讞」,如何終極審判?
問題在「統計誤差」一詞與「勝者得一點」連結。過去慣例是將民調直接加總比較,與「統計誤差」的真相無關,這次卻變成關鍵。
民調誤差必須在以下「二元(項)分配」條件才能夠計算:p+q=100%=1。亦即只有在兩人/組競選,且兩人/組獲票之和爲100%。如果原始數據不是100%,必須先標準化爲100%。慣例用不到誤差,所以無所謂。這次變成讓分依據,影響深遠。
在以上條件下,「誤差」的計算有一定的公式。柯文哲以爲誤差是個固定數3,誤解應來自「民調套餐」均以一○六七份樣本爲準,則誤差爲±3%。如果樣本數偏少,柯文哲變成要全讓;樣本數增加,柯變成全部不必讓。
柯認爲是固定讓3%,但文字寫成讓「統計誤差」,除非雙方差距很大,對被讓分者相當有利,而讓分者相當艱鉅。
各方民調誤差並非事實。以柯自提的數據爲例,其誤差宣稱爲±2.98%。正確處理爲先將資料標準化爲「二項分配」,再計算誤差。則「侯柯」對「賴蕭」爲54.6% : 45.4%,誤差爲±3.48%;「柯侯」對「賴蕭」爲58% : 42%,誤差爲±3.37%。「侯柯」「柯侯」之差爲-3.4%。那要按照比第一組小而讓?還是要按照比第二組大,而不讓呢?
答案是「都不對」,因爲前兩者與「侯柯」對「柯侯」之誤差都無關。
證明就是:第一組「侯柯」爲54.6%;第二組「柯侯」爲58%;兩者相加爲112.6%,超過百分之百。
數理邏輯上,在無關的對比資料中抽出單項資料,沒有比較意義。
柯文哲提出的內參民調其實對己不利,這份民調沒有別人可以看到,執行者也正是他的民調專家,既然是專家,不可能不知道坊間認知的誤差就是±3%,故證明柯在此案很誠實。而他若在民調顧問的告知下,還是接受了艱鉅的讓分,也表示他有「挑戰大擔」的雄心,有願賭服輸的準備;如果就此定案,就是求仁得仁。
萬一因缺乏討論,情有可原,或可再做最後一次釐清。
在此緊急時刻,請三方各推選一位「中立專家」,在已知民調評估產生膠着與困局的原因下,不必再辯論,而由三專家以民調原理重投一次票。相當於「上訴審」的「法律審」,不再爭執已知各節而「定讞」。
「上訴審」應採用「兩票決定則終止」制,亦即如果前兩票已投給相同一位候選人,則停止開票,以保障「中立專家」的中立性。