Your browser does not support JavaScript!
(文章) 請賴揆讀一讀統計學

請賴揆讀一讀統計學

 

楊志良

2018.07.19

 

 

    今年五一勞動節前夕,賴揆在「全國模範勞工表揚典禮」上說,勞工平均薪資近5萬,創下歷史新高。無獨有偶,農委會副主委陳吉仲在民進黨中常會中報告說,專業農戶平均年所得達154萬(哇!這麼高的收入,年輕人還不趕快改行)。這兩位的發言一出,馬上被各界「薪酸者」打臉,政論節目及網路上一片罵聲,這就是賴揆及陳副主委上課不夠用功的下場。

    賴揆是台大復健系學士、成功大學學士後醫系畢業、美國哈佛大學公共衛生學院碩士;陳副主委是台大農經系學士、碩士,美國德州農工大學農業經濟所博士。凡是醫學相關科系以及農學院學生,生物統計學是必修科目,否則不但沒有能力從事醫學及農業相關研究,甚至連閱讀相關文獻的能力都沒有。

    生物統計學非常重要的一章,是討論「集中趨勢」(Central Tendency),亦即希望用一個數值來代表群體的測量結果(一群數值)。而用哪一種單一數值來代表全體數值,其中有很大的學問。

當這一群數值是常態分布,比平均值大的及比平均值小的正好各半,呈現對稱型,極小的及極大的都很少的時候,可以用平均值代表「集中趨勢」。例如台灣18歲男性平均身高174.5cm、女性161.5cm,就可以讓我們瞭解台灣全部18歲男女性身高的狀況。其他如血壓、體重等生理數值,都可以用這個方式來掌握(至於為何有常態分佈就請來上課,不在此討論)。

但如果數值不是常態分佈,用平均來代表集中趨勢,就離譜及誤導了。「所得」就是個很好的例子,特別是貧富差距越大,越不能用平均值代表集中趨勢。舉例來說,郭台銘居住的里,因為有這位台灣首富,里民平均所得可能高達好幾千萬,但這個數字有意義嗎?可以因此就說,這個里的里民都是有錢人嗎?

主計處公佈的數據顯示,2017年5月,32%的就業人口月薪在3萬以下;5萬以上的只有163萬人,占18.9%。這種分佈稱為「偏右分佈」,大部份人在低的水準,少部份的人在很高的水準,所以平均起來有5萬,但這5萬只代表不到五分之一就業人口的薪資。

    因此在偏右分佈時,集中趨勢的指標應該是「眾數」(mode),也就是發生頻率最高的數值。根據財政部107年8月財稅大數據,所得的眾數就是基本工資二萬二千元(出現頻率最高),這才是正確的集中趨勢。賴揆說平均薪資近5萬、陳副主委說專業農戶平均年收入154萬,誤導民眾以為這是「集中趨勢」,不是討罵又是什麼?更可笑的是主計處的主計長,他是統計專家,曾任健保局總經理,本人與他同事數年,若是他主動將這些數據提供賴揆或是農委會副主委,那是故意讓他們出醜,事後也不提出說明,讓社會有更明確的認知,更是失職。

    另一集中趨勢的指標,就是中位數。中位數就是50分位,亦即數值比它高的及比它低的,各占50%,也就是一列數字最當中的那一個。台灣健保署對原廠專利期的藥價,就是以十大先進工業國的藥價的中位數為基準,再打折支付。

    因此在偏右分佈下,平均值大於中位數,中位數又大於眾數,而最適用的集中趨勢是眾數。

    另外一項重要的指標就是變異性(variation)。假設有外星人,其男性平均身高也是174.5cm,但矮的只有20公分,而高的有20公尺,那麼顯然外星人身高的變異性(差異性),就比地球人大很多。2013年財政部財稅的資料顯示,台灣薪資最低5%的所得,與最高5%的所得,相差近100倍,而1998年時只有32倍,16年來差距加大了三倍。此時統計學又可以發揮它的重要功能,探討變異的來源,例如收入的不同(變異)是否和學歷、年資、族群有關,進而嘗試建立因果關係。

    本人自1981年起,在台大醫學院教授生物統計學,鑑於若干統計理念不易瞭解,就以淺簡文字於1983年出版《生物統計學新論》,並獲教育部理工醫農類講義甲等獎,至今將近三十刷。賴揆及農委會高層,花個二、三百元捧個場,買一本回去讀讀,就可免再挨「酸民」謾罵的窘況。

 

 

<刊於2018.08.04蘋果日報A27「請賴揆讀一讀統計學」>

瀏覽數  
將此文章推薦給親友
請輸入此驗證碼
Voice Play
更換驗證碼