2019年3月27日 星期三

科學的對話 - 吳委員利用「p值的陷阱」蠱惑人心


    吳委員不是食品科學專家,也不是食品營養專家,更不是專業的執業醫生,不夠格也沒有權利用「吳氏食品安全」來替我們決定台灣的「食品安全」。
    運動有益健康,這是眾所皆知的常理,但你運動不保證你永遠都不會生病,同樣的道理均衡飲食有益健康,但均衡飲食也不能保證你永遠都不會生病。莫名其妙不明究理地刻意誤導民眾把生病之因,羅織罪名到是因為你有運動,或是因為你均衡飲食吃的食品上面。
    任何一位民眾生病,造成生病的病因,都應該交由專業的醫生來診斷與判定,而不是靠胡亂瞎猜與恐懼行銷式的一味誣衊食品界;找不出病因,就栽贓說可能是飲食裡有不安全的毒性成分,要求所有食品都要先去檢驗或評估有沒有含毒性物質或七萬種以上的化學物才能上市。吳委員假食安之名成立無食品專業專家之毒化局與獨立風險評估機構,污衊食品技師不懂食安而增設食品安全技師,這種疊層架屋,謊言狡辯之說猶如辯稱不是放屁是脫褲子放屁
    食品安全是最基本的要求,食品本來就具有一定的安全基礎,然而食品不是毒品,不該把食品當成毒品在管理,在符合於食品相關法規的規範之下,不需要用鑽牛角尖或海底撈針的方式去證明食品它有毒。台灣追求民主、人權,不是現行犯,警察不能擾民,好比如民眾沒犯法在家裡或走在路上,然而隨時都有警察過來說你要證明你沒犯法,不然就逮捕你,把每位民眾當成罪犯看待,有必要把食品這樣子搞嗎?
    決策不該只根據統計的顯著性二分法的情況下任何側重于為其重要性選擇的估計的討論都會有偏差,食品的風險分析只是食品科學的一個環節,風險評估並不是一種提供百分之百安全保證,只側重風險評估是不能保證食品安全的,不懂食品科學又執迷不悟如何能談食品安全?

一、 決策不該只根據統計的顯著性

    現在很多人談到「p值的危險」、「p值的陷阱」、「p值的誤用」、還有「p值的誤解」。2016年美國統計學會(ASA)發表了正式聲明,第三點提到:科學的結論,還有在商業上、政策上的決策,不應只靠p值來決定ASA告訴我們說,決策不該只根據統計的顯著性
    ASA聲明的第四點說:正確的統計推論,必須要「full reporting and transparency」,這是什麼意思呢?這是說:不但要報告p值顯著的研究結果也要報告p值不顯著的研究結果但傳統方法最大的問題是:研究結果不顯著,通通都沒有報告
 機率只告訴我們,如果你的虛無假設為真,有百分之五的機率,data會跟它不合但它沒有告訴我們虛無假設這個model為真的機率有多少,而這才是我們應該問的問題
    醫學上很多疾病,在所有人口裡面,得病的比例通常很小的。也就是說,得病的先驗機率通常都很小,所以偽陽性的反機率會很大0.95在我們想像中應該是很準確的,我們認為說我們錯誤的可能性只有5%,其實不然。檢定是陽性,但其實偽陽性的反機率可以高達45%
    如果我們不得不用傳統的統計方法,我們必須要增強我們的理論論述脈絡描述,因為增強理論論述和脈絡描述,即會增強研究假設先驗機率當研究假設的先驗機率比較高時其後驗機率–偽陽性的反機率–就會比較低
小結: 這好比你健康檢查某種疾病的篩檢出現陽性時,好的醫生會從你的性別、年齡、生活習慣、飲食作息、家庭病史、乃至於居住環境等脈絡來判斷你是否有充分的病因,以之來詮釋篩檢的陽性結果

二、 定義有說的才能,沒說的就不能
p-值只是眾多統計指標中的一個衡量方法而已,如果在最初設計統計模型時就設計錯了,而沒有去檢驗最初模型設定的合理性,那麼 p- < 0.05甚至會為你帶來一場災難!p-值並不能完全代表真實資料與模型之間的差距,仍然需要進行更縝密的資料分析才能做到品質比較高的統計推論。
小結: 如果只是看看 p-值就萬事大吉,還要這麼多統計學家幹嘛。

「因為太陽不可能從西邊升起, 所以我沒有做這件事!」,在假說檢定中, p 值就是 : 「太陽就從西邊升起」的機率 (太太的懷疑是正確的前提下) ; 因為 p 值為零, 所以 H0H0 的假說被推翻而 H1H1 成立。所以 p 值根本就是我們日常生活中以別種方式常常在用的推論工具!
    可是重點是,實際上「太陽從西邊升起」干「我有做這件事」與「我沒有做這件事」什麼事啊!

四、 800 位學者連署呼籲停止使用 p 值定義假設
近日 Nature 雜誌發表了三位統計學家的一封公開信表示:這種誤解用誇大的觀點扭曲了文獻,而且導致了一些研究之間的衝突。
1. 統計學專家如何呼籲大家不要只專注在 p 值的大小,而是肯定統計背後不確定性
    多數的讀者們習慣上以檢定 p 值小於 0.05 來選擇該研究是否有參考價值,p 值掌握了一個研究的生死。沒有統計顯著性則不能「證明」零假設。同時,統計顯著性也不「證明」其他假設。
2. p 值可能會誤導科學決策
    我們不應該僅僅因為 p 值大於某個臨界值,比如 0.05 或者因為零在信賴區間,而下結論說兩組之間「沒有差異」或者「沒有關聯」。也不應斷定,因為一個研究的假設檢驗的結果有統計顯著,而另一個假設檢驗沒有,因此這兩個研究存在衝突。這些錯誤會浪費研究工作並誤導科學決策。
3. 統計學家並非全盤否定 p 值,而是保留偏差性
    問題不是出在於統計,而在於人類和認知。三位統計學家也強調,我們並不禁止 p 值的使用,也沒有說 p 值不能在某些領域當做決策標準,比如決定生產過程符合某些品質控制標準。我們也不提倡什麼都可以,不可信的證據突然變可信。我們僅僅只是提議在常規的,不用 P 值來決定一個結果是否反駁一個科學假設。二分法的情況下,任何側重于為其重要性選擇的估計的討論都會有偏差。

五、結語
    問題不是出在於統計,而在於人類和認知。ASA告訴我們說,決策不該只根據統計的顯著性。值可能會誤導科學決策,科學的結論,還有在商業上、政策上的決策,不應只靠p值來決定,二分法的情況下任何側重于為其重要性選擇的估計的討論都會有偏差。好的醫生會從你的性別、年齡、生活習慣、飲食作息、家庭病史、乃至於居住環境等脈絡來判斷你是否有充分的病因,以之來詮釋篩檢的陽性結果。食品的風險分析只是食品科學的一個環節,風險評估並不是一種提供百分之百安全保證,單靠風險評估是不能保證食品安全的,不懂食品科學又執迷不悟如何能談食品安全?
延伸閱讀:
1. 吳氏食品安全 首部序曲
2 吳氏食品安全 二部曲 https://jackiebai.blogspot.com/2019/03/blog-post_6.html

參考資料:
1. 2016 社會科學前沿課題論壇 - 看電影學統計 - 林澤民
2. 2017 P-值已經死了嗎?莫須有罪名的最大受害者! - David Huang https://goo.gl/L4CWdC
3. 2018由「太陽從西邊升起」談 p 值的意義 -連怡斌
4. 2019 統計學基礎遭質疑!p 值、信賴區間為何被 800 名科學家連署反對?





沒有留言:

張貼留言