他以為自己活不過十年,結果發現只是醫生沒學好貝葉斯|贈書

如今貝葉斯理論已經被應用到生活的方方面面,包括計算機技術、醫學檢測、保險精算等。簡單來說,這一理論研究當其他事件已經發生,或者在給定其他事件已經發生的前提下,某事件發生的可能性會因此受到怎樣的影響。但是,有多少人真正理解了它?誤用貝葉斯理論又將造成怎樣的後果?

本文節選自《醉漢的腳步》,贈書規則參見文末。

圖書簡介

他以為自己活不過十年,結果發現只是醫生沒學好貝葉斯|贈書

作者:[美] 列納德·蒙洛迪諾(Leonard Mlodinow)

譯者:郭思羽

出版品牌:中信出版·財經分社

《醉漢的腳步》來自一個描述隨機運動的數學術語,當分子飛越空間並不斷撞擊其他分子或被其他分子撞擊時,它走過的路徑就如“醉漢的腳步”一樣。我們可以用分子的路徑來比擬我們的生活,或是我們從大學到工作、從單身到建立家庭、打高爾夫球時從進第 1 洞到進第 18 洞之間的過程。作者列納德·蒙洛迪諾在為我們揭示偶然性的真實本性以及導致我們誤判周遭世界的那些心理錯覺的同時,也為我們提供一種看待生活的全新視角,幫助我們更智慧、深刻地認識世界,理解生活。

作者簡介:

列納德·蒙洛迪諾(Leonard Mlodinow) ,美國理論物理學家,任教於加州理工學院,曾是史蒂芬·霍金、理查德·費曼等科學家的同事,並與霍金合著《時間簡史(普及版)》《大設計》兩部作品,被霍金譽為“最會講故事”的物理學家。《醉漢的腳步》是蒙洛迪諾的代表作之一,他的其他作品還有:《費曼的彩虹》《潛意識》《彈性》《思維簡史》等;同時,他也是《星際航行》等好萊塢鉅製的編劇。

我與貝葉斯神父最值得銘記的相遇,是在 1989 年某星期五的下午。醫生打了個電話給我,說我會

有 99.9% 的可能性活不過 10 年

。他還加了一句:“我真的十分抱歉。”就好像他對某些病人說的抱歉並不是真心誠意的。在回答了我問的幾個有關病情發展的問題後,他結束通話了電話,很可能是向別的病人送驚喜去了。我很難說出甚至回憶起我到底是怎樣度過那個週末的,不過那個週末我肯定沒有去迪士尼樂園。可為什麼被下了這個死亡判決後,我今天還能好好兒地在這裡寫書來說這件事呢?

這個令人心驚肉跳的事情,起因於我和妻子申請辦理人壽保險。這個申請需要進行血檢。過了一兩個星期,我們的申請被拒絕了。這個向來節儉的保險公司,這次竟然不惜血本地用兩封內容幾乎相同的信件,告訴了我們這個訊息。給我妻子的信中,不過就是把我的那封信中“由於你的血檢結果”而否決了保險申請的措辭,改為了“由於你丈夫的血檢結果”。這唯一多出來的“丈夫”一詞,顯然是好心的保險公司願意提供的關於我們投保被拒的唯一線索。我帶著不祥的預感去看了醫生,做了一次 HIV(人類免疫缺陷病毒)檢查。檢查結果是陽性。儘管開始時,我因為這五雷轟頂的訊息都忘了問問這個結果是否真的可靠,但是根據後來的瞭解,我知道了醫生是如何得出那個 0。1% 的健康機率的:

在 1 000 個沒有艾滋病病毒的血液樣本中,會有一個 HIV 陽性結

。這聽起來好像沒什麼不同,但事實並非如此。醫生將“如果我沒有感染 HIV 而檢查結果呈陽性”的機率和“如果我的檢查結果呈陽性而我並沒有感染 HIV”的機率搞混了。

為了理解醫生所犯的錯誤,讓我們來使用貝葉斯方法。

首先定義樣本空間

。我們可以把所有曾接受過HIV檢查的人都包括進來,但如果能有更多和我自身狀況有關的附加資訊,那麼對我而言結果將會更準確一些。因此我們只考慮所有曾接受過HIV檢查、不濫用靜脈注射吸毒的異性戀美國白人男性(我們會看到,這個附加資訊將給出多麼不同的結果)。

現在我們已經知道哪些人應該被歸入樣本空間。

接下來,我們將這些人分為幾類。

現在我們問題中的型別不再是男孩或女孩,而是檢查呈陽性且確實為 HIV 感染者的人(真陽性)、檢查呈陽性但沒有感染 HIV 的人(假陽性)、檢查呈陰性且沒有感染 HIV 的人(真陰性)以及檢查呈陰性但實際感染了 HIV 的人(假陰性)。

最後,我們來看一看每種型別的人數。

考慮一個 1 萬人的初始人群。根據美國疾病控制與預防中心的統計資料,我們可以估計在 1989 年,大約每 1 萬名接受檢查的不濫用毒品靜脈注射的異性戀美國白人男性中,會有 1 名感染了 HIV。假設假陰性率非常接近 0,這就意味著,大約每 1 萬人中有 1 人會因為真實感染而被檢測出陽性。此外,由於假陽性率是醫生所說的 1/1 000,因此,

大概另有 10 人雖然沒有感染 HIV,但還是被查出呈陽性

。而樣本空間中剩下的那 9 989 人,檢查結果是陰性。

現在精簡樣本空間,使之僅包含那些檢查結果為陽性的人,也就是 10 個假陽性和 1個真陽性。換句話說,

在 11 個被查出為陽性的人中,只有 1 個是真的 HIV 感染者。

醫生告訴我檢查結果出錯,就是我實際上沒患病的可能性是 1/1 000。不過他更準確的表達應該是:“別擔心,你沒有感染 HIV 的機會不小於 10/11。”對我來說,這個篩查顯然被我血液中的某種標記物給欺騙了,要查的病毒其實並不存在。

瞭解假陽性率對於任何檢查結果的評價都十分重要。舉例來說,假設一個檢查能查出 99% 的惡性腫瘤,這個診斷率聽起來令人印象深刻,但我可以很容易就設計出一個能 100% 查出腫瘤的方法:我可以讓所有被檢者的結果都是陽性。我的方法和真正有用的方法之間的差別,在於我的檢查方法假陽性率很高。但我的遭遇說明,

只知道假陽性率還不足以確定檢查的實用性,我們還需要比較假陽性率與疾病的真實流行情況

。如果疾病十分罕見,那麼就算假陽性率很低,陽性結果也不表示就一定患病了;但如果是常見疾病,陽性的檢查結果就更有意義。如果我是同性戀又被查出陽性,那麼這時疾病的流行度會如何影響陽性結果的診斷意義呢?假定在 1989 年的男同性戀中,進行 HIV 檢查的人的感染率為 1% 左右。也就是在 1 萬個檢查結果中,真陽性的數量不是之前的 1 個,而是 100 個,此外還有 10 個假陽性。那這時,陽性結果的被檢查者確實被感染的機率,就變為 10/11。這也就是為什麼使用檢查結果時,確定被檢查者是否屬於高危人群對於診斷結果十分有幫助。

貝葉斯理論告訴我們,

B 發生時 A 也發生的機率,一般不同於 A 發生時 B 也發生的機率

。醫生們常犯的錯誤,就是因為沒有清楚地認識到這一點。在德國和美國進行的幾項研究中,研究者告訴參加實驗的醫生,乳腺 X 射線檢查有 7% 的假陽性率,然後請這些醫生估計一下,一名無症狀的 40~50 歲且乳腺 X 射線檢查結果為陽性的婦女,她真正患乳腺癌的可能性有多大。此外,他們還告訴這些醫生實際的乳腺癌發病率約為 0。8%,而假陰性率約為 10%。把這些資料湊到一塊,就能用貝葉斯方法得出,真正因患乳腺癌而得到的乳腺 X 射線檢查呈陽性的比例,僅為 9% 左右。但在德國醫生組中,有 1/3 的醫生認為這個機率為 90%,所有受試者給出的估計值中值則是70%。在美國醫生組中,100 名醫生中就有 95 名估計這個機率應該在 75% 左右。

在體育運動員的藥檢中也出現了類似問題。假陽性率這個實際上與問題沒有多少直接關係的資料,又一次被拎出來。

運動員違反禁令的真實情況被假陽性率扭曲了

。例如世界級的田徑運動員,1983 年的 1 500 米和 3 000 米世界冠軍獲得者史蘭尼 1996 年在亞特蘭大參加美國奧運會選拔賽,希望能夠就此回到田徑場上。不過藥檢結果顯示她服用了睪酮類藥物。在慎重討論後,IAAF(國際田徑聯合會,2001 年起國際田聯的官方名稱)仍然確認史蘭尼“違反了藥物禁令”,並事實上終結了她的職業生涯。在史蘭尼的這個案子裡,有很多證據表明,她所接受的尿檢的假陽性率高達 1%。這個數字讓許多人對於史蘭尼所受的處罰感到心安理得,因為她確實服用了禁藥的可能性應該就是 99%。但我們已經看到,這個結論並不正確。假設有 1 000 名運動員接受了檢查,而他們服用禁藥的真實比例是每 10 人中有 1 個。假設檢查能以 50% 的機率發現確實服了禁藥的運動員。那麼,每 1 000 名受檢的運動員中,會有 100 名確實違規,而其中 50 名會被尿檢查出。同時,剩下的那 900 名清白的運動員中,也有差不多 9 個人的結果呈陽性。因此,尿檢陽性並不意味著史蘭尼罪有應得的可能性是 99%,而是 50/59 = 84。7%。史蘭尼確實違規的可能性,跟扔骰子沒扔出 1 點的可能性差不多。而這個大小的可能性,顯然給質疑這個判決的合理性留下了足夠的空間。更重要的是,這個例子表明,如果藥檢規模很大(每年有 9 萬名運動員接受尿檢),那麼之前那種推理過程會使許多無辜者蒙冤。

讀者福利

從氪金抽卡到疾病檢測,你的生活中有哪些值得關注的機率事件?你在學習和工作中是怎樣應用貝葉斯定理的?在評論區留言,隨機抽取 5 位讀者贈送《醉漢的腳步》1 本。

活動規則:

1。 在本文評論區留言,我們將從入選留言中抽取 5 位讀者贈送圖書 1 本,留言收集將於 11 月 9 日(星期一)下午 17:00 截止。

2。 目前禮品郵寄僅限中國內地,如果您身在港澳臺地區或國外,獲得贈書後可以請國內親友代收。

點個“在看”,分享給更多的小夥伴

TAG: 陽性hiv檢查結果陽性率