匯東華統計顧問有限公司 - BMJ專題-152-如何解讀ROC curve

"匯東華-認真作好每件事"
~統計，不再是阻力，而是助力~

BMJ小小統計問題（152）：How to read a receiver operating characteristic curve (如何解讀ROC curve？)

Cite this as: BMJ 2015;350:h2464

https://www.bmj.com/content/350/bmj.h2464

前言

本篇文章深入探討ROC曲線在醫學診斷中的應用，詳細解釋如何利用ROC曲線評估不同生命體徵作為腦部病變篩檢工具的效能，並說明如何權衡敏感度與特異度下，通過分析曲線選擇最佳診斷閾值。為學習ROC曲線不可錯過的文章。另公司於12/28(六)、12/29(日)也有開設臨床預測模型課程，歡迎有興趣的學友報名參加。

Hope u enjoy it

匯東華三周年慶典：擁抱AI，一起進化！

親愛的學友們，

匯東華陪伴大家走過三個豐碩年頭，正值AI數智時代來臨之際，我們準備好迎接研究生態的革命性變化了嗎?

重磅推出：AI應用於科學研究系列課程

第二期ChatGPT助力文獻綜述、統計分析與資料視覺化即將於9/21和9/22啟動，感謝學員好評！課程詳細內容請見「課程報名」網站。

#第二期 9/21 (六) AI03: 使用ChatGPT助力文獻綜述—建立自己的學術GPTs
#第二期 9/22(日)AI04: ChatGPT助力統計分析與資料視覺化

我們的目標：善用AI工具，擺脫耗時費力的研究瑣事，讓您專注於研究本質，釋放無限創造力!

三周年特別福利

限時優惠：https://pse.is/65bzf2
會員專屬權益: https://pse.is/65bzhq

更多學習資源:

BMJ統計問題列表: 匯東華官網/學習專區
線上課程: https://medata.teaches.cc/

想了解更多?

最新消息: https://reurl.cc/n1MGyv
課程詳情與報名: https://reurl.cc/EoRxpg

立即行動! 聯繫我們的官方LINE: @medatatw，感謝您一路相伴，讓我們一同在AI時代展翅高飛! ✨

問題：

研究人員調查使用「生命體徵」篩檢作為識別意識障礙病人腦部病變情況。研究地點在日本急診室。共研究 529 名意識受損的病人，評估標準為格拉斯哥昏迷量表分數低於 15 分。研究人員持續追蹤病人直到出院。病人抵達醫院時，會記錄收縮壓、舒張壓及脈搏率等生命體徵。腦部病變的診斷則是根據腦部造影與神經檢查進行判定。共有 312 位病人 (59%) 被診斷為腦部病變[1]。

針對已診斷的腦部病變，分別評估各生命體徵篩檢測試之效能。每個生命體特徵的量測標準以相等大小的分層作為分類。每個生命體徵之分層依次作為「陰性」與「陽性」篩檢測試結果間的臨界值；所有測量值大於分類分層的結果均被視為「陽性」結果，所有其他結果均被視為「陰性」結果。若結果為陽性，則視病人為腦部病變「高風險」群；否則視病人為腦部病變「低風險」群。對於每層之生命體徵，都會得出敏感度和特異度，並用於描繪生命體徵的ROC curve（如圖）。收縮壓的曲線下方區域為 0.90、舒張壓為 0.82、脈搏率為 0.63。

下列敘述何者正確？

a)(1 - specificity)數值為在篩檢中非診斷為腦部病變的病人被辨識為陽性的比例。

b)對於連續的生命體徵臨界值，隨著篩檢測試的敏感度增加，特異度降低。

c) 最能區分已診斷出腦部病變和未診斷出腦部病變的病人的生命體徵為收縮壓。

答案

a、b 和 c 均正確。

詳細說明：

本研究目的是要確定哪一項生命體徵最能預測意識受損病人的腦部病變，然後選擇該生命體徵的最佳閾值，作為篩檢腦部病變的"陽性"(高風險)和"陰性"(低風險)結果之界線。研究者將三項生命體徵的測量尺度分成相等大小的分層。對於每項生命體徵的每個分層，統計被診斷出腦部病變的病人數(如表格所示)。

ROC curve table

對於每項生命體徵，研究者逐一將各分層作為篩檢測試結果的陽性和陰性的分界點；所有生命體徵測量值高於閾值之病人被視為篩檢結果陽性，其他則為陰性。對於每項生命體徵的每個分層，研究者計算出敏感度和特異度，並用這些數據繪製該生命體徵的接收者操作特徵曲線(ROC曲線)。

對於每項生命體徵，ROC曲線的繪製方法為：以每個分層的敏感度為縱坐標，以(1 - 特異度 = 假陽性率)為橫坐標。因此，這條曲線能夠展示當陽性和陰性篩檢結果的閾值改變時，敏感度和特異度間的關係。篩檢測試的敏感度和特異度概念在之前內容已進行說明[2]。敏感度指在被診斷出腦部病變的病人中，被該生命體徵正確識別為陽性的比例。特異度指在沒有被診斷出腦部病變的病人中，被該生命體徵正確識別為陰性的比例（a正確）。因此，(1 - 特異度)的值即為沒有被診斷出腦部病變的病人中，被生命體徵誤判為陽性的比例(即"假陽性率")。

在選擇生命體徵作為腦部病變篩檢測試的陽性和陰性結果閾值時，敏感度和假陽性率間存在權衡關係。例如，當脈搏率的切點分層從每分鐘130次以上降低到每分鐘50次以下時，被正確識別為陽性(高風險)的已診斷腦部病變病人比例會增加，導致敏感度提高。但是，由於降低切點，被正確識別為陰性(低風險)的未診斷腦部病變病人比例會減少，導致較低的特異度(b正確)，因此，假陽性率會上升。ROC曲線為每個閾值提供一個視覺化圖形，顯示被正確識別為陽性的已診斷腦部病變病人比例與被錯誤識別為陽性（假陽性）的未診斷腦部病變病人比例間之關係。

理想情況應為敏感度應該盡可能高，而假陽性率應該盡可能低；低假陽性率等同於高特異度。因此，選擇生命體徵的最佳切點取決於正確識別已診斷腦部病變病人(真陽性)和錯誤識別未診斷病變病人為陽性(假陽性)的影響。

若某個生命體徵的切點能100%準確地預測已診斷腦部病變病人和未診斷病人，則敏感度與特異度都將趨近於1，假陽性率將等於零。因此，ROC曲線將必須通過圖形左上角。曲線會從原點開始，垂直上升到敏感度為1.0，而後水平延伸到假陽性率為1.0。不過，篩檢很少能100%準確。

一般來說，若一個生命體徵在一系列切點分層下都能保持較高的敏感度和特異度(接近1.0或100%)，則就能很好地區分已診斷腦部病變病人和未診斷病人。因此，生命體徵的曲線越接近圖形左上角，就越能正確區分此兩類病人。反之，曲線越接近ROC圖中的對角線，表示該生命體徵越不能正確區分這兩類病人。

如前所述，生命體徵的曲線越接近圖表左上角，就越能區分已診斷腦部病變病人和未診斷病人。因此，可以通過比較每條曲線下的面積(通常以百分比顯示)來比較三種生命體徵作為腦部病變篩檢測試之整體準確性。曲線最接近左上角的生命體徵，也就是最能區分是否為腦部病變病人，以收縮壓(0.90)最佳，相比之下舒張壓為0.82，脈搏率為0.63(c正確)。

對於每種生命體徵，通常會選擇最接近圖表左上角的切點分層作為陽性和陰性篩檢測試結果的最佳閾值。對於收縮壓，該值為120-129毫米汞柱，敏感度為88%，特異度為78%；對於舒張壓，值為70-79毫米汞柱(敏感度77%，特異度72%)；對於脈搏率，此值為每分鐘80-89次(敏感度57%，特異度61%)。

然而，選擇最接近圖表左上角的切點分層假設假陰性結果(已診斷腦部病變病人在篩檢中被錯誤識別為陰性)和假陽性結果的影響相似。ROC曲線在比較兩個或多個篩檢測試的表現時可能最有用。

Reference

[1] Lkeda M., Matsunaga T,IrabuN,etal.Usingvitalsignstodiagnose impaired consciousness: crosssectional observational study. BMJ 2002;325:800.

[2] Sedgwick P,Joekes K.Evaluating theperformance ofascreening testfordepression in primary care. BMJ 2015;350:h1801.

#匯東華 #BMJ統計問題 #醫學統計 #ROC curve #Cut-off point