"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(149):Poisson regression

 

Cite this as: BMJ 2014;349:g6150

https://www.bmj.com/content/349/bmj.g6150


前言

本期內容說明#Poisson regression在運動醫學研究中的應用。通過分析神經肌肉訓練對女子滾球運動員非接觸式腿部受傷的影響,文章詳細說明為何選擇Poisson regression,如何應用這種統計方法,以及,如何解釋其結果。如果研究的結果變數為計數(a count),且滿足以下條件:符合Poisson分佈,事件為罕見、隨機發生、發生率恆定,以及個體暴露時間可能不同,則適合採用#Poisson regression。此為流行病學研究中常見的分析方法,特別適用於研究疾病發生率或事件發生率。


匯東華三周年慶典:擁抱AI,引領研究新紀元!

親愛的學友們,

匯東華陪伴大家走過三個豐碩年頭,正值AI數智時代來臨之際,我們準備好迎接研究生態的革命性變化了嗎?

重磅推出:AI應用於科學研究系列課程

7月6日(六)-7日(日):詳情請見課程報名區。

我們的目標:善用AI工具,擺脫耗時費力的研究瑣事,讓您專注於研究本質,釋放無限創造力:

三周年特別福利

更多學習資源:

想了解更多?

立即行動! 聯繫我們的官方LINE: @medatatw,搶佔AI研究先機!

感謝您一路相伴,讓我們一同在AI時代展翅高飛! ✨


 

問題:

研究人員調查一項神經肌肉訓練計畫是否能有效預防女子滾球運動員非接觸式腿部受傷。該計畫旨在提高球員的運動技能與身體控制能力,並對神經肌肉系統進行熱身,為特定運動動作做好準備。研究採用分組隨機對照研究設計。參與研究的 457 名球員(平均年齡 24 歲)來自芬蘭的 28 支頂級女子滾球隊。各隊採用分組隨機分配法進行處置,其中 14 支球隊被分配到介入組(256 名球員),14 支球隊被分配到對照組(201 名球員)。在研究期間,對照組的球隊被要求進行常規訓練。研究對俱樂部進行一個聯賽賽季(6 個月)的追蹤調查。[1]

 

主要結果為訓練或比賽期間腿部發生急性非接觸性損傷。介入組共記錄 32,327 個小時的訓練和比賽時間(每名球員平均 126.3 個小時(標準差 32.5)),而對照組為 25,019 個小時(124.5 個小時(30.8))。在整個賽季中,介入組共報告 20 次急性非接觸腿傷,而對照組則報告 52 次。有些球員可能不止一次受傷。介入組每 1,000 小時訓練和比賽的受傷發生率為 0.65(95% CI:0.37 - 1.13),對照組為 2.08(1.58 - 2.72)。與對照組相比,介入組未經調整的受傷發生率比為 0.31(0.17 - 0.58)。採用Poisson regression調整受傷發生率比,以消除潛在的干擾因子(包括年齡、BMI、滾球經驗、打球位置、矯形手術次數和聯賽經驗)。調整後的受傷發生率比(incidence rate ratio, IRR)為 0.34(0.20 至 0.57)。

 

下列敘述何者正確?

a) 球員發生急性非接觸性腿傷的可能性並不相同,因為他們的訓練和比賽時數不同。

b) Poisson regression的結果變數是賽季中急性非接觸腿傷的次數

c) 可以得出結論,訓練計畫大大降低女子滾球運動員急性非接觸腿傷的風險

d) 介入與急性非接觸式腿部損傷的發生獨立相關

 

答案

a、b、c 和 d 均正確。

  

詳細說明:

試驗的目的是調查神經肌肉訓練計畫是否能有效預防女子滾球運動員非接觸式腿部受傷。對照組球員則進行常規訓練。研究的主要結果是在 6 個月的研究期間發生急性非接觸腿傷的情況。比較不同處置組別在賽季中發生的急性非接觸性腿傷總數不恰當,因為這些組間預定的訓練和比賽時數不同。在賽季中,介入組的訓練和比賽時間為 32,327 小時,而對照組為 25,019 小時。由於介入組報告的訓練和比賽時數更多,因此,可能會出現更多的受傷情形。治療組間在訓練和比賽總時數上的差異有部分是來自於球員人數的差異所造成。此外,由不同組別兼球員訓練和比賽時數之標準差可看出,球員之間變異很大。球員的訓練和比賽時數越多,可能經歷的急性非接觸性腿傷就越多(a 正確)。因此,在比較治療組的急性非接觸腿傷數量時,必須考慮到球員本身和與不同處置在接觸方面的差異,即訓練和比賽小時數的差異。

 

考慮到治療組間訓練和比賽時數的差異,急性非接觸性腿傷的數量以發生率表示。發生率意指研究期間受傷的總人數除以訓練和比賽的總時數 [發生率=受傷人數/總時數]。研究人員報告稱,在介入組 32,327 小時的計畫訓練和比賽中,共報告 20 起急性非接觸腿部受傷事件,而在對照組 25,019 小時的訓練和比賽中,共報告 52 起受傷事件。因此,介入組的發生率為 0.00065,對照組為 0.00208。由於每組的受傷率都很小,因此,以每 1,000 小時訓練和比賽中的受傷次數表示。即介入組每 1,000 小時的受傷發生率為 0.65(95% CI:0.37 - 1.13),而對照組為 2.08(1.58 - 2.72)。

 

傷害發生率比(IRR)為 0.31(0.17 - 0.58)。該比率提供介入效果與對照效果的相對衡量標準 [2],其計算方法為介入組的發生率除以對照組的發生率 [IRR=介入組發生率/對照組發生率],解釋方式同相對危險性。IRR為 0.31,因此介入組與對照組相比,急性非接觸性腿部受傷的風險降低了 69%。由於IRR的 95% 信賴區間不包括1.0,因此風險的降低在 5% 的顯著水準上是明顯的。若IRR等於 1,則表示兩組的發病率相同。當比率的 95% 信賴區間不包括1.0時,該比率有顯著差異[3]。

上述IRR未對調整干擾因子,即未對組間可能因年齡等因素造成的急性非接觸性腿部傷害發生率差異進行調整。介入組與對照組的受傷IRR使用Poisson regression進行調整,以消除潛在的干擾因子。Poisson regression是對參與者暴露時間或追蹤時間不同的事件發生率進行建模。Poisson regression與之前問題中描述的其他迴歸方法類似[4-6],被稱為多變項(Multivariable analysis)分析,它同時研究因變數(有時稱為結果變數)與一個或多個預測變數間的關係。Poisson regression的因變數是計數(a count),而簡單線性迴歸與複迴歸分析的結果是連續的變數。在本研究中,結果變數是賽季中急性非接觸腿傷的次數(b 正確)。預測變數有時也被稱為解釋變數,可以是連續變數、二元變數或分類變數。在本研究中,這些變數是處置組(介入組與對照組)加上潛在的干擾變數,包括年齡、BMI、滾球經驗、打球位置、矯形手術次數和聯賽經驗。訓練和比賽的小時數也包括在內,以表示接觸訓練和比賽的時間長短。

 

採用Poisson regression的前提為,研究期間急性非接觸式腿傷的數量呈Poisson分佈。因此,假定腿部受傷的發生率屬於罕見事件、隨機(彼此獨立)和恆定。

 

Possion model提供每個解釋變數的急性非接觸式腿傷IRR,並對迴歸分析中的所有其他變數進行調整。處置組(介入組對對照組)的調整後受傷IRR為 0.34(0.20 - 0.57)。因此,在對干擾因子進行調整後,估計介入組的急性非接觸腿傷發生率與對照組相比,風險明顯降低 66%。由於調整後的IRR 95% 信賴區間不包括1.0,因此風險降低在 5% 的顯著水準上具有重要意義。因此,可以得出結論:訓練計畫大大降低女子滾球運動員急性非接觸腿傷的風險(c 正確)。由於在對潛在干擾因子進行調整後,與對照組相比,介入效果顯著,因此可以說治療組與急性非接觸式腿部損傷的發生有獨立相關(d 正確)。

 

未經調整的IRR與調整後的IRR間的差異很小,顯示干擾程度很小。潛在干擾變數本身的影響並不重要,重要的是潛在干擾變數的整體影響。因此,無須列出其他解釋變數的IRR。

 

Reference

[1]Pasanen K, Parkkari J, Pasanen M, Hiilloskorpi H, Mäkinen T, Järvinen M, et al. Neuromuscular training and the risk of leg injuries in female floorball players: cluster randomised controlled study. BMJ 2008;337:a295.

[2]Sedgwick P. Incidence rate ratio. BMJ 2010;341:c4804.

[3]Sedgwick P. Confidence intervals and statistical significance: rules of thumb. BMJ 2012;345:e4960.

[4]Sedgwick P. Simple linear regression. BMJ 2013;346:f2340.

[5]Sedgwick P. Multiple regression. BMJ 2013;347:f4373.

[6]Sedgwick P. Logistic regression. BMJ 2013;347:f4488.

 

#匯東華 #BMJ統計問題 #醫學統計 #Poisson regression #統計分析 #運動醫學研究 #發生率比(Incidence rate ratio, IRR) #研究方法論



 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。