"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

【醫學人員的研究利器:免費公開資料庫系列】

NHANES簡介

陳秀敏 博士

ChatGPT 協助整理

一、NHANES概述

NHANES的全稱為National Health and Nutrition Examination Survey,中文譯為國家健康和營養調查。為一旨在評估美國成人和兒童健康和營養狀況的研究方案。此項調查十分獨特,因為把訪談和體格檢查進行結合。NHANES是國家衛生統計中心(NCHS)的一個主要項目,而NCHS則是美國疾病控制和預防中心的一部分,負責編制全國生命和健康統計數據。透過以下連結進入NHANES官網首頁。

二、專案歷史與調查方法

NHANES計畫始於20世紀60年代初,作為一個系列調查,側重於不同的人口群體或健康專題。1999年,該調查成為一項持續性計畫,每兩年進行一次調查,其重點不斷變化,側重於各種健康和營養評估以滿足新出現的需求。本項調查每次對大約10,000人的全國代表性樣本進行抽樣調查,這些人分布在全國各州,其中每年有15個縣受到訪問。

NHANES的訪談部分包括人口、社會經濟、飲食和健康相關問題。檢查部分包括醫療、牙科和生理測量,以及由醫務人員進行的實驗室檢查。

其為一項橫斷面調查(cross-sectional survey),採用分層多階段抽樣設計來獲取美國居民的代表性樣本。其具體抽樣過程分為五個步驟:

  1. 將美國所有的縣根據其特點分為15個組,然後從每組中選出一個縣,共同構成當年NHANES調查中的15個縣。
  2. 在NHANES的15個縣中的每一個縣內形成較小的群集(例如社區),並從中選出20到24個小群集。
  3. 確定這些選定小群集中所有房屋或公寓,並在每個小群集中選擇大約30戶家庭的樣本。
  4. 與選定的家庭聯繫,並就家庭中的每個人提出一系列簡短的問題(如年齡、種族和性別)。
  5. 通過電腦程序隨機選擇一些或全部家庭成員參與調查。

三、NHANES數據庫特色

  1. 豐富多樣的數據:NHANES包含廣泛的人口統計、健康狀況、營養狀況、生理測量和實驗室測試數據,這些數據可以用於構建各種預測模型。
  1. 高質量和代表性:NHANES數據具有全國代表性,並且經過嚴格的數據收集和處理過程,確保數據質量高。
  1. 長期持續的數據收集:自1999年以來,NHANES每兩年收集一次數據,提供豐富的歷史數據,可以用來進行時間序列分析和長期趨勢預測。
  1. 多樣的變數:NHANES數據庫包含豐富的變數,涵蓋從個人行為、飲食習慣、實驗室檢查到各種健康指標。
  1. 公開可用:NHANES數據免費向公眾開放,研究者可以自由訪問和使用這些數據來進行機器學習和預測模型的研究,無需額外的數據購買成本。

四、NHANES在科學研究中的價值

NHANES在以下方面之研究具有關鍵作用:

  1. 確定主要疾病的流行率和風險因素:通過NHANES數據可以了解各種疾病的流行情況和風險因素,幫助制定公共衛生政策。
  2. 評估人群營養狀況:NHANES數據可用於評估人群的營養狀況,並探討其與健康促進和疾病預防的關係。
  3. 健康指標的標準基礎:NHANES數據用於制定身高、體重、血壓等健康指標的國家標準,這些標準被廣泛應用於公共衛生領域。
  4. 流行病學研究:NHANES數據被廣泛應用於流行病學和健康科學研究,有助於制定健全的公共衛生政策,指導和設計衛生方案和服務。
  5. 機器學習和預測模型的研究:涵蓋從個人行為、飲食習慣到各種健康指標,變數豐富,可以作為機器學習模型的輸入特徵,增加模型的準確性和預測能力。

五、NHANES數據的實際應用

NHANES數據被廣泛應用於世界各地的研究機構、學術機構和醫療機構。利用NHANES數據發表的SCI論文數量眾多,其中超過70篇發表在《美國醫學會雜誌》(JAMA)。NHANES數據的結果在許多重要方面使美國人受益。例如,憑借過去的調查數據來創建兒科醫生在全國範圍內用來評估兒童成長的成長圖表,這些圖表已被世界各地採用和修改。最近還使用最新的NHANES數據更新血液中的鉛數據,作為環保政策制定的參考。自20世紀70年代以來,血液中鉛含量的上升幅度下降70%以上。

目前,NHANES調查仍在繼續,數據庫每年都在持續更新。儘管已有大量研究使用NHANES數據發表眾多文章,但該數據庫仍具有巨大的潛力等待發掘。尤其是適合用來做機器學習和預測模型的研究。

匯東華課程報名:[直播]國外公開醫學資料庫:NHANSE與SEER介紹與取得,2024/08/16(五)18:30~20:30 

匯東華統計學院線上課程:醫學人員的研究利器:免費公開資料庫: eICU-CRD、MIMIC與NHANES簡介

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。