日本一大视频,成版人青蛙视频APP

English | 簡體中文 400 821 3659 | info@avcclinic.com

健康醫療大數據綜述

2017-09-01  來源:《世界醫療器械》  
     
      作者:張繼武 2017年8月發表于《世界醫療器械》專刊  (如引用此文,請注明出處,謝謝。)

 

      人類社會的進步和自然的進步、科學的進步一樣,都有其必然規律,有其前后關聯性。大數據也不是突兀出現的,大數據本身是信息化發展的一個過程或者形式。
      以健康產業為例 ,
     (1)醫療信息化使得模擬的量數字化、信息化;
     (2)云則提供了一種分布式的管理和服務技術平臺;
     (3)大數據在這樣的技術積累之下,人類開始能夠大量獲取、存儲和處理數據 ,進而達到提取信息、規則、知識服務人類的目的。
     三者不是替代關系,而是互相支撐,本質上都是信息化。
     大數據(big data)定義:指傳統數據處理應用軟件不足以處理其大(巨量)或復雜程度的數據集合(摘錄整理自百度、Google)。
     在大數據發展過程中,涉及到醫療行業、信息化行業、標準化、精準醫療等,相應的,國際、國內對于數據的所有權、安全性、隱私性都有不同的方法學和法規支持。
 
     目前大家公認大數據具有 4 個基本特征(本文集中在健康醫療領域):



 
一、數據量巨大
 
      數據最小的基本單位是 bit,按順序給出所有單位:bit、Byte、KB、MB、GB、 T B、P B、E B、Z B、Y B、B B、N B、DB。它們按照進率 1024(2 的十次方)來計算。


二、數據種類多樣性
 
     大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。一般健康醫療大數據的來源主要包括:

     *結構化電子病歷數據 Structured EMR Data
     *非結構化的臨床記錄 Unstructured Clinical Notes
     *醫學影像數據 Medical Imaging Data
     *基因數據 Genetic Data
     *其他數據(流行病和行為)Other Data (Epidemiology & Behavioral)


1. 電子病歷數據
 
       一般美國常用的數據類型
    a.國際疾病分類(ICD - I n t e r n a t i o n a l Classification of Diseases):是疾病,體征,癥狀和程序代碼的分類術語,由世界衛生組織(WHO)維護;
    b.現代程序術語 ( CPT – Current Procedural Terminology ):該代碼集是由美國醫學協會通過 CPT 編輯小組維護的醫療代碼集 ;
    c.檢驗結果(Lab):檢驗結果的標準代碼是邏輯觀察標識符名稱和代碼(LOINC®);
    d.藥方(Medication):標準代碼是美國食品和藥物管理局(FDA)的“國家藥物管理條例”(NDC),它為每種藥物提供了唯一的標識符;
    e.臨床記錄(Clinical Notes)。
 
2. 醫學影像數據
 
       截止 2015 年,一般醫院擁有 665 特字節 (terabytes)患者數據,其中80% 是非結構化的醫學影像數據,如 CT、磁共振、數字 X 線等。
       醫學影像數據主要挑戰是不僅數據量巨大,而且具有高維度和高復雜性。提取圖像的重要和相關特征是一個艱巨的工作。這些挑戰包括:
     a.提取有意義的特征
     b.選擇相關特征(稀疏和降維技術)
     c.與其他臨床數據整合
      目前主要的工作成績在于提取相關圖像的特征以進行圖像檢索。

3. 基因數據
 
      人類基因組含有約 30 億對DNA 堿基對,以胸腺嘧啶(T)、腺嘌呤(A)、胞嘧啶(C)和鳥嘌呤(G)四種堿基排列成堿基序列。其中一部分的堿基對組成了大約 20000 到 25000個基因。一個人的基因數據量為約3GB。


4. 行為和公共衛生數據
 
       社交媒體產生大量的數據,如博客、微信、短信、Facebook、推特等,已經有國外團隊通過對于媒體數據的分析,可以分析出行為學、某些藥物的使用情況,甚至流行病發生的預測(幾乎實時)。下圖顯示Google 流感趨勢分析和實際流感爆發的對應關系。
       也有機構如 Patientlikeme(同病相連)通過社交媒體大數據分析幫助患者提供基于癥狀的就診建議、治療分析等。持續記錄個體的居家信息(如用 iPhone 的運動感知裝置)可以對于個體的健康和行為進行分析關注和提示。



三、當前醫療健康大數據發展的關鍵
 
       大數據的應用和研究是多層次的,首先是數據獲取、數據建模,然后才是數據處理、分析,獲取知識,建立認知,提供應用。
       對于我國大數據應用發展,當前要突破發展的策略性考慮是解決數據獲取和數據建模的瓶頸問題,是相應的系統平臺和方法學的研究。包括,數據獲取關鍵技術,數據采集互聯互通標準的建立和推廣;數據質量,包括數據模式,異構數據的管理,數據之間的關聯性,數據的時間分布;數據挖掘的方中,臨床數據的特征參數提取;數據應用,臨床數據挖掘的方法學應用于臨床輔助診斷的 CDSS 模式;精準醫療科研等。
 
1. 醫療大數據的采集
 
      大量的數據可以分析出疾病、癥狀及實驗室數據的相關性,從而幫助臨床研究人員建立針對某一些典型疾病的預測模型。在醫院的診療過程中,針對各個科室的特定應用,積累了長期的與特定疾病相關的臨床監測參數, 并隨著醫院的運營過程得到了大量的數據的積累。
      同時,隨著移動互聯網技術和穿戴式醫療設備及技術的發展,通過各種穿戴式設備所獲取的用戶生命體征,為用戶健康數據的獲取提供了極大的便利。
      一方面,可以通過對這些健康數據進行分析獲取用戶的健康信息以指導運動、飲食等生活習性;另一方面,與醫療數據的結合可以提高用戶疾病診斷的科學性和診斷精度。



2. 醫療大數據的分析
 
       傳統醫療行業中,醫院信息系統完成了醫院內部的流程控制、數據積累等工作。醫療行業早就遇到了海量數據和非結構化數據的挑戰,而近年來很多國家都在積極推進醫療信息化發展,這使得很多醫療機構有資金來做大數據分析。醫療數據是醫療人員對病人診療過程中產生的數據,包括病人的基本情況、行為數據、診療數據、管理數據、檢查數據、電子病歷等。現代醫院中將上述數據存儲于醫院的各個信息系統之中,是醫療大數據分析的基礎。
       醫療健康數據是持續、高增長的復雜數據,蘊含的信息價值也是豐富多樣的,對醫療健康數據的有效存儲、處理、査詢和分析,挖掘其潛在價值,發現醫學知識, 將深切影響人類健康水平和治療手段。在傳統的醫學統計方法的基礎上,新的模型與技術的出現,為從數據中獲取新知識提供了新的思路。
       針對不同的類型的病人對不同類型的生理數據、健康感知數據進行推理判斷, 大數據分析技術實現了服務臨床治療、預測疾病發病情況、跟蹤病人病情等目的。


3. 醫療大數據的應用
 
       在對用戶的診療數據、健康監測數據的釆集和分析的基礎之上, 可以實現用戶身體狀況的預測、監控,甚至可以確定用戶是哪一類的疾病的易感人群。提高用戶的健康狀況水平,降低用戶的患病風險。精準分析包括病人體征數據、費用數據和療效數據在內的大型數據集, 可以幫助醫生確定臨床上最有效和最具有成本效益的治療方法。醫療護理系統將有可能減少過度治療,比如避免副作用大于療效的治療方式。

四、大數據相關技術領域
 
       與大數據相關的技術領域有可穿戴設備,物聯網(IoT – Internet of Things)等。

五、小結
 
      麥肯錫的研究說明,應用大數據技術可以節省醫療健康產業成本達 4500 億美金。
     1、正確生活(Right living):充分的信息和知識幫助人們有效防止特有疾病,持續的健康和治療,主動采取更為積極的生活方式提高健康水平。
     2、正確治療(Right care):通過大數據分析保證治療方案的正確性(臨床輔助、臨床路徑),以及可以使得不同的醫務人員在信息共同的基礎上協同治療; 
     3、正確的提供者(Right provider):醫療衛生服務提供者的能力和行為記錄分析幫助雙方選擇正確的服務提供者;
     4、正確的價值(Right value):大數據顯然能夠很好地控制醫療費用、提高醫療質量;
     5、正確的創新(Right innovation):大數據對于新藥研發、新治療方案提出等都具有重要幫助,可以節省藥品監督管理要求的臨床階段的時間。