2015 / 3 / 19

[課前問答] 數據時代:程式x資料x探勘x系統

 

作者:陳育群 醫師

 

 

00_chenyc_NHIRD_20150125_0341  

 

問:想請陳育群學長分享一下,您會如何將大數據的精神及方法實際應用於醫療層面上?(除了寫論文外,這已經是學長的強項了)(醫院醫師 男 38 歲)

 

答:大數據精神在於「活用資料」,我們可以從「病患、服務流程、技術」三個角度來思考。

 

  1. 病患

個人醫療。大數據最重要貢獻在於「個人醫療」。群體資料有別於與臨床實驗,有助於幫助醫師患者盡快找到最適合的治療方式。例如:COPD 病患心臟病該不該使用 beta-blocker?嚴重 COPD 病患心臟病是否有答案一致呢?藥物長期使用安全性?這類問題還沒有被很好的回答,這也是台灣健保資料庫很值得發揮的地方。

 

更先進的可以切入個人化藥物治療。例如:Tamoxifen 對於乳癌治療很有效,但是部分病人效果不佳,Johns Hopkins 研究團隊,從基因圖譜中找出名為 MACROD2 的基因可以在使用 Tamoxifen 前先預測 Tamoxifen 抗藥性,對於乳癌治療是很大鼓舞(這裡)。

 

最近的奈米技術更是數據分析的天下,UCLA 團隊發表新的藥物平台,可利用資料探勘技術找出對個人腫瘤最適當藥物,組合成個人化新藥(這裡)。

 

  1. 服務流程

在公共政策方面,政府單位應該善用大資料回答健保未來成長與群眾健康問題。資料透明、數據共享,對於整個國家成本資源的監控管理會有很大助益。同時透過大量數據分析,應該可以發展更精緻的方法找出健保詐欺,取代目前為人詬病的核刪制度。

 

對於醫療服務提供者(醫院、醫師端),善用大資料可以

 

  • 有效追蹤相關數據、了解病患後續服務需求。例如: 病患在本院看完病後,會去哪兒?為什麼?始終掛不到號的病人去哪了?這很可能是本院醫療不足之處,值得進一步研究改進自身服務,提供一條龍式服務,可以大幅提升服務「價值」。
  • 提高治療效果,保證病患安全。醫療有其不確定性,透過資料分析,我們可以分析並預測「意外」發生,例如應該準確預測再住院率、術後併發症高風險族群,並提供更進一步依照病患個人化協助。
  • 成本預測。利用數據改善管理決策,是數據分析強項。尤其對醫療端,為了預防未知風險,存在著約 40% 的成本浪費,如果能夠利用數據提高未知風險的預測能力,再增強資源共享,將可大幅減少成本。以台灣來說,最基本的例子包括門診人力調派。如:假日應該開診嗎?應該開甚麼診?多少診對於醫院醫師病患是最划算的?這都應該利用數據分析仔細評估。 

 

  1. 技術

數據分析將會帶來醫院內部資料整合的需求,該如何將醫院內的門診系統、住院系統、給藥系統、掛號系統、檢驗系統、放射影像系統、社工系統、營養師系統、居家照護系統等等整合起來,還要兼具保密以及安全性,在資料倉儲與資料保全方面,是很大考驗。

 

透過數據分析,可以將既有服務拆解,結合移動醫療與雲端技術,建立嶄新醫療服務模式,目前中國正積極擁抱數據醫療,提出許多 O2O 線上醫療模式,相當值得注意。

 

 

問:Big data 概念,除了醫療照護領域、健保資料庫分析外,如何讓區域醫院的我們,應用在個人化醫療,保有我們的優勢?(眼科助理教授級主治醫師 男 44 歲)

 

答:Big data 帶來的不僅是健保資料庫分析,更進一步來說,應該是「活化資料」進而「創造價值」能力。您提到「個人化醫療」除了醫療照護與健保資料庫學術分析外,還有一要項就是「個人化體驗」。

 

單以「個人化體驗」來說,數據分析可能對地區醫院帶來的好處包括:

 

  • 有效追蹤相關數據、了解病患後續服務需求。例如:病患在本院看完病後,會去哪兒?為什麼?始終掛不到號的病人去哪了?這很可能是本院醫療不足之處,值得進一步研究改進自身服務,提供一條龍式服務,可以大幅提升服務「價值」。
  • 提高治療效果,保證病患安全。醫療有其不確定性,透過資料分析,我們可以分析並預測「意外」發生,例如:應該準確預測再住院率、術後併發症高風險族群,並提供更進一步依照病患個人化協助。
  • 成本預測。利用數據改善管理決策,是數據分析強項。尤其對醫療端,為了預防未知風險,存在著約 40% 的成本浪費,如果能夠利用數據提高未知風險的預測能力,再增強資源共享,將可大幅減少成本。以台灣來說,最基本的例子,包括門診人力調派。如:假日應該開診嗎?應該開甚麼診?多少診對於醫院醫師病患是最划算的?這都應該利用數據分析仔細評估。

 

上述只是冰山一角,數據分析會漸漸地進入每個角落,與其片面思考數據分析的應用,不如從「問題與需求」重新思考:現今台灣醫療環境對於使用者(病患)、醫療提供者(國家、醫院、醫師)其實都是相當不友善的。

 

最主要原因在於,目前醫療環境是為了方便「管理」而產生 ── 國家方便管理醫院、醫院方便管理醫師、醫師方便管理病人。醫療主要來自於人,我們如果以「病患、服務流程、工具」順序去思考,會發現目前台灣醫療體系在「服務流程」與「病患」還有很大的空間,這些都是數據分析可以努力方向。

 

 

問:台灣是否有 business model 能夠運用健保資料庫或是健康資料的大數據分析賺到錢?如果開一間健康資料探勘公司,在台灣有機會嗎?(Abu Dhabi Senior Officer 男 35歲)

 

答:這實在是個很有挑戰性議題,台灣受限於先天市場規模以及資源分配的問題,「個人健康」需求通常會被轉化為「全民福利」,以免費公共政策方式運作,限制較多,反而不易商業化。但是台灣醫療高度資訊化、高同質性與醫療人員素質平均等優點,卻是世界少有的優勢。這絕對存在於著一定的市場。

 

每個時間點都有不同機會,以醫療資訊系統 (HIS, Health information system) 為例,台灣健保每年五千億新台幣市場規模,加上政府全面推動電子病歷標準和醫療系統普及,大筆預算投注,曾經支持著高達 270 家醫療資訊系統廠商榮景(2003年)。

 

但是隨著健保緊縮、醫院營運困難,醫療資訊市場面臨很大轉型挑戰,台灣醫療系統廠商版圖大致底定,醫療資訊系統機會轉移到大中國市場,起步較晚,但是結合最新雲端科技、移動技術加上相對較靈活醫療市場機制,成長相當迅速。現在隨著高齡化、遠端醫療需求,長期照護系統、甚至照護模式逐漸浮出檯面。

 

健康數據應用的時代才正要開始,而且有大量需求(Gartner report 2015 預測會有一半以上的醫院會採用數據分析服務),根據 IDC 2015 年分析,健康數據最有潛力方向在於「個人醫療計畫」、「提升病患體驗」、「改善營運效能」。

 

順著這趨勢,美國已開始有新創健康數據公司成立,在台灣商業模式雖然還有待更多思考突破(找誰付錢?),但是可以肯定的是,市場需求一定有,但是如何避免落入台灣常見「減價思維」真要好好思考商業模式,或許一開始目標族群就該放寬思考著眼於全世界,才不會受限於台灣規模經濟。

 

 

問:如果想要學習研發 APP,從醫療界跨界有什麼樣的資源、優勢,或者合作可能?有沒有什麼可能的缺點?(神經內科醫師 女 32 歲)

 

答:這是個很棒開始。醫療與資訊跨界,醫師可以跨界學習資訊,資訊當然也能跨界醫療,各有好處。我們可以先以 3 月 9 日剛發表的巴金氏症者 APP mPower 為例,來看看醫療資訊在 APP 上能做些什麼。

 

Kaggle 是世界著名健康數據探勘平台,許多公司會將難以解決問題公開於 Kaggle,誰能夠提出最佳解決方案不止得到獎金,還有進一步合作機會。Michael J. Fox Foundation  (MJFF) 在 2013 年,公布了巴金森氏症患者手機所取得長達 18,000 小時紀錄資料(包含聲音、GPS、加速器、按鍵、問卷等),並且提供美金一萬元獎金給能夠成功利用資料「分辨出巴金森氏症病患」以及「掌握病情進展」者 。

 

得獎團隊是數據分析公司 (LIONsolver Team),他們撰寫了一個預測程式 (LINOsolver) 以100% 準確率贏得獎金。但是另一個由兩位神經專科醫師組成團隊得到特別關注獎,他們不與數據資料團隊競爭,直接跳到「如何利用資料分析病患療效」── 他們巧妙的利用病患按鍵錯誤率監控病患藥物控制後療效,如下圖,有效(綠色區 紫色區)或是劑量是否過高有副作作用(紅色區)。

 

比賽後,這故事並沒有結束,MJFF 更進一步與研究團隊 Sage Bionetworks 合作,最後推出在今年(2015年)3 月 9 日蘋果發表會中公開了 mPOWER,這是第一款可以診斷、追蹤巴金氏症,並將病患資料上傳結合成超大型研究資料庫的 APP

 

 

01_UPDRS-ADL

 

 

從 mPOWER 例子中,我們可以觀察到:

 

  1. Know-how:醫療價值就是「Know how」,臨床工作者比較可能突破技術盲點,從價值面出發,創造出對病患或疾病最有價值解決方案。
  1. 合作:mPOWER 計畫從一個 Kaggle 競賽項目開始,確定了「手機資訊與巴金森氏症診斷與追蹤可行性」,接著結合雲端科技 (Sage Bionetworks、MJFF),蘋果最新 ResearchKit,再加上來自英國美國不同大學的醫療、資訊等團隊,才有辦法在短短兩年內由概念落實成為超大型臨床實驗。這是個講求速度的時代。創意人人都有,誰能夠在最適當時間落實想法做出呢?就像超強賽車手,一定很懂車,也知道該如何修車,可是要贏得比賽,一定是最強車手(醫師)加上最強整備團隊(資訊),才會有突出表現。

 

自己學習 APP 是很棒開始,從做中學習過程中可以學到更多合作所需要知識,更重要是這過程中很可能認識更多潛在合作對象。可能來自於商業、管理、資訊等等,應該學習如何合作方式,一起把夢想完成。

 

自學最大風險是自己的時間成本最為昂貴,要在有效時間配置下開發出產品(目前 APP 開發大約 3 個月,一個 APP 如果開發超過 2 年,成本會增加很多)。常見開發案例有三種模式,一開始一定會花一點時間摸索適合您的方向,挑個順手的開發方式。
02_APP

 

 

醫師角色會比較偏重於創造嶄新價值,而比較不在於實際程式撰寫。總之,先找個小計畫,只要成功做出屬於您的第一個 APP,接下來就容易了。

 

 

問:醫療與網路結合之安全性及發展前景?(家醫科住院醫師 女 29 歲)

 

答:不是很確定您討論的議題是「醫療與網路結合之發展前景」或是「醫療網路安全產業之前景」?

 

  1. 「醫療與網路結合之發展前景」

網路從最早的 Web 1.0, Web 2.0, 到現在雲端技術,連線方式由數據機 (MODEM)、網路線、光纖網路、3G、4G 網路,已經大大改變人類生活。網路會越來越進步,醫療也會隨著網路普及越來越進步,這是肯定的,而且只會越來越快。

 

我試著將這兩年最值得關注重點依照醫療(臨床)相關性列表如下 (source: Gartner report: Hype cycle of technology for health provider 2014; IDC report),值得努力的事情很多,網路進步讓醫療更精緻,更多元化的服務模式(商業模式)。

 

  1. 「醫療網路安全產業之前景」

這是超級重要議題。隨著網路發達、個人化數據分析,新犯罪方式可能也會隨之出現。

 

對於目前網路最大隱憂來自於個人資料保管與使用。醫院資料涉及個人相當隱晦資料,在以往因為醫院資料鮮少與外部網路連結,比較少有問題。現在隨著網路漸漸普及,醫療院所勢必要互相交換資料(如:電子病歷、政府健康雲)或將資料公開(如:衛福部雲端藥歷),這些都與網路安全有關。

 

以此觀點來看,網路安全產業最少有兩個方向:

 

  • 「資料保全」:協助醫療提供者做好資料保護
  • 「資料活化」:將資料以匿名化、去連結等方式加密,讓資料可以被安全使用、再分析創造價值。

 

 

03_DATA

 

 

問:在跨界累積實力時,求快、求多、求好、求獨特,該如何分配精力和優先順序?譬如半路出家學資料分析:要去接觸最新工具?學習更多工具和應用?把一個工具學到很精?鑽研和自己第一專長相輔相成的部分?或是其他建議?(精神科主治醫師 男 33 歲)

 

答:時間是最為昂貴成本,尤其對於臨床醫師而言,分秒必爭,更應該好好利用。

 

目標明確:

應該根據每個階段設定可行且實際目標。Google 的 70/20/10 原則(70% – 核心業務,20% – 相關業務,10% – 全新事物)不僅適用於企業,也適用於個人。但是在跨界工作時這原則應該動態調整修改。例如,一開始起步學習領域新知需要大量摸索時間,這時候核心業務應該是「學習與上課」── 盡快跨越起步門檻,最少要花掉 70% 的時間。等到漸漸上手時,再依實際工作分配 70/20 時間。

 

以資料分析而言,建議一開始目標放在「上手」,先熟悉基本工具,如 R, SQL, Python 等,找出自己順手工作模式。接著是「求多求快」,「尋找獨特性」。

 

高效學習:

資料分析所需工具可能相當眾多,建議「夠用」就好。例如:一般來說,Excel 很適合做圖表、SQL 很適合做大量資料處理、MedCalc 很適合做統計。對於 Excel 高手而言,Excel 除了做圖表,還可以做資料處理、也可以作統計分析。但是以學習成本而言,要「成為 Excel 高手」的時間成本遠遠大於學習「Excel 做圖表 + SQL 做大量資料處理 + MedCalc 做統計」的時間。

 

把每個工具學到精通,等待的時間成本過高,我個人建議依照需求,為每個工具設下學習目標。以常用的醫用統計而言,要迅速得到答案可以考慮 MedCalc;要計算 Survival、發生率,STATA 是不錯選擇;統計又要加上市場分析,SPSS 可以考量;如果實驗室養老鼠,GraphPAD 對於基本實驗資料管理相當人性化;更複雜的基因分析,R 加上 Bio 套件,是生產力與威力兼備的工具。每一個軟體學它最強、最適合自己工作的部分比較實在。

 

資訊取得:

快速搜尋或取得「有效」資訊,是保持自己「更新」重要策略。工具只佔了數據分析的部份工作,「鎖定問題、改善服務」才是決勝關鍵。軟體工具更新相當快速,建議可以 follow 相關訊息來源如: 知名的 R-blogger、Kdnuggets 等等,這些都有助於掌握業界最新動態,至於要不要去學新工具,就要看時間成本與投資報酬率來決定了。建議能夠追蹤了解工具最新發展最重要,依照新工具對您的重要性加上 70/20/10 法則、投資報酬率來決定。

 

 

問:數據時代已開始改變生活及工作方式,請問非 IT 背景的工作者應如何因應?如何能跨界結合 Big data 的核心概念來增進工作的效能,及促進學習及生活上的便利?(助理工程師 男 35 歲)

 

答:Big data其實講的是「善用資料與分析應用資料」能力。這其實與是否有 IT 背景相關不大。

 

網路上曾經有這樣的故事:「計程車司機給 CEO 上的一堂 MBA 課

 

故事中的計程車司機被邀請去微軟上課,因為他說:「做計程車司機,也要用科學的方法。要懂得統計。…… 有人說做計程車司機是靠運氣吃飯的職業,我認為不是。你要從客戶的角度去思考 …… 通過選擇停車的地點、時間和客戶,主動決定你要去的地方」

 

這是一個計程車司機的故事,如果有許多計程車司機都這麼做,而且將資料結合在一起加以分析,那就是「租車網」告訴我們的故事,透過如下圖的租車使用資料分析,「租車網」將車輛放在最有需要用車的地方

 

 

04_Car Network

 

 

數據分析在意的是「人、服務、工具」,重要性也是先從人,然後服務,最後才是工具技術。別讓「工具」或是「技術」限制了您的想像空間。我們有幸生於雲端網路時代,許多功能已經雲端服務化,不需要太多程式基礎,您就可以創造出您的解決方案。

 

以我自己的學習為例,必須持續追蹤世界各國有關健保料庫發展動態,然後還要將其一一整理在 Excel 表格以供後續分析之用。在以前,必須自己寫程式或者手動一篇一篇複製貼上,現在有了雲端服務後,我開始利用 IFTTT 這個服務串連 PubMed 和 Google spreadsheet,文章出現在 PubMed 後隨即會自動轉儲存在 Google 硬碟的試算表中,後續分析相當方便。從問題出發,設計服務流程,最後才是工具。

 

 

問:如何利用 Big data 來幫助創業?(會計室帳務審核員 女 31 歲)

 

答:既然提到創業,我們可以從 (Alexander Osterwalder) 的 business model 圖開始。這張圖告訴我們找出 business model 的基本概念(下圖)。

 

 

05_business model

 

 

我們會發現數據分析在很多環節都扮演重要角色。因為,大數據分析一開始的就是為了解決商業問題而產生,我們甚至可以進一步將商業模式與相對應的數據分析方法列成下表更為清楚。

 

 

06_Business Compare

 

 

拜現在軟體工具的進步,只要準備好您的資料,很多軟體如 SPSS, R 都可以很容易完成分析。IBM SPSS 甚至還有中文化畫面可以使用(如下圖)。個人創業,可以藉由數據分析更精緻,提早找出潛在優點或瓶頸。

 

 

07_IBM SPSS

 

 

問:如何突破中西醫鴻溝,建立溝通語言?如何能達成中西醫結合治療,西醫需要哪些證據才能建立信任基礎,中醫又該如何努力,讓醫療地位不僅是養生調理?(中醫科主治醫師 女 36 歲)

 

答:其實中醫不論在國內外都有相當高的接受度。尤其在台灣,將近有 1/3 的民眾會同時使用中西醫,這代表中醫有一定效果,也廣為民眾使用,連部分西醫師都會使用中醫,這道鴻溝或許沒有那麼深。

 

教育是關鍵。產生正確的知識並且將正確知識傳播出去,是消弭鴻溝的關鍵。

 

以世界上 SCI 近萬本期刊來說,中醫只有 20 本左右,聲音實在太小了。西醫治療源自於許許多多大型臨床試驗,中醫也應該嘗試著以可驗證的研究方法來檢視,但是這需要時間與大量人力資源。隨著中國崛起,或許可以開始進行高品質的臨床試驗,依循藥物試驗流程逐步檢驗。尤其是藥物交互作用機制,中醫強調藥物有君臣佐使互相調配以達最佳療效,但若計算病患服用品項,病患中西醫處方並用可能會同時服用高達 15 種以上藥物,藥物越多,交互作用越難理解,這也是亟需克服關鍵。

 

至於角色方面,中醫在不同疾病扮演角色不同,如:中醫在癌症治療,可能主要在於副作用調理、但是在痛經、經前症候群,或許可以扮演治療主力。如果要努力證明中醫治癌效果比西醫開刀化療要好,相當困難。我們可做的事情或許是證明中醫在不同疾病所扮演角色,並且教育民眾、教育所有醫療人員,讓所有人有更多更好的選擇。

 

 

問:在未來的十年裡,醫界或者台灣社會該做什麼準備來回應人口老化帶來的社會問題與醫療需求?(學生 男 23 歲)

 

答:人口老化是個很大議題,實在很難簡單回答。

 

面對著急速老化社會,現在全世界政府面臨最重大考驗是經濟問題。以往經濟保險退休制度能都會失靈,加上人口老化、壽命延長,福利政策會面臨巨大缺口,社會法令等都需要重新思考。尤其台灣老化與少子化,社會老化速度應該是世界第一,社會尚未針對此轉變做出準備,僅以「增加年金」「增加保險」搶短線作法因應,是很大隱憂。

 

從醫療來看,應該區分成「照護」與「醫療」兩種需求。「醫療」大概就是醫院、醫學系裡面所學。但是高齡長者真正需要的大部分是照護,不是醫療。社會不安全,經濟困難、照護不佳,醫療問題就會隨之產生。營養不佳、行動不便長者當然很容易生病,產生醫療需求,仔細想想,這是由於「經濟」與「照護環境」所衍生問題,如果能夠提升「經濟」與「照護」,其實醫療問題也隨之解決了。

 

現在世代的醫師面臨挑戰不僅僅是「看病」、「治病」而已,更重要還要學習整合社會資源,從根本解決問題,才能減少病患反覆求診。社會也應該改變以往以「補給」救濟式的社會福利政策,從 empowerment 做起,營造一個讓高齡長者健康獨立生活的安全社會,才是長治久安之計。

 

 

追蹤新思惟國際