機器之心AI科技年會 | 數坤科技研發副總裁危夷晨：AI在醫療影像的應用和探索

2022-04-13由機器之心發表于文化

機器之心報道

機器之心編輯部

3 月 23 日，在機器之心 AI 科技年會上，數坤科技研發副總裁危夷晨發表了主題演講《AI 在醫療影像的應用和探索》，對 AI + 醫療影像行業進行了全面的介紹。

以下為危夷晨在機器之心 AI 科技年會上的演講內容，機器之心進行了不改變原意的編輯、整理：

感謝機器之心邀請我來參加這次活動，我是數坤科技的危夷晨。

我長期從事計算機視覺方面的科研和產品研發，之前在曠視科技和微軟亞洲研究院工作。最近我加入了數坤科技，從事 AI 醫療影像方面的技術研發。

這次的分享主要是一個對於 AI + 醫療影像行業的全面介紹，由於時間的關係可能不會特別深入，但我希望能把這個行業的一些特點、發展歷史給大家做一個簡明的介紹，因為很多計算機視覺、影象領域的從業者對於醫療影像行業的瞭解相對較少。

第一部分是整個 AI + 醫療的時代背景，眾所周知我國老齡化開始加速，醫療健康的需求在急劇增加。同時我們的醫療資源非常不平衡，大醫院人滿為患，小醫院基本沒什麼人去。為了解決這個突出的供需矛盾，國家提出需要把人工智慧方向上升到國家戰略方向，需要跟一些重要的民生領域做深度的結合，其中就包括醫療健康，需要讓 AI 給醫療健康賦能，提升資訊化智慧化的程度，提升服務能力。

不僅是在中國，科技跟醫療健康產業進行結合是全球的趨勢。如圖是研究機構 CB Insights 在 2021 年釋出的全球數字健康產業的前 150 名公司名單，在醫療影像領域數坤科技是唯一入選的中國企業，這也代表了國際頂級研究機構對數坤的認可。

在國內，也有很多的公司把 AI 技術跟醫療場景結合起來。其中，醫療影像是很大的一個賽道。

為什麼做醫療影像？有兩個原因，第一個原因是有需求，因為在整個診療過程中，影像分析是第一個環節，目前來說影像科的資料增長率非常高、需求多，但是醫生的增長相對緩慢很多，供需矛盾突出。同時，影像科的人力成本和裝置成本較高，效率較低，所以有很強的降本增效的需求。

第二個原因是有條件，醫療影像分析的任務跟自然影象視覺任務有很多共性，近年來隨著計算機視覺、深度學習技術的飛速發展，跟影象相關的各個行業，都在迅速發展。這提供了很好的技術基礎和人才基礎，因此，相對來說醫療影像這個行業的技術門檻不是特別高。

跟很多其它與影象分析結合的行業一樣，每個行業都有各自的特點，醫療影像也不例外。下面我從行業本身的挑戰和優勢角度做一個簡要的介紹。

醫療影像領域第一個難點在於影像任務比較豐富多樣，比較碎片化。因為每個影像任務至少會受到三個主要因素的影響，第一是如何成像，第二是照哪個人體部位，第三是看哪種病。即使是一樣的成像方式（比如都是 X 光或者都是 CT），如果人體部位不一樣、病不一樣，所做的影像分析任務也不一樣。

第二個難點是資料門檻比較高，因為用 AI 做醫療影像分析的歷史比較短，整個領域還比較缺乏資料的規範和體系。第一個問題就是資料很難標註，因為醫療影像的標註需要專業知識，並且往往是 3D 資料，標註起來很慢。另外一個問題在於標註標準不夠統一，雖然醫療行業有比較統一的標準，但在實踐中不同的醫院不同的醫生有自己的一個相對標準，甚至可能同一個醫生兩次看同一個 case，結論可能都不一樣，這就導致標註的結果往往不是完全一致和確定的。另外，資料還很難收集，醫療資料相對比較隱私，儲存在醫院內部，整個行業缺乏像 ImageNet 這樣的大型公開資料庫，一個病種能夠收集到幾千個資料就已經屬於大資料了。當資料的廣度和深度都不足的時候就容易發生比較系統性的偏差，會依賴於收集裝置，哪怕同一個裝置掃描引數不一樣，甚至掃描技師不一樣，產生的資料質量也不一樣。難以標註和難以收集的問題導致演算法不太容易泛化。

第三個難點在於自然影象跟醫療影象有一些區別，對於演算法存在一些特有的挑戰。第一點僅僅具備一些基本的常識不足以做醫療影像研究，需要學習一定的醫學知識，但難度不算太大。第二點是識別任務比如說檢測、分割、分類這些任務的描述跟自然影象裡面很相似，而難點在於：有一些病灶很小，會涉及到小到 4 個畫素的病灶檢測，甚至小到 2-3 個畫素的血管分割，對機器學習方法具有比較大的挑戰。另外一點醫療影像資料以 3D 為主，3D 影象任務在視覺領域來說，科研演算法積累比較少，同時會缺乏一些好的開源庫。同時在處理 3D 資料的時候 GPU 的視訊記憶體往往不足，對於演算法、工程都會有更多的挑戰。涉及到重建任務時，因為 3D 重建需要理解人體結構，所以跟自然影象的 3D 重建區別是比較大的。涉及到影象處理任務，因為需要了解醫療影象的成像原理，跟自然影象的原理也不一樣。總體來說，相對之前做自然影象所需要的演算法能力來說，醫療影象對演算法研發和工程能力要求會稍微高一點。

說到這裡，大家可能覺得 AI + 醫療影像的研發難度很大，其實仔細想想也不是這樣。如果我們對比其它行業，比如說安防、零售、工業檢測、自動駕駛，就會發現這些難點其實是普遍現象。需求碎片化，資料難標註、難收集，缺乏統一的標準，需要把演算法和領域知識結合，而不是直接可用，這些難點本身就很常見，但並不是高不可攀的障礙。

另一方面，醫療影像行業有一些特別的優勢。

第一個優勢就是這個行業本身是相對規範的。儘管不同的醫院之間可能有一些區別，但並不需要過度定製化。總體上一致的標準包括：

有標準的資料格式——dicom 格式；

同一個病在不同醫院的診療流程大概一致；

這樣一個相對來說比較規範化的行業環境，提供了做產品的土壤和基礎，而不需要過度的定製化，因此能夠以成本比較低的方式做出比較好的產品。

第二個優勢是醫療行業比較傳統，資訊化、智慧化的程度相對較低，進步空間很大，存在一些「低垂的果實」。

第三個優勢是 AI + 醫療行業目前發展時間較短，大概發展了 5-6 年的時間。整個行業依然是一片藍海，不像其他行業已經出現了一些巨頭，例如安防的海康、自動駕駛的特斯拉，因此 AI + 醫療行業內還存在比較充分的機會。

最後一點，我希望分享一下，醫療行業有完整清楚的價值閉環，也就是我們能夠為醫生、患者、醫院、國家創造什麼樣的價值，這一點相對清晰。只要能夠完成這個閉環，產品就是可以落地的。這可能是我選擇加入醫療行業最核心的原因。

從 2015 年開始深度學習、計算機視覺就開始和醫療影像快速結合，這幾年整個 AI 影像行業有了很快的發展，可以從幾個角度對比來看。

2016 年，很多大公司、創業公司開始入場 AI + 醫療領域，也存在一些同質化的競爭，例如當時做肺結節影像的特別多，投資也非常狂熱。整個醫療行業包括醫院和醫生剛開始接觸 AI，持著將信將疑的態度開始嘗試。

經過 5-6 年的迭代和耕耘，整個行業的狀態發生了很大的變化。從公司的層面講，大公司相比於創業公司競爭力不足，創業公司的體系更為完整健全，衝勁更足。創業公司裡面也有很多公司被逐漸淘汰，只剩下了少量頭部公司，他們之間的競爭也從同質化競爭逐漸轉變為更加多樣化，更有自己的特色和優勢。行業內的投資更為理性，更加向頭部公司靠攏。同時很多醫生真正使用 AI 產品之後體會到了 AI 的優勢，開始普遍接受這個新生事物，並對產品產生黏性。整個行業這幾年有了很大的發展和成長。

下面我從產品本身如何去迭代和演化的角度做一個簡要的介紹。從 2015 年開始，產品從複雜程度、演算法和產品設計的過程來看，大概經歷了四個階段，我們稱之為 1。0-4。0，從最初 2015 年的單任務單環節，過渡到多工全流程，再過渡到多模態多場景，到現在的跨模態複合流程。從僅限影像科，到現在進入臨床手術，經歷了比較大的變化。

在 1。0 階段，大家都扎堆做肺結節影像，這個任務相對來說比較簡單，在 CT 影象上進行結節的檢測、分割以及良惡性的分類，只需要有一些資料和基本的深度學習、影象的演算法經驗就可以做起來，門檻低，同質化競爭嚴重。同時產品的市場競爭力和盈利能力也是比較低的。

到了 2018、2019 年，AI 影像的產品開始從單任務、單環節拓展到多工、全流程的場景，我們稱之為 2。0 階段。其中一個比較有代表性的產品就是數坤科技做的冠脈和頭頸 CTA，涉及到多個演算法任務串聯起來的流程，只有這個流程全部自動化之後，才可以為醫生提供比較大的價值，解決醫療行業的痛點。如圖所示，傳統流程可能需要花 60 分鐘才能完成這些步驟，而在 AI 流程下，很多環節被自動化的演算法取代，因此只需花費 10 分鐘，效率大大提高，這就是 2。0 產品帶給醫療場景的價值。

到了 3。0 階段，我們就不僅需要處理單一的場景單一的流程，而是過渡到一個更加複雜的診斷和治療任務。以腦卒中為例，我們要判斷病人是不是腦缺血，第一步首先要做 CT 的平掃，透過 ASPECT 評分大概檢視大腦內部有哪個區域可能缺血，當我們知道確實有一些區域有缺血癥狀之後。下一步需要找到哪一根血管發生堵塞導致缺血，因此要做一個腦部 CTA 來尋找原因。定位原因之後，下一步要確定治療方案，是開啟血管進行手術，還是做保守治療，因此第三步是做一個更加複雜的腦部 CTP，在一個時間序列內關注腦部所有區域缺血的嚴重程度，最右邊的圖中綠色區域就表示比較健康的供血正常區域，紅色就表示缺血區域。如果缺血的程度不是很嚴重，就有可能採取一個比較激進的治療方案，比如做手術取栓。如果缺血比較嚴重，那麼做手術就可能有危險，因此會採取一個相對保守的治療方案。可見，對於這樣一個比較複雜的病種需要做三個不同階段的掃描，多模態資料分析和判斷過程是串聯起來的，每一個模組都有各自的作用。

到了 4。0 階段，除了需要處理多模態資料之外，多模態資料之間的關係也不再是串聯和各司其職的簡單關係，而是它們之間互相有關聯、互為因果。以核磁肝臟診療為例，每一個 case 會拍多達十幾個序列，每一個序列是不同核磁的徵象，AI 產品需要在不同的序列上找到病灶徵象，並做出綜合的判斷和分析，不同序列之間的資料是要統合考慮的。醫生做出判斷和分析的整個過程是比較複雜的，因此必須要複雜程度 4。0 的產品才可以很好地實現自動化。這是我簡要介紹了一下從 2015 年開始到現在的發展歷程。

下面我以一個比較有代表性的 2。0 產品為例作詳細的介紹，希望能讓大家理解如何做出一個有價值的 AI 影像產品。這個產品聚焦於心血管或腦血管疾病的診斷。選擇這兩種疾病的原因是心腦血管疾病是非常高發，並且後果嚴重的重要疾病。在中國這兩種病的死亡率也很高，基層醫院普遍缺乏診療能力，對裝置和醫生的能力要求都很高，只有少數大醫院才能對血管做很好的疾病處理。提升大醫院、小醫院對心腦血管疾病的處理能力，對整個醫療現狀很重要。

首先簡單介紹一下什麼叫做血管疾病。血管疾病大體分為兩類，一種是血管堵了，另外一種是血管破了（包括內壁、外壁破了），這會導致各種各樣的問題。我重點講一下針對冠心病（心臟血管堵塞），AI 如何幫助醫生解決問題。

冠心病的診斷是一個什麼樣的過程？首先需要做一個冠脈 CTA，得到一個比較清晰的血管影像，醫生第一步需要在三維影象裡分割出血管，血管用紅色區域來表示，分割過程是醫生在一個傳統工作站上透過半手工加半自動影象處理演算法完成的，一根一根血管去分割就可以重構出整個心血管的樹狀結構。基於這個樹狀結構醫生可以根據專業經驗判斷出要檢視哪一根血管，看其中有無病灶或者鈣化，導致血管堵塞或血管狹窄。

上圖右上角是一張 CPR 圖的動畫。透過 CPR 這種視覺化方法，醫生可以比較方便地針對某一根血管的某一個位置，找出病灶及其嚴重程度。除了 CPR，醫生還會藉助一些其他視角的圖，例如短軸圖、拉直圖。傳統方法中，醫生結合上述三種三維資料視覺化方法，用肉眼觀察病灶的位置、性質，以及嚴重程度來做出判斷。

傳統方法中，醫生的工作流程是在工作站上主要基於手工，加上半自動的演算法輔助，依靠肉眼觀察資料做出判斷。這種方式首先工作量很大，處理一個 case 可能需要幾十分鐘；另外重建血管的精度有限，容易發生一些斷裂，血管形態錯誤，命名錯誤，肉眼診斷精度不穩定等問題，並且醫生寫報告的手寫格式也缺乏統一的標準。

讓 AI 演算法幫助醫生更加自動化地、高效地、精準地完成這個流程，其中有幾個難點。第一個難點是血管的重建，不同部位的血管尺度變化較大，粗的位置可以達到兩釐米，細的位置可能只有兩毫米。第二個難點是對於比較細的地方，我們需要比較精細的分割才能準確判斷血管是不是有堵塞或狹窄。這種一到兩毫米的血管反映到 CT 的畫素上只有兩到三個畫素，深度學習演算法需要精細到畫素級別，才能對病灶的性質做出判斷。第三個難點是整個血管重建的任務不是標準的三維幾何重建或者基於深度學習的影象任務，非常依賴於人體的解剖知識，需要很多細節。此外，診斷標準本身不是特別的統一，對 AI 演算法存在一些挑戰。

下面我簡單描述一下我們的做法，如圖是基於神經網路對血管做分割、對病灶做檢測和分類的網路結構。下圖上面一排是對病灶的軟斑和鈣化進行分類，下面是網路模型在一個拉直圖上對血管做清晰的分割，分割的結果是一個紅色的 mask，用來判斷血管狹窄程度。

整個流程的詳細步驟是：第一步做預處理，然後提取冠脈樹，其中會有很多斷裂和各種各樣的瑕疵，需要基於解剖學知識的演算法來做血管的修復和連線；另外，還需要給血管進行命名，重建出冠脈樹，並在不同的血管上做病灶檢測以及分類和識別，每一個環節都包含很多細節。

可見，2。0 產品相對於 1。0 產品有很大的區別，它由多個流程串聯而成，每一步之間都有一些關係和影響。

如圖是一個重建出來的三維血管圖示，左邊是血管的渲染效果，右邊增加了心肌之後整個心臟的重建效果。

基於這樣的三維重建，我們可以把 CPR 圖，短軸圖、拉直圖三種不同的視覺化方法以一個統一的介面展現在產品中，方便醫生以更高的效率選擇觀察什麼樣的血管，觀察什麼位置以及分割的結果，結合醫生自己的經驗對病灶的情況做出判斷。這種方式既有演算法自動輸出的結果，同時也允許醫生基於自己的理解對於演算法的結果做一些修改，這是一個 AI 和醫生協同工作的過程。

最後一步基於演算法的結果或者基於醫生的修改就可以自動化地生成格式很標準的、符合醫療行業要求規範的報告，也就完成了從 CT 檢查到血管重建到做診斷寫報告的整個過程。這種方式對於整個冠脈 CTA 診斷的降本增效非常明顯，傳統方法可能需要一個小時，現在用了 AI 之後中間很多環節被自動化處理，可能只需要 10 分鐘。我們統計了一家醫院使用我們的 AI 產品前後的患者等待時間，之前是平均需要 2 天，之後平均需要 1 天，大幅縮短了患者的等待時間，提高了就醫體驗。

這種方法的診斷精度和質量跟比較資深的醫生差不多，比那些經驗較少的年輕醫生還要更準確一些。在人機協同方面，我們的演算法產品提供了一些診斷結果，允許醫生做出 double check，這種方法的效果一般來說是優於醫生自己用肉眼做判斷，因此診斷質量也有所提升。

另一方面，醫院的成本降低、收入增加。之前醫院可能需要 10 臺或者 20 臺工作站，並且每臺都比較貴，可能需要 20-30 萬，現在可以替換為一臺中央伺服器，以私有云的方式在醫院部署起來，執行我們的 AI 產品，使用演算法的服務，每個醫生用一臺普通電腦只需要幾千塊錢的成本連到伺服器，就可以完成跟之前一樣的事情，醫生的工作時間減少，工作質量上升，醫院的收入增加。右邊的圖是一個對比，即不同型別三甲醫院、基層醫院在使用冠脈 CTA 產品前後收入的變化，收入有顯著的上升，因為診斷的病人增多了。

這個產品是一個結合很多自動化演算法環節的典型例子，完成了全流程的自動化，從輸入資料到最後得到報告，從 2018 年推出之後，已經在超過 1600 家醫院完成部署，得到了很多醫生和領導的好評。這個產品引領整個 AI 醫療影像行業從之前大家都去做肺結節的同質化競爭時代，進入到了一個能創造很高價值的 2。0 時代。

簡單總結一下整個行業目前的現狀、挑戰以及未來的發展方向。目前，行業條件逐漸成熟和完備，整個行業處於快速上升階段。

從公司層面來說，從之前大量公司創業到今天少數公司已經脫穎而出，他們完成了從 0 到 1 的驗證過程，開始在申請上市，初步獲得了資本的認可。

從產品來說，產品本身的價值和商業模式在大量的醫院和醫生使用過程中已經得到了初步驗證，使用者的習慣逐步養成，開始有穩定增長的營收。隨著 AI 產品在越來越多的醫院和醫生中得到認可，需求也隨之增多。與此同時，AI 影像產品的型別、形態，涉及病種，也在快速地發展和變化，從 1。0 到 4。0 以及更復雜的形態正在快速演化。國家對於醫療行業也給予了大力支援，包括開始給這些 AI 醫療公司頒發三類證，這是一個門檻很高的准入資質，並進行了一些醫療服務收費制度的改革，比如之前我們把一個 AI 影像產品一次性賣給醫院可能價格幾十萬、上百萬，這樣的方式不太能持續，可能會演化成每使用這個演算法為一個病人做一次診斷，就花費一點點成本，從一次性買斷轉變成按例收費，國家也開始嘗試推動這種收費制度的改革。

從整體挑戰和發展趨勢來說，技術方面的現狀是大家還是比較簡單地把計算機視覺領域的技術（包括檢測、分割等）比較直接地用到了醫療影像的資料任務上，還沒有跟先進的機器學習方法做出更好的融合。

我們需要針對這種資料少、資料難收集的問題做更多的小樣本學習、遷移學習、聯邦學習。現在在計算機視覺影象領域非常火的自監督學習，利用大量資料做預訓練，能夠有效地提升預訓練模型在不同下游任務上的泛化效能，這個正規化在醫療影像領域同樣適用，可能是未來的趨勢。

由於醫療專業知識本身比較精細，需要跟演算法做深度的融合。目前還沒有實現這一點，我們需要對人體結構知識、醫療專業知識做一個很好的建模，並跟目前標準的，基於自然影象的分割、檢測演算法在演算法層面完成融合。

醫療本身的結論是需要可解釋性的，未來在這方面也會有很多與醫療任務結合的先進 AI 方法，例如現在已經有研究把因果推斷和醫療結合起來。

最後，軟硬一體化也是未來的一個發展方向，軟硬體將更好地融合，充分發揮硬體的能力，提升產品的整體效率。

從產品角度講，AI + 醫療影像的產品需要從現在的單部位單病種擴充為多部位多病種。未來每次拍一個片子將不只看一種病，而是診斷出可能涉及到的多種病症，大幅提升醫療效率，提高健康服務水平。

產品的設計需要跟醫生多年以來形成的工作習慣進行深度的適配，在符合醫生習慣的前提下，把 AI 產品的使用方式完美融入到醫生的臨床工作流程中。

一個產品除了做診斷以外，我們還希望未來它能夠全流程覆蓋整個診療的閉環，從診前到診斷、治療、手術、術後的隨訪，做到全方位的覆蓋。現在很多 AI 產品依然是各自為戰的零散工具，給醫院和醫生的使用體驗是不太方便的，需要有一個平臺化的解決方案，來統一入口和介面，把一個公司甚至不同公司的 AI 產品能夠無縫融合起來，提升整個產品的使用體驗。

從行業角度、監管角度、臨床准入的角度看，我們也有很多需要做的事情，需要在多個因素共同成熟和配合下才能讓 AI + 醫療影像的產品進一步發展和成熟。

雖然這個分享主要是關於影像的分析和診斷，但實際上整個醫療健康產業與技術融合是一個很大的願景，也是行業的共識。我們要讓 AI 能夠參與臨床的決策和手術規劃，再進一步從醫院內部走向外部，在日常生活、家庭體檢等各種各樣的場景中提供個性化的、無處不在的精準服務。這個過程可能會比較漫長，我們目前只處於這條道路的左下角，即 AI 看懂和讀懂片子的階段，但這個過程已經開始了，並且在不斷髮展。

最後，我簡單介紹一下數坤科技公司的使命和願景。我們不僅做醫療影像的分析，我們也希望能夠成長為醫療健康智慧化 AI 平臺。

TAG： AI 醫療影像血管演算法

機器之心AI科技年會 | 數坤科技研發副總裁危夷晨：AI在醫療影像的應用和探索

相關推薦