12345.jpg

與大多數影像科醫生一樣,浙江省人民醫院放射科主任龔向陽教授會因為每天面對200多份胸部CT而抓狂,因為他要在8小時之內看完幾萬多副圖像,并尋找是否有結節。做出患者有肺結節的判斷是很容易的,只要發現有結節即可,但判斷患者沒有結節卻很難,看完之后沒有結節,心中不由得嘀咕:是不是我出神了沒發現?真的是正常的嗎?

與大多數不同的是,龔向陽還是一名AI醫療的“遛狗人”,“遛狗”是他的醫生同仁對于智能肺結節篩查系統的戲稱,言下之意是這套系統需要每天學習,會變得越來越聰明。 他認為,對于影像科醫生來說,“AI能增強醫生的信心,這很重要?!庇辛薃I之后,AI判定沒有結節,醫生看一遍確實也沒有,基本就不會有問題了。

從去年10月份開始,浙江省人民醫院與依圖科技合力打造的胸部CT智能輔助診斷系統已經在后者的體檢中心小范圍試用了,到如今,已經正式嵌入醫院的臨床工作流程中。據稱,接診體檢人數已接近20000例,系統敏感度在96%~97%之間。

如今,業內人人都在談AI醫療。但AI醫療到底該如何突破、如何落地卻尤待探索。在一次AI醫療論壇上,復旦大學醫學院一教授慷慨激昂地稱,“醫學專家很重要,需要龔教授這樣有號召力的專家,把臨床數據集合起來?!?/p>

智能肺結節篩查系統主要應用于體檢

AI掘金志:目前,胸部CT智能輔助診斷系統嵌入醫院工作流程的哪一環?

龔向陽:在我國,肺癌是最高發的癌癥,而降低發生率的方法是:早篩查,早發現,普遍用低劑量胸部CT篩查。假設以45歲為界,超過45歲的病人建議定期進行篩查,但這樣的人不能定義為病人,只是體檢者,有些在醫院,有些在體檢機構,篩查其是否有肺結節。中國的大醫院接受了大量的體檢工作,但這與看病人完全不一樣,100個人中也許有90多個是正常的,體檢醫生每天看的CT影像有幾萬多副,非常累。

目前這套系統主要應用在體檢,但可能會擴展,因為臨床需求是非常復雜的,昨天和一個腫瘤醫院專家溝通,他說系統在他們醫院好像沒什么用,因為病人一般不去腫瘤醫院體檢,所以每個醫院/每個患者的需求不一樣,要做很多工作,不僅僅是這一點事情。

AI掘金志:有了這套系統之后,影像科體檢醫生的工作有什么具體的改變?

龔向陽:我們現在的流程是這樣的:先看AI找到的結節,之后會再看一遍所有的圖像,如果沒有發現新的結節,就相信AI的診斷結果。

最終是醫生簽發報告負責,如果漏診了,是要負責任的,目前醫生不可能100%依賴AI,它也有極少部分是漏掉的,我們也正在分析什么情況下會漏掉。但AI對醫生是很有幫助的,最重要的是提高了醫生的信心。我們不是怕找到結節,而怕沒找到結節,如果看完200副胸部CT,結論是正常的,心里就會犯嘀咕,真的是正常的嗎?還有我沒發現的嗎?這時候就會再看一遍。還有是年輕醫生剛開始簽報告,壓力很大,經常會反復看好幾次。所以,判斷體檢者沒有結節,完全正常,其實是很難的。

有了AI之后,AI判定沒有結節,醫生看一遍確實也沒有,基本就不會有問題了??偠灾?,能減緩新醫生壓力;減緩醫生疲勞度。除此之外,能幫我們更精準地做更多事情,AI系統診斷的報告能說明肺結節在哪個層面、第幾個序列、結節多大等精細特征,接下來的版本會告訴你在哪個肺段、結節密度特征等。不是說醫生做不了這些,而是醫生的工作量太大了,不可能做那么細。所以我們希望借助AI,在保持效率的基礎上,維持醫療服務質量。

AI掘金志:除去體檢外,針對肺部疾病的智能系統,有沒有推進?

龔向陽:我們認為不遠的將來肯定可以的,我是看好的。但這種做法是否可行我其實比較難評價,我的重點不在這一塊,依圖可能在跟其他醫院合作推行更加深度的診療環節等的分析工作。

但我認為,對于AI來說,重要的東西是類似的:

一是數據。之所以我們進步比較快,是因為我們有足夠的數據儲備,肺結節體檢的數據是巨大的,數據是沒有問題的。

二是算法。算法其實大同小異,但是特別聰明團隊的算法可能會模擬得比較快,小團隊可能推行地比較慢,反正我認為算法不是一個太大的障礙,最終決定因素還是數據。在我們醫院,體檢數據輸入很快,那么,能有多大量的診療環節數據投入呢?這是一個問題。

比如打造智能診斷肺癌的系統,需要100%確診為肺癌的數據,那你是否能夠提供5萬、10萬這個這樣的數據?這是非常有難度的。不像體檢,我們可以提供10萬個,甚至100萬個。

我認為,隨著數據量的增加,隨著應用的醫院增加,大家對這件事情有深入的了解,都加入進來,那數據匯總會越來越快,后續的步調也會加快,但現在大家都在觀望,我的數據不給你,就算給,也是1000~2000例,沒什么作用,所以診療環節的智能診斷系統推行很慢,我不能斷定發展到哪一步了,但這件事一定能做成,起碼我是這樣認為的。

AI掘金志:你們是有專門的團隊負責嗎?還是抽時間做科研的性質?

龔向陽:對于我們來說,這個事情是科室發展的一大重點,我們其實是投入了一些資源來做這件事情的。因為我們意識到它可能很重要,比較有價值。所以這不是一個科研項目,我們是本著做一件事的態度,希望他做成。至于論文、課題,這都是以后的事情。

“嵌入臨床門檻不高,關鍵在于用戶體驗”

AI掘金志:應用與體檢的AI篩查檢出,它也需要大規模的臨床試驗,主要需要驗證哪些指標?

龔向陽:應用之前肯定需要臨床驗證,但并不是驗證它是否可行,因為最終是醫生出診斷報告,醫生就可以做出最終判斷。更多需要做的,一方面是提高精確度,在臨床實踐過程中,不斷提高靈敏度、特異性,降低誤報率等。

更重要的是,這套系統需要跟醫生的工作習慣契合起來,操作方便,這樣我們才會用它。

AI掘金志:下一步待解決的重要問題是什么呢?

龔向陽:問題很多。拿體檢來說:去年體檢的時候發現某個患者肺里有2個結節,一年之后再來,需要對比一年后該結節有沒有變化,這時候需要醫生把去年的數據全部找出來,對比一下。但一個影像科醫生每天要處理100~200個病人,如果全部都要對比去年的數據的話,會瘋掉的。所以我們希望智能肺結節篩查系統能標注出以往發現的結節病灶,并與新拍的影像圖像呈現在同一個窗口上,并且量好各自的大小,醫生可以判斷系統量得對不對,比如去年的結節是5mm,今年是7mm,我判斷他確實比去年長得大,那么就可以說系統測量得是準確的,我斷定這個結節有問題,之后會告訴臨床醫生或患者關注這個結節。

整個工作過程是非常機械的,況且非常耗時間,如果AI能幫我們完成,那就太好了。其實我們也可以往深處去做,取代一部分我們現在做得很痛苦的事情。

AI掘金志:您之前也用過CAD軟件,從醫生使用者的角度出發,您認為兩者的區別是什么?

龔向陽:15年前我用過CAD,但用了兩次就不用了。因為CAD是裝在一個工作站上的,掃描完之后需要在工作站上運行,可能會標準20個左右的可疑結節,供醫生篩選。

這其中有幾個問題:一是軟件運行速度太慢了,體檢量是大的,我一天要處理200個病例,需要快速響應;第二,系統是割裂的;第三,系統不會進步。所以我們沒有再用CAD了,因為用過之后發現這個東西完全不靠譜。

但人工智能是不一樣的,它會越來越聰明,我們起了一個很好的名字叫“遛狗”,意思是醫學界的AlphaGo,需要每天溜一下,在這個過程中,它學習,然后變得越來越聰明,這個很重要,一開始不聰明沒關系,經過3個月、6個月之后,它變得越來越聰明,能看到希望;其次,沒有任何間隔時間,打開就能看到分析結果了,相應速度很快的;第三,這套系統與我們的工作流是契合的,掃描之后,能自動檢測、生成報告,我能把其中的內容修訂后復制到我的報告中,所以能幫醫生節約大量的時間,而不是浪費時間,這是兩者之間的區別。

AI掘金志:既然系統嵌入臨床流程中很重要,那么之前CAD沒有嵌入的原因是什么?為什么AI系統就能做到?

龔向陽:嵌入臨床流程門檻不高,也不需要太多支持,關鍵在于用戶體驗好不好。要讓醫生喜歡用,肯定要體驗好嘛,產品功能與用戶體驗同時兼顧。之前的CAD都是大公司開發的,大公司的最終目的是賣產品,所以系統使用與臨床工作流程不契合,只有我們去習慣它,我們不喜歡就不用了。

“AI醫療需要有一定的容錯心態”

AI掘金志:一篇文章談了FDA對于機器學習在醫療領域應用風險考量,他們認為醫生可能過于依賴AI系統,而放松警惕。

龔向陽:你說的問題我們也有考慮,醫生可能粗心大意,有個AI助手幫忙之后,把事情全扔給他,自己喝咖啡去了。我想這種情況會有,但其中有幾個問題:

第一,醫生足夠信任AI的時候,說明它已經比較能干、聰明,也很少犯錯了,這是前提;第二,確實需要一些行業依據、法律法規來監管;第三,其實需要有一定的容錯心態。就像Tesla的Modle3,撞了之后,不能說自動駕駛技術不行,不能因為個體事件否認技術的發展,而是要具體情況具體分析,致力消除這類風險。

總體來說,人體疾病千變萬化,很難說每種疾病都有足夠的數據訓練AI系統,所以最終離不開醫生是絕對的。

您可以復制這個鏈接分享給其他人:http://www.xka888.com/node/300