北京時間12日零時14分,國際知名醫學科研期刊《自然醫學》(Nature Medicine)在線刊登于文章題為《使用人工智能評估和準確診斷兒科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence)。 

這一研究結果由廣州市婦女兒童醫療中心夏慧敏教授、張康教授(加州大學圣地亞哥分校)、數據中心梁會營博士、醫務部孫新主任以及兒內科門診何麗雅主任團隊與优发app客户端下载醫療倪浩團隊、康睿智能科技等業內頂級研究團隊及廣東省再生醫學重點實驗室,利用人工智能技術診斷兒科疾病實現。

640-20.jpeg

這是全球首次在頂級醫學雜志發表有關自然語言處理(NLP)技術基于中文文本型電子病歷(EMR)做臨床智能診斷的研究成果。其核心是利用兒科疾病的文本病例數據訓練人工智能,以達成智能診斷的目的。 

那么,為什么說這是一次里程碑式的勝利?動脈網記者采訪到了优发app客户端下载醫療CEO倪浩與廣州市婦女兒童醫療中心的梁會營博士,以了解這一項目背后的故事。

如何讓機器像醫生一樣思考?

自然語義處理是人工智能技術中至關重要的一個分支,其目的是幫助人工智能在識別影像的基礎上,通過自動學習病歷文本數據(醫生的知識和語言)中的診斷邏輯,逐步具備一定的病情分析推理能力,并更進一步讀懂、分析復雜的病例,逐漸使人工智能能像醫生一樣“思考”

將人的智慧以機器形式表現出來是該研究的目的,所以人工智能的學習是對醫生日常就診流程的學習。

常規的就診包括望聞問切、視觸叩聽,即醫生看病時需要融合患者的主訴、癥狀、個人史、體格檢查、實驗室檢驗結果、影像學檢查結果,甚至在來醫院前的用藥信息,多方面才能做出綜合的病情判斷。

如果人工智能能把這些信息都給吃進去,然后消化,并吸收。當醫生或患者輸入病癥時,輸出的便是一個診斷結果。

梁會營認為:“要實現人工智能模擬醫生就診,做臨床推理,必須做到以下幾點;第一,它要自動學習文本病歷中的診斷邏輯,醫生是從書本中去學習的,而人工智能是從上百萬份電子病歷中去學習;第二,學習后,人工智能需具備一定的進行病情分析的推理能力;第三,要能夠像人類醫生一樣,讀懂各類兒科文本病歷,并做出準確的智能推薦。簡單而言,當這個算法成熟后,患者察覺病情時,無需百度就可以獲得專業的診斷結果。”

在實踐之中,倪浩認為,這將分為兩個階段:“第一個階段是如何去解構各個領域的責任與數據,所謂的解構就是去挖取數據中的信息點。本篇文章中一個非常重要的基礎就是基于解構后的電子病歷數據,建立一個高質量、結構化的病種庫,并在這個病種庫的基礎之上去做診斷模型。第二個階段是語義理解,即通過訓練讓機器的模型能夠完全去理解人類語言。這個階段相當困難的,整個業界還有很長的路要走,但优发app客户端下载的工作已經實現了語義理解的初級階段。”

十倍于常量的數據集

過去發布在頂級期刊上的相關論文,其使用的數據集的數據量級在十萬左右,而本次實驗中的人工智能理解了近60萬患者,136萬份電子病歷的數據。

這些數據來源的患者均為兒童,平均年齡為2.5歲,其中40%是女孩;數據結構覆蓋了患者主訴、癥狀、個人史、體格檢查、實驗室檢驗結果、影像學檢查結果、用藥信息等多方面的數據。所患疾病包括消化科、呼吸科等55種疾病,覆蓋了超過75%的常見兒童疾病疾病。對于腦膜炎等危急疾病,實驗同樣也做了一些設計,以提高人工智能的診斷能力。

研究團隊利用优发app客户端下载醫療的NLP技術建立了一套病歷智能分析系統,深度挖掘和分析醫療文本的信息,將非結構化文本形式的病歷數據變成規范話、標準化和結構化的數據,以便AI準確完整地“讀懂”病歷。

為此,醫生、科學家和技術人員通力合作,由30余位高級兒科醫師和10余位信息學研究人員組成的專家團隊手動給電子病歷上的6000多張圖表進行注釋,并持續對模型進行檢驗和迭代。

圖表是研究人員研究疾病的副機碼,作用為找出某一疾病的特征。一個疾病可能有300個特征是有意義的,只要按這個特征填進去的話,人工智能就可以診斷這個疾病。在現實中,醫生書寫的最完善電子病歷的特征數在100左右。

同時,不同疾病的圖表結構不同,有的疾病不含診斷,而有的包含家族史、主訴、實驗室檢查、影像學檢查、超聲檢查等多維信息,研究人員必須對不同情況下的圖表進行區分。

640-21.jpeg

優異的訓練結果

由于豐富數據庫的加持,所訓練出的模型也表現出了優異的結果,以部分疾病為例:神經系統的準確性為0.98,呼吸系統的準確性為0.92,全身性疾病的準確性為0.87,最低的消化系統的準確性為0.85。若細化疾病的分類,上呼吸道的準確率為0.89,而下呼吸道的準確率為0.87。

不同的疾病之間準確率的差異源于數據與特征的差異。某一疾病的特異性的癥狀越多,它就更容易被學習,這是因為這些特異性給了人工智能進行區分的先決條件。同時,學習更多數據的人工智能將在準確度方面做出更好的表現,這一點人與機器同理。

倪浩對此舉了一個很好的例子:“如果某患者患有急性喉炎,但喉炎發病的部位和癥狀與支氣管炎類似,要區別兩種疾病,需找出喉炎的特異性的癥狀。由于醫生可能不會描述相關癥狀,患者病歷中便會缺失,造成結果的誤診。對此,我們作出了這樣的解決方案:假如系統懷疑患者有可能是急性喉炎,而它的置信度不是排名第一,人工智能會追問是否出現了呼吸時伴隨卷鼻音(急性喉炎的另一特征),這是醫生容易缺失的一個操作。盡管現有準確率已達到一定水平,但仍有提升的空間,通過這種方式,我們能逐漸在現有準度的基礎上進一步提升系統準確率。” 

NLP的發展是漫長而充滿意義的過程

談及為什么選擇兒科作為突破口,除了廣州市婦女兒童醫療中心提供的翔實數據,兒科荊棘的現狀也是倪浩團隊選擇這一領域進行實驗的重要原因:“中國兒科醫生非常稀缺,流感季節的三甲醫院總是爆滿。此外,兒科是一們啞科,很多小孩子不具備很強的語言表達能力,他們不能詳細講述自己的病情,這是我們一直堅持在兒科做出巨大投入的原因。”

“我一直在想象這樣的場景,在就診時,當醫生與患者的問答環節結束,關聯電子病歷的語音識別助手就已經寫好了電子病歷,而輔助診斷系統也根據這一病例得出結果,告知患者該去做什么樣的檢查。這樣下來,醫院的效率將大幅提高,醫生的解放也得已實現。”

總的來說,本次研究是一次成功的嘗試,這為NLP技術在其他科室的發展打下了一個很好的開端。在接下來的研究之中,优发app客户端下载醫療將沿著就診鏈路進行產品延伸,包括但不限于治療方案、護理方案、給患者家長健康指導以及互聯網醫院場景。

通過互聯網技術打破地域的限制,通過語音識打破就診方式的限制,通過智能診斷打破醫院效率的限制,优发app客户端下载醫療正通過技術不斷打破傳統醫療模式,讓人工智能技術惠及更多的患者。也許,人們理想中的醫療方式,離我們不再遙遠……

您可以復制這個鏈接分享給其他人:http://www.tiansenoa.com/node/419