日韩中文字幕一区|亚洲成色最大综合在线|91亚洲国产系列精品|91福利国产在线观看网站|国产精品三级久久久久久久|亚洲一区二区三区在线国产|欧美性视频一区二区三区四区|国产一区二区三区精品99久久

云服務

熱門搜索: 防爆監(jiān)控 電動機 防爆暖通 防爆風機

首頁 行業(yè)資訊 政策解讀 電商會議 人物觀點 電商數(shù)據(jù) 電商干貨 電商報 博文資訊 客戶庫 企業(yè)庫
首頁>新聞詳情

當人工智能遇上醫(yī)生會發(fā)生什么

2017年4月5日 來源:科工網(wǎng)-國際互聯(lián)網(wǎng)+生態(tài)服務平臺 瀏覽 764 次 評論 0 次

2016年11月的一個晚上,美國紐約布朗克斯區(qū)(Bronx)的一名54歲女子因為嚴重頭痛被送至哥倫比亞大學(Columbia University)醫(yī)療中心的急診室。她對急診室醫(yī)生說自己視力變得模糊,左手感到麻木無力。醫(yī)生安排了CT檢查。


過了幾個月后,1月的某個上午,4名放射科醫(yī)師擠在醫(yī)院三樓一間房子的電腦前,房間黑暗無窗,只有屏幕的光,看起來好像被海水過濾。哥倫比亞大學神經(jīng)放射科主任Angela Lignelli-Dipple博士拿著鉛筆和平板電腦站在一群住院醫(yī)師身后。她正在訓練他們讀CT片子。


▲Angela Lignelli-Dipple博士(圖片來源:columbiadoctors)


Lignelli-Dipple博士說:“一旦大腦顯示出死亡和灰色,診斷中風很容易。關鍵是在大多數(shù)神經(jīng)細胞死亡之前診斷出中風?!敝酗L通常是由血管堵塞或出血引起的,神經(jīng)放射學家大約有45分鐘的窗口時間,這樣醫(yī)生才能夠及時進行醫(yī)學干預,溶解血凝塊?!跋胂衲悻F(xiàn)在就在急診室,”Lignelli-Dipple博士繼續(xù)說道,“每一分鐘過去,大腦的某一部分也死去。失去時間就意味著失去大腦?!?


她瞥了一眼墻上的時鐘,秒針滴答響。她問這些醫(yī)生,“問題到底在哪里呢?”


中風通常發(fā)生在單側(cè)。血液進入大腦后分別流向左右兩側(cè),然后再流到血管分支。血凝塊或出血通常只會影響這些分支中的一個,導致大腦單側(cè)的功能缺陷。當神經(jīng)細胞失去供血并死亡時,組織會稍微膨脹。CT影像上,解剖結(jié)構(gòu)的邊界可能變得模糊。終,組織收縮,尾隨著陰影。但是,這種陰影通常會在CT掃描幾個小時甚至幾天之后才會出現(xiàn),這時候早就過了干預窗口期?!霸诖酥?,”Lignelli-Dipple博士告訴我:“CT上只會出現(xiàn)少許暗示?!边@是中風的預兆。


電腦屏幕上顯示著這名布朗克斯區(qū)女子的腦部CT圖像,從頭骨底部到頂部水平掃描,看起來像是一個切開的瓜。住院醫(yī)師們快速過每一張圖片,仿佛快速翻閱一本書,同時說出每一個解剖結(jié)構(gòu):小腦、海馬體、島狀皮層、紋狀體、胼胝體、腦室。突然,一名20多歲的住院醫(yī)師停在一張片子上,用筆尖指著右側(cè)腦部的一塊區(qū)域說:“這里有些東西。邊界看起來模糊?!睂ξ襾碚f,整個圖像看起來都那么不協(xié)調(diào)和模糊——模糊的像素——但他顯然看到一些不尋常的東西。


▲大腦CT圖片,紅圈處為中風區(qū)域(圖片來源:brainpictures)


“模糊?”Lignelli-Dipple博士提高聲音,“你能描述清楚一點嗎?”


這名住院醫(yī)師在努力搜索詞匯。他停頓住,就像進入自己大腦的解剖結(jié)構(gòu)考慮各種可能。后他說“這里不連續(xù)?!比缓舐柫寺柤?,“我不知道,只是看起來很有意思?!?


接著,Lignelli-Dipple博士拿出20小時后的第二次CT掃描結(jié)果,這名住院醫(yī)師指的地方變得混沌和膨脹。幾天后的一系列掃描結(jié)果說明了后面發(fā)生的事,一個明顯的楔形場灰色出現(xiàn)了。實際上,這名婦女到達急診室后不久,神經(jīng)科醫(yī)生就試著用藥物疏通堵塞的動脈,但是她到得太晚了。第一次CT掃描幾個小時過后,她開始失去意識,馬上被送進ICU病房。過了2個月,她還在住院治療,身體的左側(cè)從上臂到腿全部癱瘓。


我和Lignelli-Dipple博士起去了她的辦公室。我就從那里學到了“學習”:醫(yī)生如何學習診斷?機器也能學會診斷嗎?


2


我對診斷的認識是從1997年秋天開始,當時我在波士頓的醫(yī)院進行臨床實習輪轉(zhuǎn)。準備實習時,我讀了一本經(jīng)典的醫(yī)學教科書,上面將診斷行為分為四個階段。首先,醫(yī)生通過患者的病史和身體檢查來收集患者主訴或身體狀況。接下來,整理這些信息以生成潛在原因列表。然后,通過問診和初步檢測幫助消除某些假設,并加強其他假設,這就是所謂的“鑒別診斷”。醫(yī)生權衡疾病的發(fā)病率、患者的病史、風險和暴露情況等因素(就像俗話說的,“當你聽到蹄聲時,應該想到馬而不是斑馬”)。通過把清單項目一個個排除,醫(yī)生優(yōu)化自己的判斷。后,醫(yī)生會采用實驗室檢驗,比如X射線或CT掃描來進一步確認假設并得出診斷結(jié)論。這種逐步判斷的過程在醫(yī)學教科書中傳授了數(shù)十年,診斷從癥狀到病因嚴格的方法學被逐漸印在了幾代醫(yī)學生身上。



但是,我很快意識到真正的診斷藝術并沒那么簡單。我的醫(yī)學院主任是一個優(yōu)雅的新英格蘭人,常穿一雙光亮的鞋,口音僵硬。他深以自己為診斷專家而自豪。他會要求病人展示出一種癥狀,比如咳嗽,然后靠到椅子里,說出一串形容詞。他可能會說“刺耳尖銳的”,或者說“沉悶的”,仿佛在描述一瓶波爾多葡萄酒。對我來說,所有的咳嗽都聽起來完全一樣,但是我會跟著一起說“是的,刺耳”,就像一個憂慮的葡萄酒品酒師。


對咳嗽的分類會立即縮小診斷的可能性。他可能會說,“聽起來好像是一種肺炎”,或者說是“充血性心力衰竭的濕疹”。接著,他會問一大堆問題。病人近體重是否增加?有沒有接觸石棉?他會要求病人再次咳嗽,俯身用聽診器仔細聆聽。根據(jù)回答,他可能會判斷另外的可能性。然后,他會像路邊魔術師那樣突然宣布診斷結(jié)果“心力衰竭!”——并開出檢驗單來驗證。結(jié)果通常都沒錯。


幾年前,巴西的研究人員研究了放射科專家的大腦,以了解他們?nèi)绾巫龀鲈\斷。這些經(jīng)驗豐富的診斷醫(yī)師到底是用精神的“規(guī)則手冊”,還是“模式識別或非分析推理”對圖像進行識別?


參加實驗的25名放射科醫(yī)生被要求觀看肺部X射線片子,MRI用來跟蹤他們大腦的活動。X射線圖像在他們之前閃過。一組圖像包含常見的單一病理損傷,可能是肺部的棕櫚狀陰影,或者積聚在肺內(nèi)襯層后面的沉悶,不透明的流體壁。第二組圖像是動物線條圖; 第三組是字母輪廓。三種類型的圖像隨機展示,放射科醫(yī)生需要盡快說出病灶,動物或字母的名稱,而MRI機器追蹤他們大腦的活動。放射科醫(yī)生平均需要1.33秒才能做出診斷。在所有三種情況下,大腦相同的區(qū)域亮起:左耳附近的神經(jīng)元寬三角洲,還有顱骨后基上方的蛾形帶。


研究人員后總結(jié):當醫(yī)生識別出某種特征或以前已知的病變時,大腦過程與識別日常生活的事物相似。識別病變類似于識別動物的過程。當你認識犀牛時,你不會考慮其他動物。你也不會認為是獨角獸,穿山甲和小象組成的動物。你是從整體認知犀牛的——作為一種模式。放射科醫(yī)生也是如此。他們沒有經(jīng)過沉思,回憶,區(qū)分,而是看到一個普通的東西。我的老師也一樣,那些濕漉漉的聲音也像一個熟悉的叮當聲一樣被認出。


3


1945年,英國哲學家Gilbert Ryle先生做了一場很有影響力的報告,關于兩種知識類型。一個孩子知道自行車有兩個輪子,它的輪胎充滿了空氣,踩著腳踏板轉(zhuǎn)圈車子會向前走。Ryle先生將這種知識稱為事實的、命題的類別—— 即“知道是什么”。但是學習騎自行車涉及另一個學習領域。一個孩子通過摔跤,在兩輪上平衡,走坑洼路而學會騎車。Ryle先生將這種知識成為隱含的,體驗式的,基于技能的——即“知道怎么做”。


▲英國哲學家Gilbert Ryle先生(圖片來源:philosophybasics)


這兩種知識似乎是相互依賴的:你可以使用事實知識來深化你的體驗知識,反之亦然。但是,Ryle先生也提出,不能從“知道是什么”簡單推導出“知道怎么做”,正如一本教導手冊無法教會孩子騎自行車。他說,只有當我們知道怎么運用規(guī)則時,規(guī)則才有意義:“規(guī)則就像鳥兒一樣,在做成標本之前必須活著?!币惶煜挛?,我看著7歲的女兒騎著自行車越過一座小坡。她第一次在斜坡陡峭的地方摔了下來。第二次,我看到她稍微向前傾斜,然后更加傾斜,她不斷根據(jù)斜坡的減緩調(diào)整身體重量在座位上的分布。但是我并沒有教過她騎車上坡的規(guī)則。我認為她也不會教她的女兒騎車上坡的規(guī)則。我們教給大腦一些常識,讓它自己去解決剩下的問題。


在參加Lignelli-Dipple博士給放射科學員的培訓之后,我和Steffen Haider先生談過,他就是那個在CT片子上發(fā)現(xiàn)早期卒中的年輕人。他是怎么發(fā)現(xiàn)病變的?是“知道是那樣”還是“知道怎么做”?他開始告訴我有關學習的規(guī)則——中風往往是單邊的,它們導致組織微妙的“變灰”, 組織常表現(xiàn)出微腫,造成解剖邊界的模糊。他說:“大腦中有供血特別脆弱的地方。為了識別病變,他必須在單側(cè)腦室搜索跟另一側(cè)不一樣的地方。


我提醒他,有很多不對稱的影像他都忽略了。事實上大多數(shù)CT片子上都會有很多只出現(xiàn)在單側(cè)腦室的陰影,他是怎么把注意力縮小到那個正確的部位?他停下來想了很久回答,“我不知道,有些潛意識的感覺?!?


他的老師Lignelli-Dipple博士告訴我,“這就是放射科醫(yī)生的成長和學習”。問題是,機器能否以同樣的方式“成長和學習”?


4


2015年1月,計算機科學家Sebastian Thrun博士對醫(yī)學診斷的難題感興趣。Thrun博士在德國長大,精瘦的,剃著光頭,有一種喜感,看起來像Michel Foucault(法國哲學家)先生和憨豆先生的組合。他曾是斯坦福大學(Stanford University)教授,研究方向是人工智能;隨后去了Google公司,在那里發(fā)起了Google X項目,從事自學機器人和無人駕駛汽車的研究工作。后來,他的興趣又轉(zhuǎn)向醫(yī)學中的機器學習。其母49歲死于乳腺癌?,F(xiàn)在Thrun博士也正好49歲。他談到“大多數(shù)癌癥患者是沒有癥狀的,我媽媽就是這樣。當她去看醫(yī)生時,癌癥已經(jīng)轉(zhuǎn)移了。所以,我很想在還可以進行手術的早期階段發(fā)現(xiàn)癌癥。我一直在想,機器學習算法能做到嗎?”


▲計算機科學家Sebastian Thrun博士(圖片來源:斯坦福大學官網(wǎng))


自動化診斷的早期研究是讓機器學習教科書的顯性知識。在過去20年中,電腦解讀是自動化診斷的一大特點,解決方案往往比較簡單。比如記錄心電圖,這是一種在紙或屏幕上顯示心臟活動的線條。心電圖的特征波形與各種疾病相關——心房顫動或血管阻塞。將識別波形的規(guī)則輸入到應用中,當機器識別波形時,就給這部分心跳標記,例如“心房顫動”。


在乳腺X線照相術中,“計算機輔助檢測”也很常見。模式識別軟件突出顯示可疑部位,放射科醫(yī)師審查結(jié)果。但是,識別軟件依然是典型地使用基于規(guī)則的系統(tǒng)來識別可疑病變。這樣的程序沒有內(nèi)置的學習機制,一臺已經(jīng)看過3000張X光片的機器并不比僅僅看過4張的更聰明。2007年的一項研究比較了采用計算機輔助診斷前后乳房X線照相術的準確性。人們可能覺得在加入計算機之后,診斷的準確性會顯著增加。事實是,雖然計算機輔助組的活檢比例迅速上升,但是腫瘤學家希望發(fā)現(xiàn)的小的浸潤性乳腺癌比例,反而減少了。后來還發(fā)現(xiàn)假陽性的問題。


Thrun博士相信他可以超越這些第一代診斷設備,將它們從基于規(guī)則的算法轉(zhuǎn)變?yōu)榛趯W習的算法來——從“知道怎么做”而不是“知道是什么”來做出診斷結(jié)論。跟Thrun博士類似的學習算法越來越多地采用了“神經(jīng)網(wǎng)絡”的計算策略,因為它們的設計靈感來自于大腦功能模型。在大腦中,神經(jīng)突觸通過反復激活得到加強或減弱,這些算法也希望采用數(shù)學手段實現(xiàn)類似的認知方式,不斷調(diào)整判斷依據(jù)的“權重”,使輸出結(jié)果逐漸走向準確。另一種更強大學習算法則類似大腦神經(jīng)元層,每層處理輸入數(shù)據(jù)并將結(jié)果發(fā)送到下一層。因此,也被稱為“深度學習”。


可以教會機器通過掃描照片區(qū)分皮膚癌與良性皮膚疾病——痤瘡,皮疹或痣嗎?Thrun博士推理,“如果皮膚科醫(yī)生可以做到這一點,那么機器也應該能夠做到。也許機器還可以做得更好。”Thrun博士從皮膚癌開始進行研究。他選了角化細胞惡性腫瘤(美國常見的一類癌癥)和黑色素瘤(惡性程度的皮膚癌)。


傳統(tǒng)上,皮膚病學教學黑色素瘤從認識基本規(guī)則開始,就像醫(yī)學生學習的口訣:ABCD。黑色素瘤通常是不對稱的(“A”,asymmetrical ),邊界(“B”,borders )不均勻,顏色(“C”,color)是斑塊狀或雜色的,并且直徑(“D”,diameter )通常大于6毫米。但是,當Thrun博士在醫(yī)學教科書和網(wǎng)絡上查看黑素瘤標本時,發(fā)現(xiàn)了不符合以上規(guī)則的病例。


當時在斯坦福大學任兼職教授的Thrun博士招募了2名學生Andre Esteva先生和Brett Kuprel先生來開展工作。他們的第一個任務是編一個所謂的“教材包”——收集大量的圖片用于教導機器識別惡性腫瘤。學生在網(wǎng)上搜了18個皮膚病例圖像分類庫,含有13萬張圖片,包括各種皮膚狀況,涉及2000種疾病,包括痤瘡,皮疹,昆蟲叮咬,過敏反應和癌癥等。值得注意的是,有一組2000個病變已經(jīng)過病理學活檢確診。


接下來Esteva先生和Kuprel先生開始培訓系統(tǒng)。他們沒有用規(guī)則編程,沒有教ABCD原則。相反,他們只是將這些圖像資料及診斷分類標準提供給神經(jīng)網(wǎng)絡。我請Thrun描述一下這樣一個網(wǎng)絡。



他說:“想象一下老式的程序怎么識別狗。軟件工程師會寫1000行if-then-else的邏輯代碼:如果有耳朵,豬嘴,并有頭發(fā),則不是老鼠……等等無限的判斷語句。但是,這顯然不是小孩認識狗的方式。起初,小孩通過看見狗,被教導這是狗而認識狗;她會認錯,然后糾正自己。比如她會把狼認成狗,然后被大人糾正這兩種動物不是同一類。她一次次調(diào)整自我認知:這是“狗”,那是“狼”。


機器學習也是這樣。它會從已分類的訓練中提取信息。這張圖是狗,那張圖不是狗。它會從不同類別中歸納出特征。通過觀察成百上千張歸類的圖片,它終形成自己認狗的方法,這和小孩認狗的方法一樣。他們只是知道怎么做。


2015年6月,Thrun博士的團隊通過“驗證包”來測試機器從教材圖像的學習成果。采用由皮膚科醫(yī)生給出診斷(不一定是活檢)結(jié)果的大約14,000張圖像,測試機器能否將圖像正確歸到以下三類——良性病變,惡性病變和非腫瘤學增生。系統(tǒng)得到了72%的正確率(算法實際輸出的判斷不是“是”或“否”,而是某種病變的概率)。2名經(jīng)過斯坦福大學董事會認證的皮膚科醫(yī)生同時參加測試,他們只得到66%的正確率。


接著,Thrun博士、Esteva先生和Kuprel先生又將研究范圍擴大到25名皮膚科醫(yī)師,這次他們使用了金標準“測試包”,經(jīng)過活檢驗證的約2000張圖片。在幾乎每一次測試中,機器的敏感性(不會錯過陽性樣本)和特異性(不會誤認陰性樣本)都更高。該團隊在自然雜志發(fā)表的一篇論文中得出這樣的結(jié)論:“在每次測試中,算法均優(yōu)于專業(yè)的皮膚科醫(yī)師?!?


在這篇文章中沒有被完全強調(diào)的一點是,在研究的第一次迭代中,Thrun博士的團隊使用了一個嶄新的神經(jīng)網(wǎng)絡。但是他們發(fā)現(xiàn),如果一開始使用的是已經(jīng)受訓并能識別一些不相關的特征(比如狗與貓)的神經(jīng)網(wǎng)絡,它會學得更快并且更好。也許我們的大腦也有類似功能。那些讓人心煩的高中習題——多項式因子分解,動詞的共軛形式,記憶元素周期表,可能是相反類型的知識。我們的意識非常敏感。


Thrun博士希望人們有一天可以簡單用智能手機提交令人擔憂的病變照片,這意味著系統(tǒng)需要能夠識別各種角度和光線。但是,在教機器時,需要對圖像進行仔細處理。他提到“在一些圖片中,黑色素瘤已被標記為黃色。我們不得不把這些圖片剔除,否則機器就會學到黃色是癌癥的一種特征?!?


這是一個古老的難題:一個世紀前,德國公眾被聰明的漢斯(一匹可以做加減法的馬)吸引——它可以通過踏蹄來表達出答案。事實證明,聰明的漢斯實際上是感覺到它的訓練者的表情。隨著馬的蹄頭接近正確答案,訓練者的表情和姿勢就會放松。動物的神經(jīng)網(wǎng)絡沒有學過算術,但它學會識別人身體語言的變化。Thrun博士說,“這就是神經(jīng)網(wǎng)絡奇特的地方,你不知道它們會接受什么。它們就像黑匣子,里面的工作是神秘的?!?


“黑匣子”問題在深度學習中很流行。Thrun博士研發(fā)的算法系統(tǒng)不是由明確的醫(yī)學知識庫和診斷規(guī)則列表引導的,它通過進行大量的內(nèi)部調(diào)整,有效地自學如何區(qū)分痣與黑素瘤,類似于加強和削弱大腦中的神經(jīng)突觸連接。究竟它是如何確定病變是黑色素瘤的?我們不知道,它也不能告訴我們。神經(jīng)網(wǎng)絡學習時的內(nèi)部修正和處理過程均不受我們控制。正如我們自己的大腦一樣。當你在自行車上慢慢轉(zhuǎn)彎時,你會傾斜向相反的方向。我的女兒知道要這么做,但她沒意識到她在這么做。黑素瘤學習機肯定從圖像中提取了某些特征,但它沒法告訴我們是哪個特征,這重要嗎?這就像知識上帝在微笑。機器學習要做到這一點,可以從動物如何讀懂人的思維得到啟示:這也就是“只可意會不可言傳”。


關于未來,Thrun博士構(gòu)想了一個人類不斷被診斷監(jiān)視的世界。我們的手機將分析移動的語音模式來診斷阿茲海默??;方向盤會通過微小的猶豫和震顫來識別初期的帕金森??;浴缸在你洗澡時通過無害的超聲波或磁共振對身體掃描,以確定卵巢中是否有異常。大數(shù)據(jù)將觀察、記錄和評估你:我們穿梭于一個又一個算法中。進入Thrun博士的浴缸和方向盤的世界就像進入一個布滿皮膚科診療鏡的大廳,每個鏡子都督促我們做更多測試。


真的很難不被這個愿景吸引。一個不間斷地掃描我們(甚至細胞層面)的醫(yī)學程序,通過比較每一天圖像的變化,能夠發(fā)現(xiàn)早期的癌癥嗎?它能否為癌癥檢測提供突破?這場景聽起來令人印象深刻,但有一點要知道的是:許多癌癥始終是自限性的(不會發(fā)展成惡性腫瘤),我們可能帶癌死亡,不是因癌死亡。這種隨時隨地的診斷機器會不會導致數(shù)百萬次不必要的活檢?在醫(yī)學上,有些病例早期診斷出來可以挽救或延長生命。還有一些情況,你只會擔心更長,但不會活得更長。要了解到什么程度,這是個難題。


當我問他這種系統(tǒng)對診斷學家的影響。Thrun博士回答道,“我對放大人類能力感興趣。你說現(xiàn)代農(nóng)業(yè)是否消除了一些原始的耕種方式?絕對是的,但它同時也擴大了我們生產(chǎn)農(nóng)產(chǎn)品的能力。并不是說現(xiàn)代農(nóng)業(yè)的一切都是好的,但它確實使我們能夠養(yǎng)活更多的人。工業(yè)革命放大了人類的體力。手機放大了人類的言語能力。過去你不能從紐約對著加州的人喊話——我們倆確實通過這個距離對話——而你手中的這個長方形的設備可以讓人的聲音傳播三千里。手機取代了人聲嗎?不,手機是一個增強裝置。認知革命將使計算機以同樣的方式放大人類的思維能力。正如機器使人類肌肉的強度提高了一千倍,機器也將使人類的腦力變得更強大。”Thrun博士堅持認為,這些深入學習儀器將不會取代皮膚科醫(yī)生和放射科醫(yī)生。它們會提供專業(yè)知識和幫助,使專業(yè)人員的能力增強。


5


多倫多大學(University of Toronto)計算機科學家Geoffrey Hinton博士談到學習機在臨床醫(yī)學中所起的作用就沒那么客氣了。他的曾曾祖父George Boole先生發(fā)明的Boole代數(shù)是數(shù)字計算的基石,因此也被譽為深度學習之父。Hinton博士從1970年代末就開始研究深度學習,他的許多學生今天已經(jīng)成為這個領域的專家。


▲計算機科學家Geoffrey Hinton博士(圖片來源:多倫多大學官網(wǎng))


Hinton博士告訴我,“我認為放射科醫(yī)生就像卡通漫畫里的歪心狼一樣(Wile E. Coyote),已經(jīng)在懸崖的邊緣,卻沒看到下面已經(jīng)沒有路了?!比榉亢托呐K影像方面已經(jīng)有深度學習產(chǎn)品面世。Hinton博士曾在一家醫(yī)院直言不諱地說,“5到10年內(nèi)深度學習超越放射醫(yī)師是顯而易見的?,F(xiàn)在就不應該繼續(xù)培養(yǎng)放射科醫(yī)生?!?


當我問放射科醫(yī)生Angela Lignelli-Dipple博士這個挑戰(zhàn)性的問題,她指出,診斷放射科醫(yī)生的作用不僅僅是某種疾病類別判斷是或否。他們不只是找到引起中風的栓塞部位,還會注意到其他部位的少量出血,這種情況用凝血藥會帶來災難性的后果;此外還可能意外地發(fā)現(xiàn)尚無癥狀的腫瘤。


▲Geoffrey Hinton博士認為,“歪心狼”的處境也許和目前的放射科醫(yī)生有些相似(圖片來源:The Fiscal Times)


Hinton博士現(xiàn)在有挑釁的資格,他對自動化醫(yī)學未來的預測是基于簡單的原則:“深度學習可以解決海量數(shù)據(jù)的分類問題。未來會有數(shù)千種深度學習的應用程序?!彼胍褜W習算法應用到讀各種X射線,CT和MRI的影像圖片,這也是短期的應用價值。談到未來,他表示“學習算法會用于病理診斷?!彼鼈兛赡軙喿x巴氏涂片,聽心臟聲音或預測精神病人的復發(fā)。Hinton博士說:“將來,放射科醫(yī)生的角色將從完成感知事情(一只經(jīng)過良好訓練的鴿子也能做到),演變到完成更多的認知事情?!?


我們還討論了黑箱問題。雖然計算機科學家正在努力,但是Hinton博士承認打開黑匣子的挑戰(zhàn),試圖了解這些強大的學習系統(tǒng)掌握的知識以和思考的方式極其重要。不過,他認為黑匣子是我們可以接受的一個問題。他說:“想象一下,讓棒球運動員和物理學家比一比判斷落球位置。棒球運動員可能不知道任何方程式,但他投擲了上百萬次,所以會清楚地知道球會升多高,速度多快,以及會落到地面的什么位置。物理學家則可以通過解方程來計算相同的東西。但是,終到達的點是完全相同的?!?


我提到上一代計算機輔助檢測和診斷在乳腺X照相術上的表現(xiàn)不佳。Hinton博士承認任何新技術都需要通過嚴格的臨床試驗進行評估。但他強調(diào),新的智能系統(tǒng)設計為從錯誤中學習——隨著時間的推移而改進?!拔覀儍?nèi)建一個系統(tǒng)記錄每次誤診——比如一個終得肺癌的病人記錄,再把數(shù)據(jù)重新輸入機器。我們可以問機器,你在這里弄錯了什么?你可以優(yōu)化診斷嗎?如果醫(yī)生診斷錯誤,這名患者5年后癌癥發(fā)病,現(xiàn)行的醫(yī)療體系中很難有常規(guī)方式告訴醫(yī)生如何更正。但是我們可以建一個系統(tǒng)來教計算機來精準地實現(xiàn)這一點?!?


有些雄心勃勃的機器學習算法想要整合自然語言處理(讀患者醫(yī)療記錄)、百科全書知識、期刊文獻和醫(yī)學數(shù)據(jù)庫。麻省劍橋的IBM沃森系統(tǒng)(Watson Health)和倫敦的DeepMind公司都希望創(chuàng)建這樣一個全面的系統(tǒng)。我在試運行場合看過一些這樣系統(tǒng)演示,發(fā)現(xiàn)其中許多功能,特別是深入學習的組件,仍在開發(fā)中。


Hinton博士對深度學習在診斷中的未來十分著迷,部分源自他的自身經(jīng)歷。就在開發(fā)這種算法時,他的妻子被診斷出晚期胰腺癌。他的兒子曾被診斷患有惡性黑素瘤,但后活檢確診為基底細胞癌,一種惡性程度較低的癌癥。Hinton嘆息道,“還有很多東西要學習。早期、準確的診斷不是一個微不足道的問題。我們可以做得更好。為什么不讓機器幫助我們?”


6


3月一個寒冷的早上,就在和Thrun博士和Hinton博士見面幾天之后,我去了位于曼哈頓第五十一街的哥倫比亞大學皮膚科診所。主治醫(yī)師Lindsey Bordone博士那天安排要看49名患者。10點鐘,候診室里坐滿了人。一個大約60歲的絡腮胡老人坐在角落里,用毛巾圍住了脖子上的皮疹。一對焦急的夫婦擠著看《時代周刊》。


▲主治醫(yī)師Lindsey Bordone博士(圖片來源:columbiadoctors)


Bordone博士快速地依次查看一連串病人。在熒光燈房間的后面,有一名護士坐在電腦前,給出了一些總結(jié)性的話——“五十歲,無病史,皮膚上有新的可疑斑點”,Bordone博士聽后沖進檢查室,金發(fā)飛在身后。


一個30多歲的年輕人臉上出現(xiàn)鱗屑的紅疹。Bordone博士把他拉到燈下,用手持式皮膚鏡仔細地檢查皮膚,剝落的皮屑從他鼻子上掉下來。


“你有頭皮屑嗎?”她問。


那個男人很困惑地說 “當然”。


“嗯,這是面部頭皮屑,”Bordone博士告訴他?!扒闆r比較嚴重。但問題是為什么現(xiàn)在出現(xiàn),為什么會惡化。你近使用過一些新的洗頭產(chǎn)品嗎?家里有沒有不尋常的壓力?


“肯定有一些壓力”,他說。他近失去了工作,財務受到影響。


“保持寫日記,”她建議?!拔覀兛梢源_定跟這些生活變化是否有關?!彼龑懥艘粋€甾體霜的處方,并要求他在一個月內(nèi)復查。


隔壁的房間里,一位年輕的律師助理頭皮上有一些瘙癢的疙瘩。當Bordone博士碰他頭皮時,他縮了一下。她說“脂溢性皮炎”,考試結(jié)束。


另一間房間里,一位婦女脫下衣服,換上病號服。她曾患有黑色素瘤,現(xiàn)在積極地做預防復發(fā)的檢查。Bordone博士仔細檢查她的皮膚,一個個斑點地看過去?;?0分鐘,但是她查得全面徹底,用手指摸過痣和皮贅,隨著手指移動不斷說出判斷。有痣和角化病,但沒有黑素瘤或癌變?!翱雌饋矶己芎谩?,醫(yī)生后高興的總結(jié)。女患者松了口氣。


就這樣:Bordone博士走進來,察看病情,給出診斷結(jié)論。她給人的感覺完全不像Hinton博士說的歪心狼,而像是那個有點狂躁的BB鳥(Roadrunner),她看一連串病人,就像設法跟上腳下的跑步機節(jié)奏。當她在后面的房間里寫醫(yī)囑時,我問她怎么看Thrun博士描述的診斷愿景:iPhone圖片通過電子郵件發(fā)送到功能強大的非現(xiàn)場網(wǎng)絡,這個網(wǎng)絡具有毋容置疑但難以理解的專業(yè)知識。像Bordone博士這樣的全職皮膚科醫(yī)生。一生中大概會看20萬個病例。斯坦福機器的算法在3個月內(nèi)就吸收了近13萬個案例。而且,不像新的皮膚科住院醫(yī)生需要從零開始接觸患者,Thrun博士的算法可以一直在吸收、成長和學習。


▲醫(yī)生究竟是游刃有余的BB鳥,還是接近掉落懸崖的歪心狼?(圖片來源:Geek.com)


Bordone博士聽了聳聳肩。她說:“如果這有助于我做出更準確的判斷,我會歡迎。我的一些病人在看到我之前可以把自己的皮膚問題拍照,這樣會增加診所的覆蓋面?!?


這聽起來像是一個醫(yī)生的合理反應,我想起Thrun博士說過的那些令人安心的評論——機器只是把人的能力增強。但是,當機器越學越多,人會不會越學越少?父母長期以來都在擔心:孩子的手機上有拼寫檢查功能,如果孩子不再去學拼寫怎么辦?這種現(xiàn)象被稱為“自動化偏差”(automation bias)。自動駕駛會使人警惕性降低,醫(yī)學自動化也一樣。也許Bordone博士正像是蒸汽鉆即將面世前孤獨的John Henry先生(美國民間故事中,力量勝過了蒸汽鉆,但卻在比拼中由于心臟壓力過大而死去的悲劇英雄)。但是,她看病時全神貫注,認真地用手指檢查每一個皮贅和痣,這些都是不能漏掉的看病細節(jié)。如果她與機器合作,還會繼續(xù)這樣嗎?


我還注意到Bordone博士與患者互動的其他模式。一方面,患者看病后幾乎總是感覺更好。他們被醫(yī)生觸摸和仔細檢查,可以和醫(yī)生進行交流。甚至醫(yī)生說出的“痣”,“角化病”等病變名稱都像是潤膚劑:這是一種深度療愈的過程。那個有黑色素瘤病史前來復查的婦女離開醫(yī)院時看起來精神很好,毫無精神負擔,她的焦慮被解除了。


另一方面,像巴西研究人員可能猜到的,診斷時刻對Bordone博士來說是一種瞬間認知。當她說出“皮炎”或“濕疹”的時候,好像她正在認出犀牛:當她認出這種疾病時,幾乎可以看到她大腦底部的椎體神經(jīng)元在閃光。但訪問并沒有結(jié)束。在幾乎每一個病例中,Bordone博士都花大量時間探索發(fā)病原因。為什么出現(xiàn)癥狀?是壓力嗎?新洗發(fā)水引起?有人改變了游泳池里的氯氣嗎?為什么是現(xiàn)在發(fā)???


我忽然意識到,臨床實踐強大的地方,不是“知道是什么”或者“知道怎么樣”,既不是掌握疾病事實,也不是感知病情如何形成。而是第三個知識領域:知道為什么。



7


解釋可淺可深。手指上出現(xiàn)紅色的水泡,是因為你摸了一塊熱鐵。手指上出現(xiàn)紅色水泡,是因為燙傷激發(fā)了前列腺素和細胞因子的炎癥級聯(lián)反應,一種我們至今仍未完全理解的調(diào)控過程。知道為什么——問為什么,是我們獲得解釋的途徑,解釋越來越多,就會推動醫(yī)學進步。Hinton博士曾提到棒球運動員和物理學家的比喻。無論診斷醫(yī)生是機器還是人類,他們都像是那個熟練但難懂的棒球運動員。醫(yī)學研究人員則像那個物理學家,一個是臨床領域的理論家,一個是棒球場的理論家,兩者同樣渴望知道“為什么”。這樣的職責分工很簡便,但會不會帶來損失?


“深度學習系統(tǒng)不具有任何解釋力”,Hinton博士坦率地說。黑匣子不能調(diào)查原因。事實上,“深度學習系統(tǒng)越強大,越是不透明。隨著更多的特征被提取,診斷變得越來越準確。為什么這些特征會從數(shù)百萬個其他特征中選出來,仍是未解之謎?!彼惴梢越鉀Q問題,但不能建立問題。


然而,我發(fā)現(xiàn)腫瘤學領域的醫(yī)學進步經(jīng)常是由熟練的執(zhí)業(yè)醫(yī)師,同時也是充滿好奇和具有洞察力的研究人員推動的。事實上,在過去的幾十年里,雄心勃勃的醫(yī)生一直努力扮演棒球運動員和物理學家的角色:他們通過癥狀去了解疾病的生理學原因。為什么皮膚病變的不對稱邊界預示著黑素瘤?為什么一些黑素瘤會自發(fā)退化,有時會出現(xiàn)白色皮膚斑塊?事實上,臨床醫(yī)生的觀察終導致了當今臨床上有效的免疫藥物的發(fā)明——皮膚變白原來是免疫反應的結(jié)果,這種反應也可以治療黑素瘤。這一串發(fā)現(xiàn)始于診所。如果越來越多的臨床實踐被降級為越來越不透明的機器學習系統(tǒng),如果隱性和顯性這兩種知識形式之間日常自發(fā)的親密聯(lián)系——知道是什么,知道怎么做,知道為什么——開始退化,我們會不會做得越來越嫻熟,但卻越來越不能重新審視應該做什么,不能在算法的黑匣子之外思考?


我和哥倫比亞皮膚科主任David Bickers博士談過自動化的未來。他說,“我試著去讀懂Thrun博士的文章,我不明白背后的數(shù)學計算,但我知道這樣的算法可能會改變皮膚科的實踐。皮膚科醫(yī)師會不會失去工作?我不這么認為,但我認為必須努力地考慮如何將這些程序融入臨床實踐。我們?nèi)绾螢樗鼈兏犊??機器作出錯誤的預測時該如何界定法律責任?依靠這樣的算法會不會減弱臨床醫(yī)生的操作能力或者形象?醫(yī)學領域終會不會培養(yǎng)出技術人員而不是醫(yī)生?”


說到這,他看了下時間,有病人在等著,他便起身離開了?!拔耶吷荚谧鲈\斷學家和科學家。我知道病人有多依賴我從良性病變中分辨惡性病變的能力。我也知道醫(yī)學知識來自診斷?!彼嵝盐艺f,“診斷”一詞來自希臘語,原意是“區(qū)分”。機器學習算法將來也只是在“區(qū)分”能力上更勝一籌——區(qū)分和辨識出痣與黑素瘤。但是,全方位認知超越了以任務為中心的算法。在醫(yī)學領域,或許終極獎賞還是要靠整體認知。

我來說兩句
人參與 丨 評論0條)
圖標
注冊 登錄    
評論列表
每頁 10 條,共 0 條

品牌商品