醫(yī)療GPT，硅谷又跑在了前面？

金諾網(wǎng) 2023/5/2 10:32:45 308

AI浪潮席卷全球，醫(yī)聯(lián)借助MedGPT有望垂類賽道彎道超車！

編者按：本文來自微信公眾號新眸（ID：xinmouls），作者：錢德新，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載

今年2月，哈佛醫(yī)學(xué)院教授Tiffany H. Kung給ChatGPT出了一套美國醫(yī)學(xué)執(zhí)照考試。

得出的結(jié)論是，ChatGPT在三個專家級知識的標(biāo)準(zhǔn)化測試中能夠達(dá)到或接近60%的準(zhǔn)確度，其輔助診斷的表現(xiàn)已經(jīng)接近醫(yī)生。

另一教授Ateev Mehrotr也對ChatGPT進(jìn)行了測試。

結(jié)果顯示，ChatGPT在45個案例中的39個診斷正確，正確率87%（超過了現(xiàn)有機器診斷率的51%），并為30個案例提供了適當(dāng)?shù)姆衷\建議。

而ChatGPT在醫(yī)療領(lǐng)域的應(yīng)用，在GPT-4發(fā)布后再次成為焦點。

據(jù)OpenAI的內(nèi)部評估，GPT-4在產(chǎn)生事實回復(fù)時其性能比GPT-3.5好40％，在參加為人類設(shè)計的考試中表現(xiàn)比之前版本更好（例如醫(yī)學(xué)知識自我評估計劃（75％vs 53％））。以及，多模態(tài)輸入也讓GPT4能夠直接轉(zhuǎn)錄手寫紙質(zhì)處方。

甚至，未來有一天給你開診斷書的可能不是醫(yī)生，而是AI。

01 硅谷巨頭們都在做什么？
谷歌可能是極少數(shù)意識到GPT對醫(yī)療領(lǐng)域重要程度的巨頭之一。

在ChatGPT發(fā)布后僅幾周，谷歌就公布了Med-PaLM，一個在更窄的參數(shù)范圍內(nèi)運行的，專門用于回答醫(yī)療保健相關(guān)問題的大型醫(yī)用語言模型。3個月后，谷歌就馬不停蹄的公布了Med-PaLM 2。

但微軟想要更快。

Med-PaLM 2發(fā)布幾天后，Nuance（被微軟2021年收購）發(fā)布了一款讓醫(yī)生臨床記錄“iPhone化”的殺手級AI應(yīng)用，也是醫(yī)療行業(yè)第一款結(jié)合GPT-4模型的應(yīng)用。

巨頭緊鑼密鼓地在醫(yī)療領(lǐng)域落地GPT，很大程度源自醫(yī)療是一個高度垂直的行業(yè)。

有券商曾在今年2月的一份研報中，詳細(xì)列出了以ChatGPT為代表的AI技術(shù)的四條應(yīng)用推演路線，其中除了獨立工具、深度嵌入生產(chǎn)力工具和與服務(wù)型應(yīng)用結(jié)合，還有一條就是垂直領(lǐng)域。

由于醫(yī)療領(lǐng)域的專業(yè)性和特殊性，其對語言模型的質(zhì)量要求遠(yuǎn)高于市面上任何一種通用語言模型。所以，雖然比爆火的ChatGPT來得晚了一些，但生成式AI在醫(yī)療上有著充分的發(fā)揮空間。

而這場馬拉松比拼的不是誰先起跑，而是怎么跑。

知乎上曾有答主將ChatGPT與醫(yī)療從業(yè)人員的學(xué)習(xí)路徑做了一個比較，如果單從時間跨度來看，一個基于GPT-3.5模型的醫(yī)療大模型，可能在幾天或者幾周內(nèi)即可完成培訓(xùn)，而一個?？茖＜壹幢惆凑兆疃毯臅r計算，也要20年。

這相當(dāng)于論證了GPT應(yīng)用到醫(yī)療領(lǐng)域的廣闊前景。

具體來說，復(fù)旦大學(xué)附屬華山醫(yī)院信息中心主任黃虹就曾表示，醫(yī)療GPT重要的應(yīng)用場景可以是就醫(yī)導(dǎo)診、醫(yī)院內(nèi)部知識庫的構(gòu)建和輔助醫(yī)生提升電子病歷的書寫效率。

醫(yī)聯(lián)創(chuàng)始人、CEO王仕銳先生近日也公開表示，AI醫(yī)生與互聯(lián)網(wǎng)醫(yī)院的結(jié)合，將為醫(yī)療領(lǐng)域帶來前所未有的化學(xué)反應(yīng)。

02 巨頭們忙于訓(xùn)練AI醫(yī)療大模型的目的
券商對于AI技術(shù)落地垂直領(lǐng)域的推演，其中值得關(guān)注的一點在于，垂直領(lǐng)域大模型與通識大模型是不相同的。

在涉及專業(yè)知識的領(lǐng)域，ChatGPT為代表的大語言模型通過與搜索引擎結(jié)合能對專業(yè)信息進(jìn)行匯總、檢索，并附上來源，但模型本身在專業(yè)領(lǐng)域尚無法提供精準(zhǔn)的回答，也無法運用專業(yè)知識解決綜合性的專業(yè)問題。

不過，大模型最重要的一個步驟在于，需要用專業(yè)的數(shù)據(jù)投喂、訓(xùn)練、迭代，才能越來越契合垂直領(lǐng)域。Med-PaLM 2在被訓(xùn)練近3個月后，表現(xiàn)提高了18%就能說明一些問題。

未來隨著更多的專業(yè)Know-how注入，以ChatGPT為代表的AI技術(shù)有望在需要較強專業(yè)知識的垂直領(lǐng)域得到進(jìn)一步的應(yīng)用。

中科院院士、中山醫(yī)院心內(nèi)科主任葛均波就明確表示過，AI臨床應(yīng)用結(jié)合大數(shù)據(jù)，將會極大延伸醫(yī)療服務(wù)“上下游”，實現(xiàn)全生命周期管理?！癆I助力將可為患者從預(yù)防、發(fā)病、診斷、治療到院外康復(fù)的疾病管理全流程提供智能解決方案?！?br>
事實上，忙于訓(xùn)練AI醫(yī)療大模型的硅谷巨頭，已經(jīng)在開發(fā)上述其中一個環(huán)節(jié)的落地產(chǎn)品了。

比如在最簡單的臨床記錄生成層面，依靠GPT-4強大的生成式大語言模型和推理能力，DAX Express將這個過程從4個小時縮短到僅僅幾秒鐘。

英偉達(dá)則通過NVIDIA AI Foudations云服務(wù)，以幫助需要構(gòu)建、完善和運行自定義大型語言模型及生成式AI的客戶加速生成式AI的引入。這一服務(wù)包括用于自然語言處理的Nemo、圖像處理的Picasso，以及針對制藥業(yè)的BioNeMo。

AMD在收購賽靈思后，后者的FPGA芯片也在規(guī)劃在輔助病情診斷（慢性病篩查和風(fēng)險評估）等場景，通過學(xué)習(xí)過往慢性病患者數(shù)據(jù)可以預(yù)測未來患病風(fēng)險。這類場景使用FPGA也可實現(xiàn)模型訓(xùn)練、推理性能的提升。

當(dāng)然，國內(nèi)也有相關(guān)公司意識到醫(yī)療GPT的價值。4月28日，醫(yī)聯(lián)就對外公布了國內(nèi)首款大語言模型驅(qū)動的AI醫(yī)生——MedGPT，該產(chǎn)品目前已進(jìn)入內(nèi)部測試階段，并計劃于5月份正式發(fā)布。

03 醫(yī)療GPT，要腳踏實地
硅谷巨頭的技術(shù)和產(chǎn)品，雖然按照過往的邏輯可能會很快傳到大洋彼岸，但今天往后也可能不會。

由于眾所周知的原因，AI本身就是一個被限制的技術(shù)。更重要的是，大模型的本質(zhì)是通過概率最大化不斷生成數(shù)據(jù)，而不是完全通過邏輯推理對問題進(jìn)行解答的算法模型。

換言之，對一個大模型來說，數(shù)據(jù)和技術(shù)同樣重要。其中數(shù)據(jù)的大小、提煉程度，又決定了大模型的能力。美國的醫(yī)療數(shù)據(jù)不一定適合中國人，地理位置、氣候、飲食習(xí)慣等等諸多的不同，導(dǎo)致問題也會不同。

并且，若是基于邏輯推理對問題進(jìn)行解答的邏輯，目前搜索引擎出現(xiàn)的問題，也仍將存在。今年ChatGPT針對算法錯誤修復(fù)的版本更新，便明確了這一問題的存在。如果直接把這項技術(shù)丟進(jìn)互聯(lián)網(wǎng)醫(yī)院進(jìn)行應(yīng)用，后果可想而知。

所以要考慮GPT技術(shù)在醫(yī)療場景的應(yīng)用，就要跳脫出固有思維。

首先，一定要有專門的數(shù)據(jù)喂養(yǎng)。更多專業(yè)Know-how的注入，以及專家進(jìn)行語料標(biāo)注，不斷清洗數(shù)據(jù)，才能提高模型的準(zhǔn)確度。

以醫(yī)聯(lián)的MedGPT為例，醫(yī)聯(lián)作為一家互聯(lián)網(wǎng)醫(yī)院，其本質(zhì)就是醫(yī)患關(guān)系鏈，以及在關(guān)系鏈上發(fā)生的醫(yī)療決策、服務(wù)和商品。這意味著，基于醫(yī)聯(lián)超過150萬的注冊醫(yī)生和2000萬患者深度互動而沉淀出來的專業(yè)數(shù)據(jù)，足夠投喂一個醫(yī)療大模型。

同時，醫(yī)聯(lián)專業(yè)的疾病全流程管理能力，針對各個疾病病種研發(fā)的專業(yè)SOP，以及智能化的患者疾病管理功能，也為沉淀數(shù)據(jù)，最終訓(xùn)練出這樣的醫(yī)療大模型提供了重要的醫(yī)療底層能力基礎(chǔ)。

其次，只有從業(yè)者才能做得更好，也就是需要最好的技術(shù)+最好的醫(yī)療能力。

醫(yī)聯(lián)自研的MedGPT采用了大模型技術(shù)，基于醫(yī)療知識圖譜為模型提供豐富、準(zhǔn)確、結(jié)構(gòu)化的醫(yī)療知識、并收集整理接近20億條真實醫(yī)患溝通對話、檢驗檢測和病例信息進(jìn)行深度訓(xùn)練學(xué)習(xí)，同時利用醫(yī)生真實反饋進(jìn)行強化學(xué)習(xí)，用以保障模型的推理質(zhì)量、準(zhǔn)確性與可靠性。值得一提的是，醫(yī)聯(lián)MedGPT首次突破了AI醫(yī)生無法與真實患者連續(xù)自由對話的難點，并實現(xiàn)了醫(yī)療問診場景中支持多模態(tài)的輸入和輸出。

據(jù)了解，目前醫(yī)聯(lián)MedGPT擁有近3000種疾病的首診能力，覆蓋80%以上的成年人疾病種類和90%以上的0-12歲兒科疾病。

第三，與傳統(tǒng)的醫(yī)療服務(wù)相比，GPT的優(yōu)勢更明顯。

還是以MedGPT為例，在互聯(lián)網(wǎng)醫(yī)療的土壤中，它實際上具有高效便捷、精準(zhǔn)預(yù)測、個性化服務(wù)和數(shù)據(jù)共享等多種特征。

通過使用醫(yī)聯(lián)MedGPT，患者可以更加快捷、準(zhǔn)確地解決與提供自身問題，這無疑為患者提供了更加個性化、專業(yè)化的診療服務(wù)。

更重要的是，MedGPT基于大量問診數(shù)據(jù)訓(xùn)練，能夠?qū)⒒颊邚木驮\問診到疾病識別再到后續(xù)的治療建議環(huán)節(jié)進(jìn)行智能且科學(xué)的串聯(lián)，也就是在疾病的預(yù)防、診斷、治療、康復(fù)四個重要環(huán)節(jié)全面實現(xiàn)智能化。

值得一提的是，基于嚴(yán)肅醫(yī)療理念，為了檢驗MedGPT的科學(xué)性，醫(yī)聯(lián)抽取了平臺532名復(fù)診患者進(jìn)行實驗。結(jié)果顯示，醫(yī)聯(lián)MedGPT的診斷結(jié)果與原有診斷吻合率超過97.5%，充分證明了AI醫(yī)生在醫(yī)療領(lǐng)域的價值和潛力。

04 前景廣闊值得期待
斯坦福大學(xué)醫(yī)學(xué)院教授Robert Pearl最近的一個觀點比較有代表性，他認(rèn)為AI對醫(yī)生來說將比過去的聽診器更重要，任何醫(yī)生都不該把ChatGPT或其他形式的生成式AI拒之門外。

Pearl認(rèn)為，ChatGPT可以幫助醫(yī)生來撰寫患者的臨床報告、診斷書，甚至在和患者交流遇到困難時向醫(yī)生提供建議。生成式AI語言模型可以挖掘數(shù)字診療檔案中的有用信息，也能為患者提供簡潔明了的專業(yè)解釋。

但實際上AI+醫(yī)療還不止如此。甚至，對于整個互聯(lián)網(wǎng)醫(yī)療模式都將產(chǎn)生積極影響。

譬如醫(yī)聯(lián)平臺上現(xiàn)有的線上復(fù)診隨診、送藥上門、指標(biāo)監(jiān)測、用藥指導(dǎo)、不良反應(yīng)干預(yù)、醫(yī)保支付、健康科普等服務(wù)，在引入MedGPT后不僅整個流程會有一個效率上的提升，更能推動上述各個領(lǐng)域的服務(wù)專業(yè)度、服務(wù)質(zhì)量更上一層樓。

事實上，醫(yī)療GPT更大的應(yīng)用場景還是在基層。

一方面因為基層醫(yī)療資源匱乏而導(dǎo)致醫(yī)患供需失衡，如果引入類似MedGPT的醫(yī)療GPT，那么對于基礎(chǔ)疾病的識別判斷，可以幫助患者更有針對性地選擇適宜的治療方式及治療路徑；

另一方面，高效準(zhǔn)確的普篩，可以減少優(yōu)質(zhì)醫(yī)療資源擠兌，提升基層醫(yī)療環(huán)境的疾病診斷能力，為分級診療制度的實施賦能。

據(jù)了解，醫(yī)聯(lián)也將在5月釋放大模型能力，屆時我們將能看到更多AI與互聯(lián)網(wǎng)醫(yī)院的能力結(jié)合以及更多的應(yīng)用空間展示。