AI浪潮席卷全球,醫(yī)聯(lián)借助MedGPT有望垂類賽道彎道超車!
編者按:本文來自微信公眾號 新眸(ID:xinmouls),作者:錢德新,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載
今年2月,哈佛醫(yī)學(xué)院教授Tiffany H. Kung給ChatGPT出了一套美國醫(yī)學(xué)執(zhí)照考試。
得出的結(jié)論是,ChatGPT在三個專家級知識的標(biāo)準(zhǔn)化測試中能夠達(dá)到或接近60%的準(zhǔn)確度,其輔助診斷的表現(xiàn)已經(jīng)接近醫(yī)生。
另一教授Ateev Mehrotr也對ChatGPT進(jìn)行了測試。
結(jié)果顯示,ChatGPT在45個案例中的39個診斷正確,正確率87%(超過了現(xiàn)有機器診斷率的51%),并為30個案例提供了適當(dāng)?shù)姆衷\建議。
而ChatGPT在醫(yī)療領(lǐng)域的應(yīng)用,在GPT-4發(fā)布后再次成為焦點。
據(jù)OpenAI的內(nèi)部評估,GPT-4在產(chǎn)生事實回復(fù)時其性能比GPT-3.5好40%,在參加為人類設(shè)計的考試中表現(xiàn)比之前版本更好(例如醫(yī)學(xué)知識自我評估計劃(75%vs 53%))。以及,多模態(tài)輸入也讓GPT4能夠直接轉(zhuǎn)錄手寫紙質(zhì)處方。
甚至,未來有一天給你開診斷書的可能不是醫(yī)生,而是AI。
01 硅谷巨頭們都在做什么?
谷歌可能是極少數(shù)意識到GPT對醫(yī)療領(lǐng)域重要程度的巨頭之一。
在ChatGPT發(fā)布后僅幾周,谷歌就公布了Med-PaLM,一個在更窄的參數(shù)范圍內(nèi)運行的,專門用于回答醫(yī)療保健相關(guān)問題的大型醫(yī)用語言模型。3個月后,谷歌就馬不停蹄的公布了Med-PaLM 2。
但微軟想要更快。
Med-PaLM 2發(fā)布幾天后,Nuance(被微軟2021年收購)發(fā)布了一款讓醫(yī)生臨床記錄“iPhone化”的殺手級AI應(yīng)用,也是醫(yī)療行業(yè)第一款結(jié)合GPT-4模型的應(yīng)用。
巨頭緊鑼密鼓地在醫(yī)療領(lǐng)域落地GPT,很大程度源自醫(yī)療是一個高度垂直的行業(yè)。
有券商曾在今年2月的一份研報中,詳細(xì)列出了以ChatGPT為代表的AI技術(shù)的四條應(yīng)用推演路線,其中除了獨立工具、深度嵌入生產(chǎn)力工具和與服務(wù)型應(yīng)用結(jié)合,還有一條就是垂直領(lǐng)域。
由于醫(yī)療領(lǐng)域的專業(yè)性和特殊性,其對語言模型的質(zhì)量要求遠(yuǎn)高于市面上任何一種通用語言模型。所以,雖然比爆火的ChatGPT來得晚了一些,但生成式AI在醫(yī)療上有著充分的發(fā)揮空間。
而這場馬拉松比拼的不是誰先起跑,而是怎么跑。
知乎上曾有答主將ChatGPT與醫(yī)療從業(yè)人員的學(xué)習(xí)路徑做了一個比較,如果單從時間跨度來看,一個基于GPT-3.5模型的醫(yī)療大模型,可能在幾天或者幾周內(nèi)即可完成培訓(xùn),而一個??茖<壹幢惆凑兆疃毯臅r計算,也要20年。
這相當(dāng)于論證了GPT應(yīng)用到醫(yī)療領(lǐng)域的廣闊前景。
具體來說,復(fù)旦大學(xué)附屬華山醫(yī)院信息中心主任黃虹就曾表示,醫(yī)療GPT重要的應(yīng)用場景可以是就醫(yī)導(dǎo)診、醫(yī)院內(nèi)部知識庫的構(gòu)建和輔助醫(yī)生提升電子病歷的書寫效率。
醫(yī)聯(lián)創(chuàng)始人、CEO王仕銳先生近日也公開表示,AI醫(yī)生與互聯(lián)網(wǎng)醫(yī)院的結(jié)合,將為醫(yī)療領(lǐng)域帶來前所未有的化學(xué)反應(yīng)。
02 巨頭們忙于訓(xùn)練AI醫(yī)療大模型的目的
券商對于AI技術(shù)落地垂直領(lǐng)域的推演,其中值得關(guān)注的一點在于,垂直領(lǐng)域大模型與通識大模型是不相同的。
在涉及專業(yè)知識的領(lǐng)域,ChatGPT為代表的大語言模型通過與搜索引擎結(jié)合能對專業(yè)信息進(jìn)行匯總、檢索,并附上來源,但模型本身在專業(yè)領(lǐng)域尚無法提供精準(zhǔn)的回答,也無法運用專業(yè)知識解決綜合性的專業(yè)問題。
不過,大模型最重要的一個步驟在于,需要用專業(yè)的數(shù)據(jù)投喂、訓(xùn)練、迭代,才能越來越契合垂直領(lǐng)域。Med-PaLM 2在被訓(xùn)練近3個月后,表現(xiàn)提高了18%就能說明一些問題。
未來隨著更多的專業(yè)Know-how注入,以ChatGPT為代表的AI技術(shù)有望在需要較強專業(yè)知識的垂直領(lǐng)域得到進(jìn)一步的應(yīng)用。
中科院院士、中山醫(yī)院心內(nèi)科主任葛均波就明確表示過,AI臨床應(yīng)用結(jié)合大數(shù)據(jù),將會極大延伸醫(yī)療服務(wù)“上下游”,實現(xiàn)全生命周期管理?!癆I助力將可為患者從預(yù)防、發(fā)病、診斷、治療到院外康復(fù)的疾病管理全流程提供智能解決方案?!?br>
事實上,忙于訓(xùn)練AI醫(yī)療大模型的硅谷巨頭,已經(jīng)在開發(fā)上述其中一個環(huán)節(jié)的落地產(chǎn)品了。
比如在最簡單的臨床記錄生成層面,依靠GPT-4強大的生成式大語言模型和推理能力,DAX Express將這個過程從4個小時縮短到僅僅幾秒鐘。
英偉達(dá)則通過NVIDIA AI Foudations云服務(wù),以幫助需要構(gòu)建、完善和運行自定義大型語言模型及生成式AI的客戶加速生成式AI的引入。這一服務(wù)包括用于自然語言處理的Nemo、圖像處理的Picasso,以及針對制藥業(yè)的BioNeMo。
AMD在收購賽靈思后,后者的FPGA芯片也在規(guī)劃在輔助病情診斷(慢性病篩查和風(fēng)險評估)等場景,通過學(xué)習(xí)過往慢性病患者數(shù)據(jù)可以預(yù)測未來患病風(fēng)險。這類場景使用FPGA也可實現(xiàn)模型訓(xùn)練、推理性能的提升。
當(dāng)然,國內(nèi)也有相關(guān)公司意識到醫(yī)療GPT的價值。4月28日,醫(yī)聯(lián)就對外公布了國內(nèi)首款大語言模型驅(qū)動的AI醫(yī)生——MedGPT,該產(chǎn)品目前已進(jìn)入內(nèi)部測試階段,并計劃于5月份正式發(fā)布。
03 醫(yī)療GPT,要腳踏實地
硅谷巨頭的技術(shù)和產(chǎn)品,雖然按照過往的邏輯可能會很快傳到大洋彼岸,但今天往后也可能不會。
由于眾所周知的原因,AI本身就是一個被限制的技術(shù)。更重要的是,大模型的本質(zhì)是通過概率最大化不斷生成數(shù)據(jù),而不是完全通過邏輯推理對問題進(jìn)行解答的算法模型。
換言之,對一個大模型來說,數(shù)據(jù)和技術(shù)同樣重要。其中數(shù)據(jù)的大小、提煉程度,又決定了大模型的能力。美國的醫(yī)療數(shù)據(jù)不一定適合中國人,地理位置、氣候、飲食習(xí)慣等等諸多的不同,導(dǎo)致問題也會不同。
并且,若是基于邏輯推理對問題進(jìn)行解答的邏輯,目前搜索引擎出現(xiàn)的問題,也仍將存在。今年ChatGPT針對算法錯誤修復(fù)的版本更新,便明確了這一問題的存在。如果直接把這項技術(shù)丟進(jìn)互聯(lián)網(wǎng)醫(yī)院進(jìn)行應(yīng)用,后果可想而知。
所以要考慮GPT技術(shù)在醫(yī)療場景的應(yīng)用,就要跳脫出固有思維。
首先,一定要有專門的數(shù)據(jù)喂養(yǎng)。更多專業(yè)Know-how的注入,以及專家進(jìn)行語料標(biāo)注,不斷清洗數(shù)據(jù),才能提高模型的準(zhǔn)確度。
以醫(yī)聯(lián)的MedGPT為例,醫(yī)聯(lián)作為一家互聯(lián)網(wǎng)醫(yī)院,其本質(zhì)就是醫(yī)患關(guān)系鏈,以及在關(guān)系鏈上發(fā)生的醫(yī)療決策、服務(wù)和商品。這意味著,基于醫(yī)聯(lián)超過150萬的注冊醫(yī)生和2000萬患者深度互動而沉淀出來的專業(yè)數(shù)據(jù),足夠投喂一個醫(yī)療大模型。
同時,醫(yī)聯(lián)專業(yè)的疾病全流程管理能力,針對各個疾病病種研發(fā)的專業(yè)SOP,以及智能化的患者疾病管理功能,也為沉淀數(shù)據(jù),最終訓(xùn)練出這樣的醫(yī)療大模型提供了重要的醫(yī)療底層能力基礎(chǔ)。
其次,只有從業(yè)者才能做得更好,也就是需要最好的技術(shù)+最好的醫(yī)療能力。
醫(yī)聯(lián)自研的MedGPT采用了大模型技術(shù),基于醫(yī)療知識圖譜為模型提供豐富、準(zhǔn)確、結(jié)構(gòu)化的醫(yī)療知識、并收集整理接近20億條真實醫(yī)患溝通對話、檢驗檢測和病例信息進(jìn)行深度訓(xùn)練學(xué)習(xí),同時利用醫(yī)生真實反饋進(jìn)行強化學(xué)習(xí),用以保障模型的推理質(zhì)量、準(zhǔn)確性與可靠性。值得一提的是,醫(yī)聯(lián)MedGPT首次突破了AI醫(yī)生無法與真實患者連續(xù)自由對話的難點,并實現(xiàn)了醫(yī)療問診場景中支持多模態(tài)的輸入和輸出。
據(jù)了解,目前醫(yī)聯(lián)MedGPT擁有近3000種疾病的首診能力,覆蓋80%以上的成年人疾病種類和90%以上的0-12歲兒科疾病。
第三,與傳統(tǒng)的醫(yī)療服務(wù)相比,GPT的優(yōu)勢更明顯。
還是以MedGPT為例,在互聯(lián)網(wǎng)醫(yī)療的土壤中,它實際上具有高效便捷、精準(zhǔn)預(yù)測、個性化服務(wù)和數(shù)據(jù)共享等多種特征。
通過使用醫(yī)聯(lián)MedGPT,患者可以更加快捷、準(zhǔn)確地解決與提供自身問題,這無疑為患者提供了更加個性化、專業(yè)化的診療服務(wù)。
更重要的是,MedGPT基于大量問診數(shù)據(jù)訓(xùn)練,能夠?qū)⒒颊邚木驮\問診到疾病識別再到后續(xù)的治療建議環(huán)節(jié)進(jìn)行智能且科學(xué)的串聯(lián),也就是在疾病的預(yù)防、診斷、治療、康復(fù)四個重要環(huán)節(jié)全面實現(xiàn)智能化。
值得一提的是,基于嚴(yán)肅醫(yī)療理念,為了檢驗MedGPT的科學(xué)性,醫(yī)聯(lián)抽取了平臺532名復(fù)診患者進(jìn)行實驗。結(jié)果顯示,醫(yī)聯(lián)MedGPT的診斷結(jié)果與原有診斷吻合率超過97.5%,充分證明了AI醫(yī)生在醫(yī)療領(lǐng)域的價值和潛力。
04 前景廣闊 值得期待
斯坦福大學(xué)醫(yī)學(xué)院教授Robert Pearl最近的一個觀點比較有代表性,他認(rèn)為AI對醫(yī)生來說將比過去的聽診器更重要,任何醫(yī)生都不該把ChatGPT或其他形式的生成式AI拒之門外。
Pearl認(rèn)為,ChatGPT可以幫助醫(yī)生來撰寫患者的臨床報告、診斷書,甚至在和患者交流遇到困難時向醫(yī)生提供建議。生成式AI語言模型可以挖掘數(shù)字診療檔案中的有用信息,也能為患者提供簡潔明了的專業(yè)解釋。
但實際上AI+醫(yī)療還不止如此。甚至,對于整個互聯(lián)網(wǎng)醫(yī)療模式都將產(chǎn)生積極影響。
譬如醫(yī)聯(lián)平臺上現(xiàn)有的線上復(fù)診隨診、送藥上門、指標(biāo)監(jiān)測、用藥指導(dǎo)、不良反應(yīng)干預(yù)、醫(yī)保支付、健康科普等服務(wù),在引入MedGPT后不僅整個流程會有一個效率上的提升,更能推動上述各個領(lǐng)域的服務(wù)專業(yè)度、服務(wù)質(zhì)量更上一層樓。
事實上,醫(yī)療GPT更大的應(yīng)用場景還是在基層。
一方面因為基層醫(yī)療資源匱乏而導(dǎo)致醫(yī)患供需失衡,如果引入類似MedGPT的醫(yī)療GPT,那么對于基礎(chǔ)疾病的識別判斷,可以幫助患者更有針對性地選擇適宜的治療方式及治療路徑;
另一方面,高效準(zhǔn)確的普篩,可以減少優(yōu)質(zhì)醫(yī)療資源擠兌,提升基層醫(yī)療環(huán)境的疾病診斷能力,為分級診療制度的實施賦能。
據(jù)了解,醫(yī)聯(lián)也將在5月釋放大模型能力,屆時我們將能看到更多AI與互聯(lián)網(wǎng)醫(yī)院的能力結(jié)合以及更多的應(yīng)用空間展示。