近日,京東健康旗下“京醫(yī)千詢”醫(yī)療大模型宣布開源,成為國內(nèi)醫(yī)療行業(yè)首個(gè)全面開源的垂類大模型。
當(dāng)前,大語言模型在諸多應(yīng)用中展現(xiàn)出巨大潛力,但在醫(yī)療決策支持方面,仍面臨缺乏專家級(jí)認(rèn)知等問題。如何讓人工智能(AI)習(xí)得更專業(yè)的醫(yī)學(xué)思維方式?如何使醫(yī)療AI在輔助診療時(shí)靈活運(yùn)用人類在醫(yī)學(xué)領(lǐng)域的經(jīng)驗(yàn)?“京醫(yī)千詢”團(tuán)隊(duì)研發(fā)出一種新方法,能有效捕捉臨床醫(yī)生的決策路徑,將其數(shù)據(jù)化,進(jìn)而為模型訓(xùn)練提供大量醫(yī)學(xué)專家推理的模擬數(shù)據(jù)。這一新方法近日發(fā)表于arXiv預(yù)印本網(wǎng)站。
“病人不會(huì)按照教科書和指南得病。”京東健康探索研究院高級(jí)研究員劉慧說,臨床醫(yī)學(xué)是基于循證知識(shí)和實(shí)踐經(jīng)驗(yàn)的綜合科學(xué),除了指南、教科書上的“顯性”知識(shí),醫(yī)生還需要不斷實(shí)踐思考,做出個(gè)性化的診療決策,積累“隱性”經(jīng)驗(yàn)和能力。
“AI的訓(xùn)練過程與人才培養(yǎng)的過程相似。”論文第一作者、京東健康探索研究院首席科學(xué)家王國鑫告訴科技日?qǐng)?bào)記者,在臨床實(shí)踐中,醫(yī)生不斷累積接診經(jīng)驗(yàn),在思維方式上產(chǎn)生質(zhì)變,“悟”出心得,這在本質(zhì)上就是數(shù)據(jù)訓(xùn)練。因此,高水平的醫(yī)療數(shù)據(jù)是AI訓(xùn)練的基石。
團(tuán)隊(duì)基于京東互聯(lián)網(wǎng)的場(chǎng)景沉淀,并與線下醫(yī)院合作,為大模型訓(xùn)練匯集基礎(chǔ)數(shù)據(jù)。然而,將經(jīng)驗(yàn)數(shù)據(jù)化非常困難。一方面,醫(yī)療決策往往具有模糊性、不確定性等特點(diǎn),模型難以有效反映專家判斷方式的復(fù)雜性;另一方面,獲取真實(shí)世界的專家級(jí)臨床推理數(shù)據(jù)面臨挑戰(zhàn),因?yàn)樗枰蹲綄<宜季S的細(xì)微差別,而這些細(xì)微差別往往難以量化。
鑒于臨床數(shù)據(jù)難以復(fù)制臨床實(shí)踐的動(dòng)態(tài)性和模糊性,團(tuán)隊(duì)研發(fā)出一種用來模擬醫(yī)學(xué)專業(yè)人員認(rèn)知推理過程的方法。這種方法為多階段訓(xùn)練方法,結(jié)合了連續(xù)預(yù)訓(xùn)練、監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)等多個(gè)階段,專門針對(duì)臨床場(chǎng)景定制,顯著提升了跨多個(gè)模型的復(fù)雜推理能力。
“新方法再現(xiàn)了臨床決策的動(dòng)態(tài)和迭代特性。”王國鑫介紹,團(tuán)隊(duì)在大量模擬醫(yī)學(xué)推理數(shù)據(jù)集上訓(xùn)練“京醫(yī)千詢”,使其推理能力更貼近于臨床實(shí)踐。團(tuán)隊(duì)成功將新方法轉(zhuǎn)化為一種可訓(xùn)練的方法,在各種醫(yī)療基準(zhǔn)測(cè)試中顯著提高了幾個(gè)開源基礎(chǔ)模型的性能。
團(tuán)隊(duì)還將模型及其訓(xùn)練數(shù)據(jù)作為開源資源公開,進(jìn)一步降低了醫(yī)療AI應(yīng)用的開發(fā)門檻,讓更多醫(yī)療機(jī)構(gòu)、開發(fā)者可以基于“京醫(yī)千詢”快速開發(fā)出適合自身需求的醫(yī)療AI應(yīng)用。同期開源的還包括一個(gè)基于真實(shí)世界數(shù)據(jù)的大規(guī)模、可更新的臨床實(shí)踐評(píng)估數(shù)據(jù)集。
“我們希望開源能推動(dòng)AI模型不斷取得新突破。”王國鑫說,目前看來,AI模型的能力上限仍在不斷提升。除了要能在“大數(shù)據(jù)”中抽提價(jià)值,AI還需要從“小數(shù)據(jù)”中獲得學(xué)習(xí)能力。隨著AI助手的普遍應(yīng)用,AI醫(yī)生能與人類醫(yī)生一起成長(zhǎng),積累更多“悟”的經(jīng)驗(yàn),推進(jìn)AI驅(qū)動(dòng)的醫(yī)療決策研究。
業(yè)內(nèi)也在不斷發(fā)展相關(guān)技術(shù)能力,例如,通過思維鏈生成技術(shù)增強(qiáng)醫(yī)學(xué)模型的推理能力。業(yè)內(nèi)專家認(rèn)為,推理過程模擬是模擬人的邏輯思考能力,不僅可以應(yīng)用于醫(yī)療領(lǐng)域,也可以用于文章創(chuàng)作、科學(xué)研究等領(lǐng)域。這種新方法有望在創(chuàng)造性活動(dòng)中提升AI的能力。
(責(zé)任編輯:華康)