在daGOAT模型的實際應用中,研究者會每天更新移植患者的實驗室檢驗數據,根據模型預測患者是高危還是低危aGVHD,再預防性給藥,以期在不提高感染率的情況下降低重度aGVHD的發(fā)生風險。
◎本報記者 代小佩
急性移植物抗宿主?。╝GVHD),是患者接受造血干細胞移植后可能發(fā)生的一種急性并發(fā)癥,要邁過這道檻,關鍵在預防。
而守好“預防”這個關口,基于大數據的預測模型大有可為。近日,中國醫(yī)學科學院血液病醫(yī)院(中國醫(yī)學科學院血液學研究所)信息與資源中心首席技術專家陳俊仁、干細胞移植中心主任姜爾烈和兒童血液病診療中心主任竺曉凡團隊聯合在計算科學頂尖期刊《自然·計算科學》在線發(fā)表了一項研究成果,該研究基于成人和兒童移植患者隊列的臨床數據進行數學建模,他們提出的模型,將有助于臨床醫(yī)生預測患者在接受移植手術后發(fā)生aGVHD的概率。
梳理10年移植案例記錄制成數據集
造血干細胞移植是治療急性白血病、骨髓衰竭性疾病等血液疾病的最終手段之一。有些造血干細胞移植患者可能出現aGVHD,主要表現為皮疹、腹瀉、膽紅素升高等癥狀。
aGVHD是造血干細胞移植后100天內可能發(fā)生的重大并發(fā)癥,其發(fā)生時供者的免疫細胞會對患者的肝膽、腸道以及皮膚進行攻擊。這種并發(fā)癥的發(fā)生率為30%—45%,綜合國內外的統(tǒng)計數據,重度aGVHD的短期死亡率可能高達30%。
“理論上,在干細胞移植后加強免疫抑制可以降低重度aGVHD的發(fā)生風險。但是,免疫抑制本身也是一個風險因素;如果我們給所有造血干細胞移植患者都加強免疫抑制,那么患者的整體感染發(fā)生率就會提高,死亡率隨之也會提高,而這并不是我們所希望看到的。”陳俊仁表示。
業(yè)內人士公認的一點是,要降低aGVHD的發(fā)生概率,重在預防。“如果我們能提前預測重度aGVHD的發(fā)生,那么就能只對重度aGVHD患者給予較強的免疫抑制。”陳俊仁說。
長期以來,中國醫(yī)學科學院血液病醫(yī)院(中國醫(yī)學科學院血液學研究所)的醫(yī)生一直想要解決患者移植后重度aGVHD防治的實際臨床問題。為了解決該問題,中國醫(yī)學科學院血液病醫(yī)院(中國醫(yī)學科學院血液學研究所)的信息與資源中心、干細胞移植中心、兒科團隊,以及醫(yī)渡云(北京)技術有限公司的數據科學團隊組成了項目研究團隊。
研究團隊協(xié)同梳理了長達10年的移植案例記錄,并最終形成了一個名為“aGOAT”的數據集。
整合涵蓋200多個變量的動態(tài)指標
在獲取數據集之后,研究團隊進行了數據建模,將模型命名為“daGOAT”,該模型納入了584名成人患者、45名兒童患者的數據,其中16%的成人患者和24%的兒童患者在100天內發(fā)生了重度aGVHD。
陳俊仁介紹:“我們發(fā)現,從來沒有研究者系統(tǒng)性地整合造血干細胞移植患者在移植后的所有動態(tài)指標”。而研究團隊提出的daGOAT模型整合了多維度時間序列數據計算重度aGVHD的風險。
造血干細胞移植患者在移植后動態(tài)指標涵蓋200多個變量,包括生命體征、血液細胞計數、血液生化指標、血清免疫因子、血液免疫細胞分型等。由于涉及到的參數多,而且不是每天持續(xù)檢測,存在較多數據的缺失,即血液病患者臨床數據“多參數、小樣本”的問題。面對這一問題,很多統(tǒng)計方法以及機器學習方法都束手無策。
“而我們提出的daGOAT模型可以解決這一問題,并且在成人和兒童兩群患者的交叉驗證AUROC都達到0.78以上(滿分為1),遠超出過去
文獻報道的最佳水平。”陳俊仁介紹,研究團隊建立的模型預測效果顯著優(yōu)于MAGIC評分、Ann Arbor評分、基于圍移植特征的靜態(tài)模型和XGBoost動態(tài)模型。
這一成績的取得離不開中國醫(yī)學科學院血液病醫(yī)院(中國醫(yī)學科學院血液學研究所)信息化的發(fā)展。陳俊仁解釋稱:“daGOAT模型使用了大量的動態(tài)參數,而且這些數據來自不同的檢測科室。運算daGOAT模型基本上不可能依靠手工輸入數據,必須讓模型和醫(yī)院信息系統(tǒng)無縫銜接。因此,我們認為醫(yī)學人工智能要進一步發(fā)展離不開醫(yī)院信息化的不斷升級。”
多學科的跨領域合作也是daGOAT模型得以建立并發(fā)揮作用的條件。“此次研究得益于全方位跨領域的協(xié)同整合,包括數學建模、數據庫統(tǒng)整、生物統(tǒng)計、實驗室技術以及臨床醫(yī)學。”陳俊仁說。
研究論文第一作者、中國醫(yī)學科學院血液病醫(yī)院(中國醫(yī)學科學院血液學研究所)信息與資源中心助理研究員劉雪鷗介紹,在模型的實際應用中,他們會每天更新移植患者的實驗室檢驗數據,根據模型預測患者是高危還是低危aGVHD,再預防性給藥,以期在不提高感染率的情況下降低重度aGVHD的發(fā)生風險。目前,研究團隊正在加緊籌備這項工作。
“這項研究對事前預警提示臨床干預、降低不良事件發(fā)生率進行了初步探索。”陳俊仁表示。
未來將完善模型并開展前瞻性臨床研究
陳俊仁介紹,研究論文投稿到《自然·計算科學》后,編輯非常感興趣并很快決定送審。論文審稿人認為,daGOAT模型是一個將患者基本特征和實驗室檢驗數據結合起來的機器學習預測模型,與僅采用患者基本特征預測的模型相比,這種模型精確度更高,更加適合臨床應用,有助于醫(yī)生進行臨床決策。
相關專家表示,上述研究是基于多維度、高質量臨床數據資源整合的典型研究范例,為血液系統(tǒng)疾病科學研究奠定了重要基礎。
“我們希望提供daGOAT模型也能應用于其他應用場景的證據。”陳俊仁介紹,當時,研究團隊想到的最“夸張”的應用場景是:能不能通過智能手機的微小移動或信號的振動,在一個人還坐著的時候就提前預測他是不是在接下來幾秒鐘將要站起來。
為此,研究團隊從美國加州大學獲得了一個智能手機數據集后專門測試了一下,他們發(fā)現daGOAT模型在這個應用場景的預測效果也比隨機森林、XGBoost等機器學習模型的預測效果好。
“雖然我們對自身的定位還是堅守血液疾病的數據科學研究與工具開發(fā),但偶爾偏離主題做一些異想天開的研究,其實也挺好。”陳俊仁說。
談及該模型的不足之處,陳俊仁指出,該研究納入的數據僅限于中國醫(yī)學科學院血液病醫(yī)院(中國醫(yī)學科學院血液學研究所)一家血液中心的數據,daGOAT模型還有待完善。下一步,研究團隊將開展daGOAT模型的前瞻性臨床研究。