上消化道癌(包括食道癌和胃癌)是全世界最常見(jiàn)的癌癥。使用深度學(xué)習(xí)算法的人工智能平臺(tái)在醫(yī)學(xué)成像方面取得了顯著進(jìn)步,但它們?cè)谏舷腊┲械膽?yīng)用受到限制。我們旨在通過(guò)分析臨床內(nèi)鏡檢查的影像數(shù)據(jù)來(lái)開(kāi)發(fā)和驗(yàn)證用于上消化道癌診斷的胃腸道人工智能診斷系統(tǒng)(GRAIDS)。
方法
這項(xiàng)多中心,病例對(duì)照,診斷性研究是在中國(guó)的六家不同級(jí)別(即市,省和國(guó)家級(jí))醫(yī)院中進(jìn)行的。從所有參與調(diào)查的醫(yī)院中檢索未曾接受過(guò)內(nèi)窺鏡檢查的18歲或18歲以上連續(xù)參與者的圖像。經(jīng)組織學(xué)證實(shí)為惡性腫瘤的所有上消化道癌病變(包括食道癌和胃癌)患者均符合本研究的條件。只有具有標(biāo)準(zhǔn)白光的圖像才被認(rèn)為是合格的。來(lái)自中山大學(xué)癌癥中心的圖像被隨機(jī)分配(8:1:1)用于發(fā)展GRAIDS的訓(xùn)練和內(nèi)在驗(yàn)證數(shù)據(jù)集,以及用于評(píng)估GRAIDS性能的內(nèi)部驗(yàn)證數(shù)據(jù)集。使用中山大學(xué)癌癥中心(一家國(guó)立醫(yī)院)的內(nèi)部和前瞻性驗(yàn)證集以及來(lái)自五家初級(jí)保健醫(yī)院的其他外部驗(yàn)證集對(duì)它的診斷性能進(jìn)行了評(píng)估。還將GRAIDS的表現(xiàn)與具有三級(jí)專業(yè)知識(shí)的內(nèi)鏡醫(yī)師進(jìn)行了比較:專家,主管和受訓(xùn)者。通過(guò)使用Clopper-Pearson方法計(jì)算95%CI,評(píng)估了GRAIDS和內(nèi)鏡醫(yī)師對(duì)癌性病變的診斷準(zhǔn)確性,敏感性,特異性,陽(yáng)性預(yù)測(cè)值和陰性預(yù)測(cè)值。主管和實(shí)習(xí)生。通過(guò)使用Clopper-Pearson方法計(jì)算95%CI,評(píng)估了GRAIDS和內(nèi)鏡醫(yī)師對(duì)癌性病變的診斷準(zhǔn)確性,敏感性,特異性,陽(yáng)性預(yù)測(cè)值和陰性預(yù)測(cè)值。主管和實(shí)習(xí)生。通過(guò)使用Clopper-Pearson方法計(jì)算95%CI,評(píng)估了GRAIDS和內(nèi)鏡醫(yī)師對(duì)癌性病變的診斷準(zhǔn)確性,敏感性,特異性,陽(yáng)性預(yù)測(cè)值和陰性預(yù)測(cè)值。
發(fā)現(xiàn)
使用來(lái)自84 424個(gè)個(gè)體的1 036 496個(gè)內(nèi)窺鏡圖像來(lái)開(kāi)發(fā)和測(cè)試GRAIDS。在內(nèi)部驗(yàn)證集中,識(shí)別上消化道癌的診斷準(zhǔn)確性為0·955(95%CI 0·952-0·957),在前瞻性集中為0·927(0·925-0·929),范圍為在五個(gè)外部驗(yàn)證集中,從0·915(0·913-0·917)到0·977(0·977-0·978)。GRAIDS實(shí)現(xiàn)了與專家內(nèi)鏡醫(yī)師相似的診斷敏感性(0·942 [95%CI 0·924-0·957]vs0·945 [0·927-0.959];p = 0·692)和靈敏度(0·858 [0·832-0·880],p <0·0001)和受訓(xùn)者(0·722 [0·691-0·752],p < 0·0001)內(nèi)鏡醫(yī)師。GRAIDS的陽(yáng)性預(yù)測(cè)值為0·814(95%CI 0·788-0·838),專家內(nèi)鏡醫(yī)師的陽(yáng)性預(yù)測(cè)值為0·932(0·913-0·948),0·974(0·960-0··主管內(nèi)鏡醫(yī)師為984),受訓(xùn)內(nèi)鏡醫(yī)師為0·824(0·795-0·850)。GRAIDS的陰性預(yù)測(cè)值為0·978(95%CI 0·971-0·984),專家內(nèi)窺鏡專家的陰性預(yù)測(cè)值為0·980(0·974-0·985),0·951(0·942-0· 959)(主管內(nèi)窺鏡檢查員)和0·904(0·893-0·916)(受訓(xùn)內(nèi)窺鏡檢查員)。