首页 > 行业动态 > 作者解读 | 用于肝包虫病辅助诊断的人工智能系统EDAM开发与评估
作者解读 | 用于肝包虫病辅助诊断的人工智能系统EDAM开发与评估
2023年10月18日 来源:柳叶刀TheLancet

《柳叶刀-数字医疗》(The Lancet Digital Health)发表一项清华大学自动化系张学工教授团队领衔的用于肝包虫病辅助诊断的人工智能系统EDAM研究。肝包虫病是流行于全球一些欠发达农村地区的严重地方性疾病,人工智能系统对于缓解农村地区医疗人员不足和专业知识缺乏问题提供了一个可行的辅助手段。

背景

肝包虫病是流行于全球一些欠发达农村地区的严重地方性疾病,它主要分为囊型和泡型两种亚型。在如中国西北等牧区,由于具有相应资质和能力的医生相对欠缺,肝包虫病诊断的准确性和敏感性较低。既往的研究主要聚焦于单张CT或超声的疾病分类,增加了筛查和诊断中需要人工挑选疾病片子的步骤。在本研究中,我们旨在开发并评估一种能够基于平扫CT图像在患者水平上自动检测肝包虫病并对其进行亚型分类的人工智能系统,为放射科医生和临床医师提供具有可解释性的辅助诊断结果。

方法

我们开发了一个用于肝包虫病辅助诊断的人工智能系统EDAM,它能够基于平扫CT图像准确地区分肝包虫病、肝囊肿及无肝脏病变的正常对照组,并将肝包虫病细分为泡型或囊型。EDAM包括一个切片级的病灶分类与分割模型和一个患者级的诊断模型。我们建立了一个平扫CT数据库(共700例,包含395例囊型包虫病,122例泡型包虫病,130例肝囊肿和53例正常对照;来自青海大学附属医院[QUAH]与南阳中心医院[NCH])以开发EDAM,并收集了两个额外的独立队列(共156例;来自玉树人民医院[YPH]与华西医院[WCH])作为外部测试集来验证EDAM的性能和泛化能力。我们还比较了EDAM与52位经验丰富的放射科医生在诊断肝包虫病和区分肝包虫病亚型方面的表现。

结果

1. 患者级诊断预测

在内部和外部测试集中,EDAM在患者级别的诊断中表现出可靠的性能与泛化能力。在内部测试集中,总体AUROC:0.974 [95% CI 0.936–0.994];囊型包虫病诊断准确率:0.952 [0.939–0.965],泡型包虫病诊断准确率:0.981 [0.973–0.989];囊型包虫病诊断灵敏度:0.966 [0.951–0.979],泡型包虫病诊断灵敏度:0.944 [0.908–0.970]。在外部测试集中,总体AUROC:0.953 [95% CI 0.840–0.973], 囊型包虫病诊断准确率:0.929 [0.915–0.947],泡型包虫病诊断准确率:0.936 [0.919–0.950];囊型包虫病诊断灵敏度:0.913 [0.879–0.944],泡型包虫病诊断灵敏度:0.868 [0.841–0.897]。

2. 对比EDAM与放射学医师诊断效果

在一个包含30例患者(10囊型,10泡型,10肝囊肿)的测试集上,我们对比了EDAM与52位放射科医生诊断的准确率。EDAM在囊型与泡型包虫病的诊断上取得了超越医生的效果,在肝囊肿的诊断上与医生表现相近。

3. 诊断可解释性

EDAM能够为患者CT扫描中的每一层赋予一个切片关注分数,以指示该切片的显著性,并进而形成一套切片关注图。切片关注图的一个示例,展示了EDAM如何通过为真阳性切片标签自动学习更大的权重而集中注意力,并通过为不可避免的假阳性和假阴性标签给予较低的权重来减少它们的影响。切片关注图可用以指示放射科医生需要关注的重要切片,并解释人工智能模型关注这些切片的机制。

4. 切片级预测与分割

EDAM的切片级模型可以为每一切片中的病变区域生成分割图。在内部测试集的所有共2,839个病变切片上,EDAM达到了平均Dice系数为0.801(95% CI 0.796-0.807)和平均像素精度为0.992(0.992-0.993)的分割准确率。EDAM的分割结果更清晰、更平滑地显示了病变区域的边界。

解释

在本研究中,我们开发并测试了EDAM,以区分囊型、泡型包虫病患者与肝囊肿患者和正常对照。在检测囊型和泡型包虫病方面,EDAM的表现超过了经验丰富的放射科医生。此外,通过结合切片级模型和患者级模型,EDAM平衡了样本大小和模型复杂性,从而使其基于相对较小的数据库展现出良好的泛化能力。EDAM提供了端到端的患者级诊断,并具有中间可解释的结果,对于缓解农村地区医疗人员不足和专业知识缺乏问题提供了一个可行的辅助手段。

研究团队:本文通讯作者为清华大学自动化系张学工教授,共同第一作者是青海大学附属医院副主任医师王展博士和清华大学自动化系在读博士研究生卞海洋。来自清华大学自动化系、青海大学附属医院、青海大学医学院、镇平县人民医院、南阳市中心医院、北京清华长庚医院、清华大学航天航空学院等单位的人员共同参与了本研究。

项目资助:中国国家自然科学基金,中国青海省科技厅项目,清华-福州数据技术研究院项目。