iMED团队MICCAI线上交流分享会

iMED团队计划于2022年8月13日上午9:30召开一次组内线上研讨会,届时组内成员将会针对各自将在领域内顶级会议MICCAI上发表的共计13篇文章进行交流分享。会议顺序安排及分享文章的相关摘要如下(部分文章由于仍未发布,存在保密性,摘要不公开):

 

1. 基于诊断的医学图像分割多标签融合方法,吴俊德

       在医学图像分割中,一些组织/病变可能没有清晰的边界。因此,通常需要由多名临床专家对图像进行注释,以减轻个人偏见。然而,这种临床上的惯例也给机器学习算法的应用带来了新的挑战。 因为没有一个确定的标签作为ground-truth,我们很难训练和评估深度学习模型。解决该问题的一种常见做法是多数投票(majority vote),即对多个标签进行平均。然而,这种策略忽视了标注医生专业程度上的差异。我们注意到,在临床实践中,医学图像分割通常用于疾病诊断。受这一观察的启发,我们提出了诊断优先原则,即以疾病诊断为标准来校准观察者之间的分割不确定性。具体来说,对于每个评估者,我们将其对诊断的贡献反映为专业度图 (Expertness Map), 并提出了一种专家度生成器(ExpG),以消除优化过程中的高频成分,来增强结果的泛化性能。基于得到的专家图,可以将多标签融合为单个ground-truth,我们称之为诊断第一基础GT(DiagFirst-GT)。实验结果表明,通过使用DiagFirst-GT作为ground-truth训练分割网络,所的到的结果能够显著促进相应的疾病诊断,优于之前SOTA的多标注学习方法。

 

2. 面向交互的特征分解病灶检测网络,沈俊勇

        常见的病变检测网络通常使用病变特征进行分类和定位。然而,许多病灶仅根据病灶特征进行分类,没有考虑与全局上下文特征的关系,从而产生了误分类问题。在本文中,我们提出了一种面向交互的特征分解(IOFD)网络,以提高对上下文相关病变的检测性能。具体来说,我们将骨干输出的特征分解为独立优化的全局上下文特征和病变特征。然后,我们设计了两个新颖的模块来提高病变分类的准确性。全局上下文嵌入 (GCE) 模块旨在提取全局上下文特征。没有附加参数的全局上下文交叉注意 (GCCA) 模块旨在对全局上下文特征和病变特征之间的交互进行建模。此外,考虑到分类和定位任务所需的不同特征,我们进一步采用任务解耦策略。 IOFD 在训练和推理方面易于训练和端到端。两个模态医学数据集的实验结果优于最先进的算法,这证明了 IOFD 的有效性和通用性。

 

3. 基于OCTA多投影一致性和互补性的痴呆症筛查,王星月

        最近的临床研究表明,视网膜血管的改变与痴呆症相关,眼科检查有助于痴呆症的早期筛查。光学相干断层扫描血管造影(OCTA)在显示浅层血管复合体(SVC)、深层血管复合体(DVC)和脉络膜毛细血管方面显示出优越性,并已广泛应用于临床研究。然而,现有的方法对OCTA的多投影进行简单的平均或串联分析,远远不能完全挖掘OCTA中的信息。这些方法没有考虑多个投影之间的关系。因此,本文提出了一种多投影一致性和互补性学习网络(MUCO-Net)来探索基于OCTA的痴呆症早期筛查。首先,开发了一个一致性和互补性注意力(CsCp)模块来理解不同投影之间的复杂关系。然后,引入了跨视图融合 (CVF) 模块来组合来​​自 CsCp 的多尺度特征。此外,所提出的模块的输入数量是灵活的,以促进来自不同投影的特征之间的交互。在实验中,MUCO-Net 在两个 OCTA 数据集上实现,分别用于筛查痴呆症和诊断眼底疾病,实验结果达到了当前性能的最优。

 

4. 基于金字塔一致性的低质量眼底图像增强网络,刘浩锋

        视网膜眼底图像因其经济和高效等特点,被广泛应用在临床的眼底检查中。然而,眼底图像经常因成像干扰导致图像质量下降,给临床诊断带来巨大的挑战。尽管最先进的方法在模拟数据上已经取得良好的增强性能,然而此类算法运用于临床上的眼底图像时会出现性能下降的问题。因此,为了促进眼底图像增强在临床上的部署,本文提出基于金字塔一致性约束的低质量眼底图像增强网络(PCE-Net),以减轻对临床数据的需求并稳定地增强未知的临床数据。首先,高质量图像被随机退化以形成结构共享的低质量图像序列;然后,低质量图像将被分解为拉普拉斯金字塔特征作为多级特征输入到神经网络中;随后,基于特征金字塔约束对引入随机退化的低质量图像序列进行一致性约束,使PCE-Net增强网络学习退化不变特征。之后,本文在眼底图像增强和分割下进行了大量的实验,进一步说明了算法的有效性。

 

5. 手术视频中的器械组织交互检测,林文钧

手术视频中的器械组织交互检测是手术场景理解的一个基本问题。然而,很少有工作专注于这种细粒度的手术活动表示。 在本文中,我们提出将器械组织交互表示为<器械边界框,组织边界框,器械类别,组织类别,动作类别>五元组,并提出了一个五元组检测网络用于白内障手术视频中的器械组织交互五元组检测任务。

 

6. AS-OCT影像下用于白内障分类的区域集成再校准网络,章晓庆

        白内障是指眼睛晶状体出现混浊症状,全世界大约51%比例失明病例是由白内障引起的,其是一种可通过白内障手术恢复视力的眼病,在临床诊断上,精准白内障分级是眼科医生采用合适治疗方式的基础。临床研究表明白内障的混浊度分布具有区域非对称性特点,比如针对核性白内障,核性区域下半部分的混浊症状相对上半部分对眼科医生诊断患者的白内障严重程度具有更重要参考作用。基于以上临床研究,我们构造了一个区域集成再校准网络,其中我们提出了区域集成再校准模块能动态地调整不同混浊区域的权重通过对混浊度分布不对称性临床先验信息进行注入,引导神经网络模型关注特定混浊区域。在一个临床AS-OCT影像数据集结果表明我们设计的区域集成再校准网络优于现有方法,并且对区域集成再校准模块学习到的权重进行可视化,可视化结果显示混浊区域权重分布与临床特征分布类似,表明本文模型能偏向于特定混浊区域且具有较好的可解释性,因为它与眼科医生诊断模式保持相似性。

 

7. 代理桥接的医学图像异常检测网络,周康

        医学图像异常检测是指只利用正常图像作为训练集,得到一个可以识别出异常图像的模型。大多数现有方法通过自重建的框架解决这个问题。然而,该框架会学习到恒等映射,从而降低对异常的敏感性。为了减缓基于自重建网络中的恒等映射问题,本文提出使用中间代理图片来连接输入图像和重建图像,并提出基于代理桥接的图像重建网络。由于超像素同时保留局部结构信息和少量纹理信息,本文使用超像素图片作为中间代理图片。

 

8. 面向白内障眼底图像增强的结构一致性修复网络,李衡

        眼底彩照是临床中用于诊断和监测眼底疾病的常规检查。然而,对于白内障患者来说,眼底彩照总会因晶状体混浊而导致质量下降。这种退化阻碍了眼科医生或计算机辅助系统的可靠诊断。为了提高临床诊断的确定性,已经提出了恢复算法来提高眼底图像的质量。不幸的是,这些算法的部署仍然存在挑战,例如收集足够的训练数据和保留视网膜结构。为了规避严格的部署要求,从具有相同结构的合成数据中开发了一种用于白内障眼底图像的结构一致恢复网络 (SCR-Net)。本文设计了一种白内障模拟模型,用于收集由具有相同结构的白内障眼底图像形成的合成白内障集合(SCS)。然后从 SCS 中提取高频分量 (HFC) 以约束结构一致性,从而强制执行 SCR-Net 中的结构保留。实验证明了 SCR-Net 在与最先进的方法和后续临床应用的比较中的有效性。

 

9. 时序CT肺结节生长趋势预测,方建生

        根据肺结节管理指南,对被检测为可疑恶性的肺结节进行随访尤为重要。通过预测肺结节的生长趋势,可以协助医生做出更准确的随访决策和临床干预。尽管运用深度学习方法测量结节直径变化来评估肺结节生长趋势已成为常规方法,但由于大规模时间序列的CT数据难以获取以及结节真实动态变化的指标缺乏,很少有研究使用数据驱动方法来预测肺结节的变化。在本文中,为了比较同一结节在不同时间的变化,我们首先从NLST数据集中选取了在连续时间内(如T0,T1,T2)同一病人的CT数据,然后通过模型预测和人工审查得到准确的结节纹理类别、直径和“生长、收缩、稳定”三种演变类别,形成NLSTt数据集。而后基于该数据集,我们提出了一个孪生编码器(Siamese Encoder)来捕捉同一结节在不同时间的3D ROI特征;在此基础上,我们设计了一个时空混合器(STM),融合3D ROI中的时间变化趋势和空间变换特征;最后,我们采用两层分级损失(H-loss)给予扩张类结节更多的关注来预测结节的演变类别。在NLSTt数据集和内部数据集上,我们进行了大量实验,证明了该方法的优势。同时在内部数据集上,我们还将模型结果与熟练的临床医生的诊断进行对比,从而证明了我们的方法在临床上的有效性。

 

11. 基于深度学习的角膜神经弯曲度分级,牟磊

       角膜共聚焦显微镜(CCM)是一种非侵入性的角膜成像技术,广泛应用于于评估基底神经丛。角膜神经弯曲度是一种可用于进一步对系统性或眼部疾病如糖尿病神经病变、干眼症、角膜炎等疾病进行病理分析的生物标志物。现有研究表明,糖尿病神经病变和干眼症患者的角膜神经在4个弯曲度级别中有着显著差异,因此本方法将角膜神经弯曲度分为4个级别。 角膜神经图像相邻弯曲度层次之间的差异相对细微,导致现有方法在弯曲度识别中无法获得理想的准确度。针对这种挑战,本方法提出了一种新型的两阶段角膜神经弯曲度分级模型。首先,本方法提出了双线性注意力网络实现CCM图像的粗粒度分级和弯曲度级别激活区域(ROIs)。其次,本方法设计了一个辅助分级弯曲度的网络(AuxNet),用于从ROIs中提取额外的细粒度特征,从而进一步提升弯曲度分级的性能。

 

 

12. 基于角膜共聚焦显微镜图像的角膜神经分割研究,陈佳玉

        “NerveFormer: A Cross-Sample Aggregation Network for Corneal Nerve Segmentation”一文中提出了一种新的基于活体角膜共聚焦显微镜图像的(in Vivo Cornea Confocal Microscope, CCM)角膜神经分割方法,称为NerveFormer网络,整体结构如图1所示。对角膜共聚焦显微镜图像中的角膜神经进行提取是后续量化评估(如角膜神经弯曲度分级、长度、密度等)和相关疾病诊断的基础。此外,该图像中由于存在对比度低、活化后的角膜朗格汉斯细胞和角膜神经外观相似等因素,使得角膜神经提取容易出现断裂、误分等现象。基于此,我们提出了一种基于深度学习的算法模型 —— NerveFormer。旨在解决角膜神经图像分割任务中存在的分割断裂不连续、背景细胞干扰两大问题。整体方法设计基于ResNet34框架,并加入了中间部分核心的DEAM模块。其中,DEAM包含了TDA和TEA两个子模块。TDA用于高效学习单个样本的特征,TEA用于学习外部样本的特征。如此,DEAM模块可以更好的学习整个数据集的中最具显著的角膜神经特征,从而提升方法抵抗背景细胞干扰的能力。该方法在已经公开的角膜神经数据集(CORN-1)上得到了充分验证,实验结果表明NerveFormer在角膜神经图像中已获得了不错的分割效果。

 

13. 基于超广角图像的糖尿病视网膜病变分级的自动诊断方法研究,白艳苗

        超广角(UWF)眼底成像是一种新兴的成像技术,可提供更广阔的视野图像,已成为糖尿病视网膜病变(DR)等多种眼部疾病筛查和诊断的有效工具。然而,由于数据规模和手动注释的有限性,在 UWF 图像中训练一个强大的深度学习模型用于 DR 分级实际上是一个挑战。相比之下,我们可能会在研究领域中找到大规模的高质量常规彩色眼底摄影数据集,具有图像级或像素级注释。因此,我们提出了一种无监督病变感知迁移学习框架 (ULTRA),通过利用大量公开注释良好的常规彩色眼底图像,在 UWF 图像中进行 DR 分级。受 DR 严重程度的临床识别,即眼科医生根据相关病变类型和数量做出决策的启发,我们设计了一个对抗性病变图生成器,为 DR 分级提供辅助病变信息。引入了病变外部注意模块 (LEAM) 以将病变特征集成到模型中,从而实现相对可解释的 DR 分级。大量的实验结果表明,所提出的方法优于最先进的方法。