柏拉图数据智能。
垂直搜索和人工智能。

机器学习框架根据胸部 X 光片对肺炎进行分类

日期:

胸部 X 光图像
测试数据 显示正常肺(左)、细菌性肺炎(中)和病毒性肺炎(右)示例的胸部 X 光图像。 (礼貌: 马赫学习:科学。 技术。 10.1088/2632-2153/acc30f)

肺炎是一种可能致命的肺部感染,病情发展迅速。 出现肺炎症状(例如干咳、干咳、呼吸困难和高烧)的患者通常接受肺部听诊器检查,然后进行胸部 X 光检查以确认诊断。 然而,区分细菌性和病毒性肺炎仍然是一个挑战,因为两者具有相似的临床表现。

数学建模和人工智能可以帮助提高放射影像疾病诊断的准确性。 深度学习在医学图像分类中越来越受欢迎,一些研究探索了使用卷积神经网络 (CNN) 模型从胸部 X 光图像中自动识别肺炎。 然而,创建能够分析大量医学图像而不会出现假阴性的高效模型至关重要。

现在,KM Abubeker 和 S Baskar 在 卡帕甘高等教育学院 在印度创建了一个新的机器学习框架,用于在图形处理单元 (GPU) 上对胸部 X 光图像进行肺炎分类。 他们描述了他们的策略 机器学习:科学与技术.

训练数据优化

深度学习分类器的性能取决于神经网络模型和用于训练网络的数据质量。 对于医学成像,缺乏足够大的数据集是性能不佳的主要原因。 为了解决这一不足,研究人员使用了数据增强,其中新的训练数据是从现有数据中合成的(例如通过图像旋转、移动和裁剪),使数据集更加全面和多样化。

另一种解决缺乏适当训练数据的方法是迁移学习——利用在执行相关任务时获得的现有知识,提高模型学习新任务的能力。 在他们研究的第一阶段,Abubeker 和 Baskar 使用迁移学习来训练九个最先进的神经 CNN 模型,以评估胸部 X 光片是否显示肺炎。

在实验中,他们使用了来自 RSNA Kaggle 公共数据集的胸部 X 光图像,包括用于训练的图像(1341 个归类为正常,1678 个归类为细菌性肺炎,2197 个归类为病毒性肺炎)、测试(234 个正常、184 个细菌性肺炎、206 个病毒性肺炎) ) 和验证(76 个正常,48 个细菌性肺炎,56 个病毒性肺炎)。 对数据集应用几何增强将其扩展到总共 2571 张正常图像、2019 张细菌图像和 2625 张病毒性肺炎图像。

基于包括准确性、召回率和 ROC 曲线下面积(AUROC,一个总结多个阈值的性能指标)在内的性能指标,研究人员选择了三个性能最好的 CNN 模型——DenseNet-160、ResNet-121 和 VGGNet-16——使用集成技术进行再培训。

集成策略

集成模型不是依赖于单一的机器学习模型,而是汇集了多个模型的结论,以提高性能指标并最大限度地减少错误。 研究人员开发了一种基于迁移学习的集成策略,称为 B2-Net,并将其与三个选定的 CNN 一起使用以创建最终模型。 他们在 NVIDIA Jetson Nano GPU 计算机上实现了最终的 B2-Net 模型。

用于对胸部 X 光片中的肺炎进行分类的 B2-Net 模型

他们指出,在训练期间,一些模型在识别正常 X 射线图像方面表现更好,而其他模型在识别病毒和细菌性肺炎样本方面表现更好。 集成策略使用加权投票技术,根据预定义的标准为每个分类器提供特定程度的权力。

与基线模型相比,经过再训练的模型在诊断准确性方面有显着提高。 在平衡数据集上测试模型表明,DenseNet-160、ResNet-121 和 VGGNet-16 的 AUROC 值分别为 0.9801、0.9822 和 0.9955。 然而,拟议的 B2-Net 集成方法优于所有三种方法,AUROC 为 0.9977。

研究人员使用汇集数据集中约 2 张胸部 X 光图像的子集评估和验证了 B600-Net 和其他三个模型。 DenseNet-160 错误识别了三张肺炎测试图像,而 VGGNet-16 和 ResNet-121 分别错误识别了一张 X 射线图像。 总体而言,所提出的 B2-Net 方法优于所有其他模型,能够以 97.69% 的准确率和召回率(真阳性占阳性总数的比例)区分胸部 X 光图像中的正常病例、细菌性肺炎和病毒性肺炎的 100%。

Abubeker 和 Baskar 解释说,虽然假阴性率是医学图像分类器最关键的标准,但所提出的 B2-Net 模型为实时临床应用提供了最佳选择。 他们写道:“这种方法,特别是在当前全球 COVID-19 爆发期间,可以帮助放射科医生快速可靠地诊断肺炎,从而进行早期治疗。”

接下来,他们计划扩展他们的模型以对更多肺部疾病进行分类,包括 TB 和 COVID-19 变体。

现货图片

最新情报

现货图片

在线答疑

你好呀! 我怎么帮你?