【医学影像 AI】系统综述:深度学习算法在 ROP 检测中的应用
0. 论文简介
0.1 基本信息
2022年,澳大利亚 Griffith University 的 Amelia Bai 等在 Saudi J Ophthalmol. 发表论文 “深度学习算法在早产儿视网膜病变检测中的性能:系统综述(Performance of deep-learning artificial intelligence algorithms in detecting retinopathy of prematurity: A systematic review)”。
本文系统性综述了深度学习人工智能算法在早产儿视网膜病变(ROP)检测中的应用。
通过对2012年1月1日至2021年9月20日期间发表在Medline OVID、PubMed、Web of Science和Embase数据库中的相关文献进行检索和分析,本文旨在评估深度学习算法在ROP筛查和诊断中的表现,特别是通过灵敏度、特异度和受试者工作特征曲线下面积(AUROC)等指标来衡量其诊断性能。
通过这项系统性综述,本文不仅展示了深度学习算法在ROP检测中的潜力,还为未来的研究和临床应用提供了重要的指导和依据。
论文下载: NIH, griffith
引用格式:
Bai A, Carty C, Dai S. Performance of deep-learning artificial intelligence algorithms in detecting retinopathy of prematurity: A systematic review. Saudi J Ophthalmol. 2022 Oct 14;36(3):296-307. doi: 10.4103/sjopt.sjopt_219_21.
0.2 摘要
目的:
人工智能(AI)在早产儿视网膜病变(ROP)的筛查和诊断中展现出巨大的应用潜力。深度学习算法的开发有助于实现对这一可预防性致盲疾病的充分筛查、早期检测和及时治疗。本文旨在系统性地综述AI算法在ROP检测中的相关文献,特别是通过灵敏度、特异度和受试者工作特征曲线下面积(AUROC)来评估深度学习算法在ROP检测和分级中的表现。方法:
我们检索了Medline OVID、PubMed、Web of Science和Embase数据库中2012年1月1日至2021年9月20日期间发表的研究。纳入的研究需基于视网膜眼底图像,以眼科专家的判读作为参考标准,评估深度学习模型的诊断性能。未探讨疾病存在与否的研究被排除。使用QUADAS-2工具评估偏倚风险。结果:
在175项研究中,最终纳入12项研究。其中5项研究评估了ROP存在的检测性能,7项研究评估了附加病变(plus disease)的检测性能。在11项研究中,平均AUROC为0.98。检测ROP的平均灵敏度和特异度分别为95.72%和98.15%,检测附加病变的平均灵敏度和特异度分别为91.13%和95.92%。结论:
已发表研究中,深度学习算法的诊断性能较高。然而,仅有少数研究提供了外部验证结果或将算法性能与人类专家进行对比。未来研究可通过大规模前瞻性验证和严谨的研究设计进一步提升其可靠性和适用性。
关键词: 人工智能,深度学习,诊断,早产儿视网膜病变,筛查
1. 引言
人工智能(AI)的概念可以追溯到20世纪50年代,当时艾伦·图灵在论文《计算机器与智能》[1]中首次讨论了如何构建和测试智能机器。然而,直到1956年,在达特茅斯夏季人工智能研究项目的开创性会议上,约翰·麦卡锡才正式提出了“人工智能”这一术语[2]。这次会议介绍了一种旨在模仿人类问题解决能力的计算机程序,推动了接下来20年的AI研究[2]。如今,AI已融入日常生活的许多应用中,包括语音识别、照片标注、语言翻译、机器人技术,甚至自动驾驶汽车[3,4,5]。这些应用得以实现,得益于深度学习的使用,这是一种高级的AI形式,能够通过从大量训练数据中自我学习来编程执行特定任务[6]。AI在医学诊断领域的应用越来越受欢迎,眼科中的深度学习筛查算法已显示出令人鼓舞的结果。
在糖尿病视网膜病变的AI筛查中取得了显著成功,多个研究团队报告了深度学习算法检测糖尿病视网膜病变的敏感性和特异性分别为83%–90%和92%–98%[7,8]。此外,这些算法的成功验证已通过前瞻性评估推动了筛查项目在“现实世界”中的实施。一项研究在前瞻性评估中检测可转诊糖尿病视网膜病变的敏感性和特异性分别为83.3%和92.5%[8]。许多其他团队利用深度学习诊断其他眼科疾病(如糖尿病黄斑水肿[9]、年龄相关性黄斑变性[10]、青光眼[11]、以及早产儿视网膜病变(ROP)[12,13])也报告了类似的有希望的结果。
早产儿视网膜病变(ROP, Retinopathy of prematurity)是一种影响早产儿的视网膜血管增殖性疾病,其诊断依赖于及时筛查。全球估计至少有50,000名儿童因ROP失明[14],它仍然是可预防的儿童失明的主要原因[15]。视网膜成像技术的进步意味着现在可以通过视网膜照片轻松识别疾病,使其成为深度学习的理想候选者。随着医学进步,早产儿的存活率不断提高[16],ROP筛查的需求迅速超过了现有眼科专家的能力。因此,关于深度学习模型在ROP诊断性能上匹配或超越人类专家的报道引起了广泛关注。然而,必须强调的是,这种热情不应掩盖对严格评估的需求,因为ROP的漏诊可能导致失明等严重后果。因此,任何深度学习筛查算法都需要表现出高诊断性能、高敏感性、可推广性,并适用于现实世界。在深度学习诊断工具即将应用于临床实践之际,系统回顾支持AI筛查ROP的证据是明智的。
本系统综述旨在批判性地评估当前深度学习算法在ROP筛查中的诊断性能现状,特别关注研究设计、算法开发、验证类型、与临床医生的性能比较以及诊断准确性。
2. 材料与方法
2.1 检索策略与筛选标准
本系统综述纳入了开发或验证用于ROP诊断的深度学习模型,并将算法诊断准确性与ROP专家进行比较的研究。
我们检索了MEDLINE-Ovid、PubMed、Web of Science和Embase数据库中2012年1月1日至2021年9月20日发表的研究。各数据库的完整检索策略见 附录1 。选择 2012年1月1日作为截止日期是基于深度学习模型AlexNet的开发取得的重要突破[17]。检索首次于2020年7月10日进行,2021年5月23日修订,并于2021年9月20日更新。我们还对纳入研究的参考文献和引用文献进行了手动检索,以识别可能被遗漏的其他文章。
附录1:完整检索策略
资格评估由两名评审员独立进行,他们筛选了检索结果的标题和摘要。仅纳入旨在通过AI算法识别目标疾病(ROP)存在与否的研究。我们接受标准护理诊断、专家意见或共识作为分类疾病存在与否的适当参考标准。排除了未测试诊断性能或研究图像分割准确性而非疾病分类的研究。如果研究包含疾病检测的主要结果,则评估疾病严重程度分类能力的研究也被纳入。排除了综述文章、会议摘要和提供重复数据的研究。我们使用QUADAS-2[18]评估了每项研究在患者选择、指标测试、参考标准以及流程和时间安排方面的偏倚风险。完整的偏倚评估见附录2。
附录2:使用QUADAS‑2对纳入研究的偏倚进行方法学质量评估
本系统综述遵循《系统综述和Meta分析优先报告条目》(PRISMA)[19]声明的建议完成,研究问题根据《CHARMS》[20]系统综述预测模型清单制定。分析方法和纳入标准均预先指定。
2.2 数据分析
数据由两名评审员(AB和SD)使用预定义的数据提取表独立提取,随后进行交叉核对。任何分歧均与第三名评审员(CC)讨论。
提取的数据包括人口统计学和样本量(胎龄[GA]、出生体重、参与者数量和图像数量)、数据特征(数据来源、纳入和排除标准以及图像增强)、算法开发(架构、迁移学习以及用于训练和调优的图像数量)、算法验证(参考标准、专家数量、评估参考标准的相同方法以及内部和外部验证)和结果(敏感性、特异性、算法受试者工作特征曲线下面积[AUROC]、人类评分者以及适用的外部验证)。
有两篇论文从不同数据集或不同识别任务中开发了不同的算法,因此在结果部分被记录为单独的算法[21,22]。所有12篇论文的数据均被纳入,任何缺失信息均被记录。如果未明确记录敏感性和特异性但可通过混淆矩阵计算得出,则纳入计算结果。
3. 结果
我们的检索共识别出175条记录,其中 99 条进行了筛选[图1]。对30篇全文文章进行了资格评估,最终12项研究被纳入系统综述[12,13,21,22,23,24,25,26,27,28,29,30,31]。50项研究被排除,原因包括未测试诊断性能[32,33,34,35,36,37,38,39]、无分类任务[40,41,42]、无内部验证[23,43]、未使用AI算法[44]以及未基于标准临床护理[45]。
图1:研究选择的概述
3.1 数据特征与人口统计学
所有12项研究均从常规临床护理或当地筛查项目中获取了回顾性图像。
其中7项研究从中国收集图像[22,24,25,26,28,29,31],1项来自印度,1项来自北美[12],1项来自美国和墨西哥[30],1项来自美国和尼泊尔[21],1项研究包含来自新西兰的图像[13]。所有研究的图像采集时间范围从2011年7月至2020年6月不等。3项研究明确了纳入标准[25,26,31],另外5项研究明确了排除标准[12,13,21,28,29]。
5项研究排除了低质量图像[12,13,28,29,31],7项研究进行了图像增强[13,21,25,27,28,29,30]。这些特征总结见表1。
表1:12项研究的数据特征
7项研究记录了人口统计学信息[21,24,25,26,27,29,31],其中平均胎龄为30.9周,平均出生体重为1501.25克。
所有12项研究共使用了178,459张图像,每项研究的图像数量从2668到52,249张不等。
5项研究开发了检测ROP的算法[21,22,24,25,31],7项研究开发了检测“plus disease”的算法,共使用了5358张“plus disease”图像[12,13,26,27,28,29,30]。
人口统计学和样本量的详细信息见表2。
表2:12项研究的患者人口统计和样本量
3.2 算法开发与验证
所有12项研究的算法均基于卷积神经网络(CNN)。多种算法被用于迁移学习,包括ResNet、ImageNet、U-Net和VGG-16[表3],其中1项研究未使用迁移学习方法[25]。
大多数研究使用少于6000张图像训练算法,但有5项研究使用了超过10,000张图像进行算法开发[22,25,28,29,31]。
所有12项研究的参考标准均基于1-5名专家对疾病的诊断,每项研究中平均有2.6名人类专家对每张图像达成一致。
记录了多种内部验证方法,包括随机拆分样本验证和交叉验证[表4]。5项研究[12,13,21,22,30]对其AI算法进行了外部验证,其中1项研究完成了算法性能的前瞻性评估[22]。
表3:12项研究的算法细节
表4:12项研究的算法验证方法
3.3 算法性能
每种算法的性能列于表5中。
5项研究记录了其算法检测ROP疾病存在的能力,平均受试者工作特征曲线下面积(AUROC)为0.984[21,22,24,25,31]。
其中4项研究记录了敏感性和特异性,平均值分别为95.72%和98.15%[22,24,25,31]。一项研究将人类评分者的表现与AI算法进行了比较,结果显示ROP诊断的敏感性(AI 94.1%,人类 93.5%)和特异性(AI 99.3%,人类 99.5%)相似[31]。5项研究中有2项进行了外部验证,检测疾病存在的平均敏感性和特异性分别为60%和88.3%[21,22]。
另外7项研究评估了其算法检测“plus disease”存在的能力。
其中6项研究测量了AUROC,平均值为0.98[12,13,26,27,29,30]。6项研究中检测“plus disease”的平均敏感性和特异性分别为91.13%和95.92%[12,13,26,27,28,29]。其中2项研究进行了外部验证,平均敏感性和特异性分别为93.45%和87.35%[12,13]。
2项研究测量了AI算法检测“pre-plus disease”的性能,平均敏感性和特异性分别为96.2%和95.7%[12,26]。相比之下,4项研究测量了确定ROP疾病分期的性能,平均敏感性和特异性分别为89.07%和94.63%[22,25,28,29]。
表5:12项研究的结果摘要
4. 讨论
我们发现,用于ROP筛查的深度学习算法的敏感性和特异性指标与糖尿病视网膜病变中的神经网络算法相当[46]。尽管这一结果支持深度学习算法作为现实世界诊断工具的应用潜力,但纳入的研究中存在一些常见的方法学缺陷,需要加以考虑。这些问题包括参考标准的质量、样本量计算的使用、外部验证、疾病存在与否的定义以及前瞻性评估的必要性。
首先,我们发现不同算法的诊断目标存在差异,12篇论文中一部分研究旨在诊断ROP的整体存在,另一部分则专注于检测“plus disease”。区分这些诊断目标非常重要,因为其临床意义不同。此外,大多数研究使用的参考标准由平均2-3名专家评分,只有一项研究每张图像的参考标准由5名临床医生诊断[31]。众所周知,由于ROP诊断的主观性,评分者之间存在显著的变异性[47,48];因此,在使用少数专家评分的研究中,需谨慎识别潜在的评分者偏倚。
其次,用于训练算法的图像数量差异很大,从289张[27]到39,029张[29]不等。卷积神经网络通过计算机器输出与图像诊断之间的误差进行学习;因此,用于训练机器的图像越多,其诊断输出的误差越小[6]。因此,使用数万张图像进行训练的研究可能比使用数百或数千张图像的研究结果更可靠。然而,没有研究报告正式的样本量计算以确保研究的充分性。尽管在AI算法的背景下进行样本量计算具有挑战性,但它仍然是任何研究设计的重要组成部分,只有一篇论文将样本量作为其研究的局限性进行了报告[25]。未来的研究应考虑制定样本量计算,以证明算法设计所需的图像数量。
第三,排除低质量图像或进行图像增强可能会影响这些深度学习算法在现实临床环境中的表现。这是一个可能限制算法诊断性能的因素,因为高质量图像与高质量诊断和较小的算法误差相关[6]。因此,大多数论文排除低质量图像是可以理解的;然而,重要的是要保持合理性。用于训练算法的图像质量应与临床环境中拍摄的图像质量相对应,以便算法的性能能够与其实际表现相匹配。这也是为什么使用训练图像集之外的图像集进行算法的外部验证对于确定研究的普适性至关重要。在12项研究中,只有5项完成了外部验证,其中除一项研究显示等效性能外,其余研究的算法性能均低于其测试集。这一发现强调了在这些筛查算法中进行样本外外部验证的必要性,以更好地了解算法在临床环境中的表现。
第四,地面真相或参考标准标签大多来自为其他目的收集的数据,例如ROP图像数据库或回顾性常规临床护理记录。尽管存在国际公认的ROP存在和分期的定义指南,即《早产儿视网膜病变国际分类修订版》(ICROP)[49](2021年更新了最新版本[50]),但只有5项研究在其定义参考标准的方法中明确提到了ICROP。由于ICROP是普遍采用的ROP分级诊断标准,可以假设其他7项研究也使用了这些指南;然而,AI研究中应始终明确定义疾病存在与否的标准。
最后,只有一项研究完成了对其算法的前瞻性评估,这一过程对于评估算法在现实世界中的表现至关重要。大多数研究仅孤立地评估了深度学习的诊断准确性,未进行外部验证或与专家进行比较。只有3项研究提供了AI性能与人类性能的比较,从而能够评估其实际应用价值。如果没有将AI与人类性能进行比较,其他7项研究的结果在推断到医疗保健服务中的能力将受到限制。为了使深度学习诊断工具适用于临床床边筛查,其性能必须优于或与金标准(即专家诊断)相当。需要更多的工作来验证AI算法与人类评分者的性能比较,最好使用相同的外部测试数据集。
**从本系统综述中可以清楚地看出,**目前仍缺乏一项设计良好的随机对照研究,将经过有效外部验证的AI算法与人类在实时环境中的表现进行比较。这种规模的研究可以揭示算法在临床环境中应用的可能临床意义。因此,对这些深度学习诊断测试的前瞻性评估对于揭示AI在诊断和治疗医学中的潜力至关重要。
我们认识到,深度学习存在一个巨大的“黑箱”问题,即用户无法了解算法学习的图像特征[6]。这也是许多临床医生对将临床护理委托给AI持怀疑态度的原因,尤其是当临床医生熟悉的临床特征可能与算法使用的特征不同时。这进一步强调了需要设计良好、最小化偏倚并透明报告的研究。
我们在本综述中强调的大多数问题都可以通过稳健的设计避免,关键是要在预期的临床路径背景下评估这些AI诊断测试。
5. 结论
人工智能(AI)被誉为许多行业的革命性技术,而用于ROP诊断的深度学习算法无疑也不例外。
尽管我们在本系统综述中强调了存在的问题,但评估的12种深度学习算法的性能极高,所有研究的AUROC均达到或超过0.94。这些结果表明,AI算法的性能可以与人类专家相媲美甚至超越,并为未来大规模前瞻性研究奠定了基础。
尽管存在明确的筛查和治疗指南,但随着早产儿存活率的提高和医疗技术的进步,ROP的疾病负担仍在增加[15]。经验丰富的眼科医生的可及性和数量不足继续限制了ROP的筛查和诊断。因此,除非深度学习诊断算法等新策略得以应用,否则ROP视觉障碍的负担预计将进一步增加。
毫无疑问,AI在ROP中的成功应用将通过其高预测性能和高效性彻底改变疾病诊断。将这一技术应用于现实世界的临床实践具有不可估量的临床意义,包括提高可及性、高质量和及时的筛查,并显著降低筛查成本。
因此,AI将在ROP筛查中变得无处不在且不可或缺,高质量的研究需要继续推动这一变革性技术的转化,以减少这种可预防疾病导致的视力丧失和失明的发生率。
6. 参考文献
- Turing A. Computing machinery and intelligence. Mind. 1950;49:433–60.
- McCarthy J, Minsky, M, Rochester N, Shannon C. A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence 1955. AI Magazine. 2006;27:12.
- Wu J, Yılmaz E, Zhang M, Li H, Tan KC. Deep spiking neural networks for large vocabulary automatic speech recognition. Front Neurosci. 2020;14:199. doi: 10.3389/fnins.2020.00199.
- Popel M, Tomkova M, Tomek J, Kaiser Ł, Uszkoreit J, Bojar O, et al. Transforming machine translation: A deep learning system reaches news translation quality comparable to human professionals. Nat Commun. 2020;11:4381. doi: 10.1038/s41467-020-18073-9.
- Fayyad J, Jaradat MA, Gruyer D, Najjaran H. Deep learning sensor fusion for autonomous vehicle perception and localization: A review. Sensors (Basel) 2020;20:e4220. doi: 10.3390/s20154220.
- LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521:436–44. doi: 10.1038/nature14539.
- Gulshan V, Peng L, Coram M, Stumpe MC, Wu D, Narayanaswamy A, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. JAMA. 2016;316:2402–10. doi: 10.1001/jama.2016.17216.
- Zhang Y, Shi J, Peng Y, Zhao Z, Zheng Q, Wang Z, et al. Artificial intelligence-enabled screening for diabetic retinopathy: A real-world, multicenter and prospective study. BMJ Open Diabetes Res Care. 2020;8:e001596. doi: 10.1136/bmjdrc-2020-001596.
- De Fauw J, Ledsam JR, Romera-Paredes B, Nikolov S, Tomasev N, Blackwell S, et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. Nat Med. 2018;24:1342–50. doi: 10.1038/s41591-018-0107-6.
- Burlina PM, Joshi N, Pekala M, Pacheco KD, Freund DE, Bressler NM. Automated grading of age-related macular degeneration from color fundus images using deep convolutional neural networks. JAMA Ophthalmol. 2017;135:1170–6. doi: 10.1001/jamaophthalmol.2017.3782.
- Li Z, He Y, Keel S, Meng W, Chang RT, He M. Efficacy of a deep learning system for detecting glaucomatous optic neuropathy based on color fundus photographs. Ophthalmology. 2018;125:1199–206. doi: 10.1016/j.ophtha.2018.01.023.
- Brown JM, Campbell JP, Beers A, Chang K, Ostmo S, Chan RVP, et al. Automated diagnosis of plus disease in retinopathy of prematurity using deep convolutional neural networks. JAMA Ophthalmol. 2018;136:803–10. doi: 10.1001/jamaophthalmol.2018.1934.
- Tan Z, Simkin S, Lai C, Dai S. Deep learning algorithm for automated diagnosis of retinopathy of prematurity plus disease. Transl Vis Sci Technol. 2019;8:23. doi: 10.1167/tvst.8.6.23.
- Blencowe H, Lawn JE, Vazquez T, Fielder A, Gilbert C. Preterm-associated visual impairment and estimates of retinopathy of prematurity at regional and global levels for 2010. Pediatr Res. 2013;74(Suppl 1):35–49. doi: 10.1038/pr.2013.205.
- Gilbert C. Retinopathy of prematurity: A global perspective of the epidemics, population of babies at risk and implications for control. Early Hum Dev. 2008;84:77–82. doi: 10.1016/j.earlhumdev.2007.11.009.
- Valentine PH, Jackson JC, Kalina RE, Woodrum DE. Increased survival of low birth weight infants: Impact on the incidence of retinopathy of prematurity. Pediatrics. 1989;84:442–5.
- Russakovsky O, Deng J, Su H, Krause J, Satheesh S, Ma S, et al. ImageNet large scale visual recognition challenge. Int J Comput Vis. 2015;115:211–52.
- Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, et al. QUADAS-2: A revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med. 2011;155:529–36. doi: 10.7326/0003-4819-155-8-201110180-00009.
- Page MJ, McKenzie JE, Bossuyt PM, Boutron I, Hoffmann TC, Mulrow CD, et al. The PRISMA 2020 statement: An updated guideline for reporting systematic reviews. Int J Surg. 2021;88:105906. doi: 10.1016/j.ijsu.2021.105906.
- Moons KG, de Groot JA, Bouwmeester W, Vergouwe Y, Mallett S, Altman DG, et al. Critical appraisal and data extraction for systematic reviews of prediction modelling studies: The CHARMS checklist. PLoS Med. 2014;11:e1001744. doi: 10.1371/journal.pmed.1001744.
- Chen JS, Coyner AS, Ostmo S, Sonmez K, Bajimaya S, Pradhan E, et al. Deep learning for the diagnosis of stage in retinopathy of prematurity: Accuracy and generalizability across populations and cameras. Ophthalmol Retina. 2021;5:1027–35. doi: 10.1016/j.oret.2020.12.013.
- Wang J, Ju R, Chen Y, Zhang L, Hu J, Wu Y, et al. Automated retinopathy of prematurity screening using deep neural networks. EBioMedicine. 2018;35:361–8. doi: 10.1016/j.ebiom.2018.08.033.
- Campbell JP, Singh P, Redd TK, Brown JM, Shah PK, Subramanian P, et al. Applications of artificial intelligence for retinopathy of prematurity screening. Pediatrics. 2021;147:e2020016618. doi: 10.1542/peds.2020-016618.
- Hu J, Chen Y, Zhong J, Ju R, Yi Z. Automated analysis for retinopathy of prematurity by deep neural networks. IEEE Trans Med Imaging. 2019;38:269–79. doi: 10.1109/TMI.2018.2863562.
- Huang YP, Basanta H, Kang EY, Chen KJ, Hwang YS, Lai CC, et al. Automated detection of early-stage ROP using a deep convolutional neural network. Br J Ophthalmol. 2021;105:1099–103. doi: 10.1136/bjophthalmol-2020-316526.
- Mao J, Luo Y, Liu L, Lao J, Shao Y, Zhang M, et al. Automated diagnosis and quantitative analysis of plus disease in retinopathy of prematurity based on deep convolutional neural networks. Acta Ophthalmol. 2020;98:e339–45. doi: 10.1111/aos.14264.
- Ramachandran S, Niyas P, Vinekar A, John R. A deep learning framework for the detection of Plus disease in retinal fundus images of preterm infants. Biocybern Biomed Eng. 2021;41:362–75.
- Tong Y, Lu W, Deng QQ, Chen C, Shen Y. Automated identification of retinopathy of prematurity by image-based deep learning. Eye Vis (Lond) 2020;7:40. doi: 10.1186/s40662-020-00206-2.
- Wang J, Ji J, Zhang M, Lin JW, Zhang G, Gong W, et al. Automated explainable multidimensional deep learning platform of retinal images for retinopathy of prematurity screening. JAMA Netw Open. 2021;4:e218758. doi: 10.1001/jamanetworkopen.2021.8758.
- Yildiz VM, Tian P, Yildiz I, Brown JM, Kalpathy-Cramer J, Dy J, et al. Plus disease in retinopathy of prematurity: Convolutional neural network performance using a combined neural network and feature extraction approach. Transl Vis Sci Technol. 2020;9:10. doi: 10.1167/tvst.9.2.10.
- Zhang Y, Wang L, Wu Z, Zeng J, Chen Y, Tian R, et al. Development of an automated screening system for retinopathy of prematurity using a deep neural network for wide-angle retinal images. Ieee Access. 2019;7:10232–41.
- Coyner AS, Swan R, Campbell JP, Ostmo S, Brown JM, Kalpathy-Cramer J, et al. Automated fundus image quality assessment in retinopathy of prematurity using deep convolutional neural networks. Ophthalmol Retina. 2019;3:444–50. doi: 10.1016/j.oret.2019.01.015.
- Greenwald MF, Danford ID, Shahrawat M, Ostmo S, Brown J, Kalpathy-Cramer J, et al. Evaluation of artificial intelligence-based telemedicine screening for retinopathy of prematurity. J AAPOS. 2020;24:160–2. doi: 10.1016/j.jaapos.2020.01.014.
- Gupta K, Campbell JP, Taylor S, Brown JM, Ostmo S, Chan RVP, et al. A Quantitative severity scale for retinopathy of prematurity using deep learning to monitor disease regression after treatment. JAMA Ophthalmol. 2019;137:1029–36. doi: 10.1001/jamaophthalmol.2019.2442.
- Redd T, Campbell J, Brown J, Kim S, Ostmo S, Chan R, et al. Utilization of a deep learning image assessment tool for epidemiologic surveillance of retinopathy of prematurity. Invest Ophthalmol Vis Sci. 2019;60:580–4.
- Smith K, Kim S, Goldstein I, Ostmo S, Chan R, Brown J, et al. Quantitative analysis of aggressive posterior retinopathy of prematurity using deep learning. Invest Ophthalmol Vis Sci. 2019;60:4759.
- Taylor S, Kishan G, Campbell P, Brown J, Ostmo S, Chan R, et al. Invest Ophthalmol Vis Sci. 2018;59:3937.
- Wallace DK, Zhao Z, Freedman SF. A pilot study using “ROPtool” to quantify plus disease in retinopathy of prematurity. J AAPOS. 2007;11:381–7. doi: 10.1016/j.jaapos.2007.04.008.
- Wang J, Zhang G, Lin J, Ji J, Qiu K, Zhang M. Application of standardized manual labeling on identification of retinopathy of prematurity images in deep learning. Zhonghua Shiyan Yanke Zazhi. 2019;37:653–7.
- Campbell J, Chan R, Ostmo S, Anderson J, Singh P, Kalpathy-Cramer J, Chiang M. Analysis of the relationship between retinopathy of prematurity zone, stage, extent and a deep learning-based vascular severity scale. Invest Ophthalmol Vis Sci. 2020;61:2193.
- Choi RY, Brown JM, Kalpathy-Cramer J, Chan RV, Ostmo S, Chiang MF, et al. Variability in plus disease identified using a deep learning-based retinopathy of prematurity severity scale. Ophthalmol Retina. 2020;4:1016–21. doi: 10.1016/j.oret.2020.04.022.
- Ramachandran S, Kochitty S, Vinekar V, John R. A fully convolutional neural network approach for the localization of optic disc in retinopathy of prematurity diagnosis. J Intell Fuzzy Syst. 2020;38:6269–78.
- Worrall DE, Wilson C, Brostow GJ. Automated retinopathy of prematurity case detection with convolutional neural networks. In: Deep Learning and Data Labeling for Medical Applications. DLMIA, LABELS. 2016:68–76.
- Ataer-Cansizoglu E, Bolon-Canedo V, Campbell JP, Bozkurt A, Erdogmus D, Kalpathy-Cramer J, et al. Computer-based image analysis for plus disease diagnosis in retinopathy of prematurity: performance of the “i-ROP” system and image features associated with expert diagnosis. Transl Vis Sci Technol. 2015;4:5. doi: 10.1167/tvst.4.6.5.
- Touch P, Wu Y, Kihara Y, Zepeda E, Gillette T, Cabrera M, et al. Development of AI deep learning algorithms for the quantification of retinopathy of prematurity. J Invest Med. 2019;67:209.
- Wang S, Zhang Y, Lei S, Zhu H, Li J, Wang Q, et al. Performance of deep neural network-based artificial intelligence method in diabetic retinopathy screening: A systematic review and meta-analysis of diagnostic test accuracy. Eur J Endocrinol. 2020;183:41–9. doi: 10.1530/EJE-19-0968.
- Gschließer A, Stifter E, Neumayer T, Moser E, Papp A, Pircher N, et al. Inter-expert and intra-expert agreement on the diagnosis and treatment of retinopathy of prematurity. Am J Ophthalmol. 2015;160:553–60.e3. doi: 10.1016/j.ajo.2015.05.016.
- Campbell JP, Ataer-Cansizoglu E, Bolon-Canedo V, Bozkurt A, Erdogmus D, Kalpathy-Cramer J, et al. Expert diagnosis of plus disease in retinopathy of prematurity from computer-based image analysis. JAMA Ophthalmol. 2016;134:651–7. doi: 10.1001/jamaophthalmol.2016.0611.
- International Committee for the Classification of Retinopathy of Prematurity. The International classification of retinopathy of prematurity revisited. Arch Ophthalmol. 2005;123:991–9. doi: 10.1001/archopht.123.7.991.
- Chiang MF, Quinn GE, Fielder AR, Ostmo SR, Paul Chan RV, Berrocal A, et al. International classification of retinopathy of prematurity, third edition. Ophthalmology. 2021;128:e51–68. doi: 10.1016/j.ophtha.2021.05.031.
版权说明:
本文由 youcans@xidian 对论文 “Performance of deep-learning artificial intelligence algorithms in detecting retinopathy of prematurity: A systematic review” 进行摘编和翻译。该论文版权属于原文期刊和作者,本译文只供研究学习使用。
youcans@xidian 作品,转载必须标注原文链接:
【医学影像 AI】系统综述:深度学习算法在 ROP 检测中的性能(https://youcans.blog.csdn.net/article/details/141107014)
Crated:2025-03