Home    中文  
 
  • Search
  • lucene Search
  • Citation
  • Fig/Tab
  • Adv Search
Just Accepted  |  Current Issue  |  Archive  |  Featured Articles  |  Most Read  |  Most Download  |  Most Cited
Ultrasound Quality Control

Value of double closed-loop management artificial intelligence in quality control of obstetric ultrasound sections

  • Qiuluan Zhuo 1 ,
  • Hongyan Wei 1 ,
  • Xinkui Jiang 1 ,
  • Shihua Deng 1 ,
  • Ningzhu Jiang 1 ,
  • Cuiping Huang 1 ,
  • Liping Fan 1 ,
  • Huixian Pang 1 ,
  • Haiyan Zhang 1 ,
  • Wei Jiang , 1,
Expand
  • 1.Department of Ultrasound, Huazhong University of Science and Technology Union Shenzhen Hospital, Shenzhen 518052, China
Corresponding author: Jiang Wei, Email:

Received date: 2022-01-28

  Online published: 2023-04-10

Copyright

Copyright by Chinese Medical Association No content published by the journals of Chinese Medical Association may be reproduced or abridged without authorization. Please do not use or copy the layout and design of the journals without permission. All articles published represent the opinions of the authors, and do not reflect the official policy of the Chinese Medical Association or the Editorial Board, unless this is clearly specified.

Abstract

Objective

To assess the value of double closed-loop management artificial intelligence (AI) in the quality control of standard obstetric ultrasound sections.

Methods

The data uploaded by Huazhong University of Science and Technology Union Shenzhen Hospital in the first and second quarters of 2021 (Q1 and Q2, from January to June) on the AI-based ultrasonic quality control system (345 cases including 15475 obstetric ultrasound images) were selected for AI quality control. Targeted learning was carried out according to the quality control results of Q1. Standard rate, basic standard rate, and non-standard rate of the images in the two quarters were calculated and compared. The reasons for the presence of non-standard images in the two quarters were analyzed. The accuracy of AI-based quality control system was tested by double-closed loop management mode of appeal for controversial result toward expert judgement.

Results

The results indicated that the standard section rate increased from 80.76% in Q1 to 83.90% in Q2, while the non-standard section rate decreased from 5.36% to 3.33%. Besides, the rate of the sections that fully met the requirements increased from 14.3% to 42.9%, and the rate of the sections that were not qualified decreased from 23.8% to 0. The differences for the above comparisons were all statistical difference χ2=24.687, 0.050, 1.200, and 5.676, respectively; P<0.001, <0.001, =0.040, =0.071). The double-closed-loop management mode showed that the accuracy of AI-based quality control system was 98.5%.

Conclusion

AI-based quality control mode with double closed-loop management is objective, accurate, efficient, and convenient. Using this system can improve the accuracy of obstetric ultrasound examination, which is of great value in prenatal ultrasonic quality control.

Cite this article

Qiuluan Zhuo , Hongyan Wei , Xinkui Jiang , Shihua Deng , Ningzhu Jiang , Cuiping Huang , Liping Fan , Huixian Pang , Haiyan Zhang , Wei Jiang . Value of double closed-loop management artificial intelligence in quality control of obstetric ultrasound sections[J]. Chinese Journal of Medical Ultrasound (Electronic Edition), 2023 , 20(01) : 90 -96 . DOI: 10.3877/cma.j.issn.1672-6448.2023.01.015

随着大数据影像智能识别系统日趋成熟,人工智能(artificial intelligence,AI)技术已逐渐应用于医疗质量控制(质控)领域1,如CT、MRI等影像技术借助于计算机视觉领域的相关研究成果,已率先实现医疗影像自动化和规范化的质控模式。超声检查技术具有无创、可重复等优势,在产科的应用是其他影像技术所无法替代的。但传统产科超声检查为手动操作,过程繁琐复杂,且极为依赖超声医师的操作手法和经验水平:超声医师水平高低不一,获得的图像质量也参差不齐,测量结果也存在较大差异2。因此,产科超声质控显得尤为重要。目前大部分医院的产科超声采用人工抽查少量医师、少部分病例图像的方法进行质控,由于传统人工质控需花费大量的人力物力,很难实现全员质控。AI质控以其高效、客观及快速的特点,较好地解决了此问题。2021年,深圳市卫生健康委员会开始实施基于互联网+产前超声智能化质控项目,该项目要求所有助产机构每个季度质控1次。本研究将AI在产科超声图像质控中的评价方法及2021年华中科技大学协和深圳医院前两季度的质控效果报道如下。

资料与方法

一、对象

图像资料来源于深圳市南山区华中科技大学协和深圳医院超声科于2021年第一季度和第二季度通过AI软件智能化质控的孕11~13+6周及20~40周的345例孕妇共15 475帧产科超声切面图像。纳入标准:Ⅰ级、Ⅱ级、Ⅲ级产科超声及早孕期颈项透明层(nuchal translucency,NT)切面及早孕期头臀长切面图像。

二、方法

使用深圳市卫生健康委员会统一招标采购的“超声智库”应用程序(手机版)与“产前超声AI智慧云平台”(电脑版)进行产科超声质控。该质控系统可以对所有上传的图像进行全自动、实时切面判别及标准度评分,也可以识别并标记切面的解剖结构,并根据各切面解剖结构的有无及是否清晰给出切面不足的原因。超声智库除智能质控外,还提供了一系列与产前诊断有关的文献、视频可供学习参考。按照深圳市产前超声质控中心的要求,每位医师每个季度应选择连续10个病例所有留存在工作站内的图像上传至“产前超声AI智慧云平台”,平台通过AI技术对上传的图像进行自动质控,每位医师及每家单位均可以登录自己的账号后在系统查看自己的超声图像质控情况和科室质控情况。通过“查看报表”获取质控统计结果;通过“结果分析”查看图像质量评价,其中,评价内容包括切面名称、切面质量、切面分类、结构评价、不足原因等内容;通过“学习提升”和软件提供的标准图像及模式图进行对比学习。

(一)AI质控的切面、质控评价方法与双闭环管理

1. AI质控的切面:(1)早孕期检查要求质控切面(2个):早孕期NT切面、早孕期头臀长测量切面。(2)中晚孕期Ⅰ级检查要求质控切面(3个):丘脑水平横切面、上腹部横切面、股骨长轴切面。(3)中晚孕期Ⅱ级检查要求质控切面(11个):丘脑水平横切面、小脑水平横切面、四腔心切面、上腹部横切面、脐带腹壁插入处横切面、膀胱水平横切面彩色多普勒、双肾水平横切面、颈胸段脊柱矢状切面、腰骶尾段脊柱矢状切面、股骨长轴切面、宫颈长轴切面。(4)中晚孕期Ⅲ级检查要求质控切面(23个):丘脑水平横切面、侧脑室水平横切面、小脑水平横切面、鼻唇冠状切面、双眼球横切面、四腔心切面、左心室流出道切面、右心室流出道切面、上腹部水平横切面、脐带腹壁插入处横切面、膀胱水平横切面彩色多普勒、双肾水平横切面、颈胸段脊柱矢状切面、腰骶尾段脊柱矢状切面、股骨长轴切面×2、胫腓骨冠状切面×2、肱骨长轴切面×2、尺桡骨冠状切面×2、宫颈长轴切面。
2. AI质控评价细则:根据AI对切面检测的解剖结构显示清楚与否、图像放大与增益等进行图像质控总体评价,给出包括切面名称、结构评价、切面评分及不足原因等指标评价结果,并附有标准超声图像和标准模式图像供查看学习。切面标准度的评估:切面评分≥80分为标准,60~79分为基本标准,<60分为非标准。
3. 质控双闭环管理(图1):(1)AI闭环——图像上传、自动检测、结果自动显示与查看。受质控医师通过网页或手机将病例图像批量上传至产前超声AI智慧云平台,平台AI模型对上传超声图像切面进行智能化、自动化实时评估,质控完成后医师可以在终端查看智能质控结构评价、统计结果和质控报告。(2)专家质控闭环——申诉、专家审核、结果自动显示与查看。受质控医师对AI切面质控结果存在异议时,可在系统提出申诉,申诉时需选择申诉原因(切面类型检测错误、标准与否判断错误、解剖结构检测错误),必要时填写申诉描述。申诉提交后,系统会向后台专家发送申诉信息,后台专家收到信息后将进行审核和回复,此回复会记录在系统并反馈给受质控医师。
图1 产前超声人工智能智慧云平台提供的双闭环流程示意图

(二)智能质控后的反馈与学习

2021年第一季度的质控为该实施方案的首次质控,在第一季度质控后,所有医师均登录超声智慧云平台查看该季度的质控结果。第1次质控结果出来后,科室采取统一的干预措施,首先组织医师查看各自留存切面不足的原因,对照标准切面进行学习讨论,然后组织医师进行相关视频集体学习1次,最后要求个人利用超声智慧云平台针对第一季度质控结果反馈的自身问题进行切面学习和相关视频学习,列表并认真分析出现这些切面解剖结构显示不足的原因,在工作中纠正这些不足和错误。

(三)数据记录与分析

记录2个季度的切面分析结果,包括切面标准率、基本标准率、非标准率;记录切面符合要求情况,包括完全达到标准切面要求的切面和不符合切面要求的切面,并分析不符合切面要求的原因;记录申述切面及申述结果。

三、统计学分析

采用统计软件SPSS 20.0进行统计学分析。切面标准率、基本标准率、非标准率,完全达到标准切面要求、完全不符合切面要求及待提升切面情况为计数资料,以百分率表示,组间比较采用χ²检验。以P<0.05为差异有统计学意义。

结果

一、2021年第一季度和第二季度科室总体质控情况比较

超声科在产前超声AI智慧云平台第一季度和第二季度上传病例数分别为183例和162例,上传的切面数分别为9448帧及6027帧,切面标准率由80.76%提高到83.90%,切面非标准率由5.36%下降到3.33%,差异均具有统计学意义(P均<0.05,表1)。
表1 2021年第一季度和第二季度超声图像质控总体情况比较(%)
季度 上传切面数(帧) 标准率 基本标准率 非标准率
第一季度 9448 80.76 13.88 5.36
第二季度 6027 83.90 12.77 3.33
χ2 24.687 3.826 0.050
P <0.001 0.050 <0.001

二、第一季度和第二季度AI检测到不符合切面要求的原因比较

第一季度通过AI质控检测21个(上肢与下肢的切面均是对称的,只取一侧分析)产科质控要求切面中,完全达到标准切面要求的有3个(3/21,14.3%),即四腔心切面、左心室流出道切面、双眼球水平横切面;5个(5/21,23.8%)切面不符合切面要求,即胎儿NT切面、胎儿头臀长切面、右心室流出道切面、宫颈长轴切面;13个切面(13/21,61.9%)均有提示解剖结构显示不足的原因,加上前面完全不符合要求的5个切面,总共18个切面(18/21,85.7%)存在不同程度的问题,不能完全达到标准要求(图23)。第二季度AI质控结果表明,不符合切面要求的原因得到明显改善,9个切面(9/21,42.9%)达到标准切面要求,明显提高了标准切面率,完全不符合要求的切面减少到0,两季度差异具有统计学意义(P<0.05),AI提示仍有解剖结构显示不足原因的切面减少到12个(12/21,57.1%,表23)。
图2 超声人工智能智慧云平台对头臀长(CRL)测量切面的识别与评估。图a:智能模型正确判断为胎儿CRL测量切面;图b:智能模型指出切面不足的原因:该切面出现了锁骨和侧脑室
图3 超声人工智能智慧云平台对丘脑水平横切面的识别与评估。图a:智能模型正确判断为丘脑水平横切面;图b:智能模型指出切面不足原因:大脑外侧裂显示不清
表2 2021年第一季度与第二季度人工智能检测的超声图像切面解剖结构显示不足的原因
项目 序号 切面名称 第一季度 第二季度
检测到不足的切面 1 丘脑水平横切面 该切面出现小脑;透明隔腔显示不清;大脑外侧裂显示不清 出现小脑或大脑外侧裂显示不清
2 侧脑室水平横切面 大脑外侧裂显示不清;该切面出现了小脑;丘脑显示不清 大脑外侧裂显示不清
3 小脑水平横切面 透明隔腔显示不清;颅骨光环显示不完整,大脑外侧裂显示不清;小脑实质显示欠清 大脑外侧裂显示不清
4 鼻唇冠状切面 鼻子显示不清;上唇显示不清;下唇显示不清;颏部显示不清 下唇或颏部显示不清
5 上腹部水平横切面 该切面出现了肺;该切面出现了肾;胃、脐静脉和门静脉显示不清;腹壁显示不全 出现了肺
6 脐带腹壁入口处横切面 插入脐带处显示不清
7 腰骶尾段脊柱矢状切面 脊柱末端显示不清;脊髓、脊髓圆锥显示不清 脊柱末端显示不清或脊髓圆锥显示不清
8 颈胸段脊柱矢状 脊髓显示不清,椎体骨化中心显示不清
9 膀胱水平横切面彩色多普勒 两侧脐动脉显示不清
10 双肾横切面 肾盂一侧显示不清
11 肱骨长轴切面 肱骨近端骨骺显示不清,肱骨近端显示欠清
12 尺桡骨冠状切面 桡骨近端骨骺显示不清;桡骨远端显示不清;桡骨远端骨骺显示不清;尺骨近端显示不清;尺骨近端骨骺显示不清;桡骨、尺骨显示不清 桡骨或尺骨显示不清
13 胫腓骨冠状切面 腓骨显示不清,胫骨近端骨骺显示不清,腓骨近端骨,骺显示不清,腓骨远端骨骺显示不清;胫骨、腓骨显示不清 胫骨或腓骨显示不清
14 股骨长轴切面 股骨近端骨骺显示不清
15 右心室流出道切面 右心室显示不清;降主动脉显示不清;上腔静脉显示不清;脊柱显示不清;升主动脉或主动脉弓或左心室显示不清 右心室显示不清
16 宫颈内口矢状切面 宫颈、宫颈内口显示不清 宫颈内口显示不清
17 胎儿颈项透明层切面 颈后皮肤透明层不清楚;下颌骨呈长条形;该切面出现了肋骨;该切面出现了锁骨;该切面出现了侧脑室 下颌骨呈长条形;出现侧脑室或锁骨
18 胎儿头臀长测量切面 鼻尖和鼻前皮肤显示不清;上颌骨显示不清;下颌骨显下颌骨显示不清;间脑显示不清;菱脑显示不清;生殖结节显示不清,该切面出现了肋骨;该切面出现了锁骨;该切面出现了侧脑室 生殖结节显示不清,出现侧脑室或锁骨
未检测到不足的切面 19 四腔心切面
20 左心室流出道切面
21 双眼水平横切面
表3 2021年第一季度与第二季度完全符合切面要求、不符合切面要求及待提升切面数比较[切面数(%)]
季度 完全达到标准切面要求 待提升的切面 完全不符合切面要求
第一季度 3(14.3) 13(61.9) 5(23.8)
第二季度 9(42.9) 12(57.1) 0(0)
χ2 1.200 0.099 5.676
P 0.040 0.753 0.017

三、AI检测的准确性与申诉

产前超声AI智慧云平台为了解决AI可能出现的检测错误,特设定了专家质控闭环管理。当受质控医师与AI意见不一致时,可进行申诉(图4)。在第一季度上传的9448帧切面中,医师申诉的切面数为228帧(228/9448,2.4%),148帧(148/228,64.9%)切面经后台专家更正,80帧(80/228,35.1%)切面维持原有检测结果。第二季度上传的6027帧切面中申诉了125帧(125/6027,2.1%),后台专家更正了84帧(84/125,67.2%)切面,维持原检测结果的有41帧(41/125,32.8%),上半年总检测切面15 475帧,AI检测错误的切面共232帧,错误率为1.5%(232/15 475),检测正确的切面共15 243帧,准确率为98.5%(15 243/15 475)。
图4 质控医师对产前超声人工智能智慧云平台判断结果的申诉图像。图a、c:智能模型正确判断为侧脑室水平横切面和右心室流出道切面;图b、d显示申诉过程:医师申诉-后台专家质控-维持原判-申诉回复解答

讨论

产前超声作为胎儿首选检查方法,其具有无创、方便、准确及可重复的优点,明显优于其他影像学检查方法。产前超声诊断需要医师操作仪器并实时分析图像,通过声像图作出合理的报告描述及超声诊断,因此,超声切面的质控至关重要,是专项质控的重要部分3。遵循《产前超声诊断技术指南》4的相关规范,提高产前超声图像的切面标准程度是提高产科超声质控的关键。
在传统的质控过程中,切面质控依旧存在若干问题:(1)切面质控由质控员完成,质控过程存在较大的主观性;(2)每次质控,由于质控员不同,质控标准也不统一;(3)存在人情分、松紧不一的情形;(4)质控时质控员需要逐帧对切面进行判定,耗费大量的时间,导致质控数量有限,因此每次质控只能抽查1名医师的少量病例,无法做到全员质控;(5)虽然质控工作是非常重要的一项工作,但每次质控结果只是集中通报,本人不能方便查看自己的质控结果,对于人员多的科室,一个医师被抽查质控可能要1~2年时间,无法达到精准指出并改正的目的。因此,质控工作可能形式大于效果,虽然有质控,但是没有干预措施,未能很好地提升超声检查的图像质量。
计算机技术的飞速发展和AI技术的推广,为质控工作提供了更加高效、统一标准的医疗管理工具,尤其对于影像医学5。传统质控的很多问题,利用AI质控可以轻松解决。本研究中的质控模式,可以利用统一的标准进行质控,解决质控的主观性和人情性问题。同时,自动化、智能化的切面判别和标准度评估,可以快速完成大量的切面质控。利用质控报表自动生成的功能,质控完成后医师可以在终端查看智能质控结构评价、统计结果和质控报告,达到精准质控和反馈的目的。
AI质控虽然拥有上述诸多优点,但目前仍然不能达到100%的正确,这是目前AI的共同缺点。产前超声AI智慧云平台提供的双闭环管理则是针对质控过程中的该问题设计的质控管理模式。从超声科上半年的15 475帧图像的质控结果可以看出,本系统的AI质控准确率虽已高达98.5%,但仍存在1.5%的图像出现分类错误或标准度判断错误的问题。为了提高检测的正确率,系统设置了后台专家进行人工质控这一环节。当存在异议时,医师提出申诉,由后台专家进行人工质控,从而得到接近100%的结果。
这种双闭环的设计,另一非常重要的作用是提升了医师对切面及其解剖结构的认识。首先,AI检测后,医师可以直观地看到自己的质控数据。通过参考质控评估结果、对照平台给出的标准切面及模式图,可以了解切面的不足之处。此外,AI质控对切面内解剖结构的标记,可帮助医师强化对不同切面内解剖结构的认识。在此过程中,如果医师认为AI判断错误,可以提出申诉,申诉的图像将由后台专家重新质控并给出专家结果,医师可以再次学习,受质控医师能得到专家的指导,从而快速提高标准化产前切面留存水平。
自实施双闭环管理AI质控后,超声检查图像质量提升效果明显,主要体现如下。
1. 消除了完全不符合要求的切面,留存切面至少能够达到基本标准,科室总体水平逐步上升:在21个要求质控的切面中,完全不符合要求的切面从第一季度的5个切面(5/21,23.8%)降低至0,差异有统计学意义。完全标准的切面从第一季度的3个切面(3/21,14.3%)提高到9个切面(9/21,42.9%),差异有统计学意义。其余12个基本标准切面(12/21,57.1%)出现不足的原因明显减少:单个切面不足的原因从第一季度最多的9个降低到第二季度的1个。尚存在不足的原因可能是:临床工作中受胎儿体位或胎儿大小的影响,有些切面难以显示出标准切面,如脊柱矢状切面受胎儿体位影响较大,要100%的病例都显示标准切面,在临床工作中仍有些困难。但是能够尽可能显示出主要解剖结构,显示出基本标准切面,可基本符合临床检查和质控要求。认识到的这些不足,是以后工作中切面质量可提升的空间。
2. 提高医师对切面的认识:通过半年来的运行,超声科医师对AI质控的流程已十分熟悉,逐步掌握了不同切面的解剖结构,对切面的错误认识,如部分医师对丘脑水平横切面和侧脑室水平横切面混淆不清,也逐步减少。如智能模型自动检测显示为侧脑室水平横切面,而医师认为该切面是丘脑水平横切面,并提出申诉。后台专家重新审核后维持原来的判断,提示该切面侧脑室显示清晰,属于侧脑室水平横切面,同时指明这也是两个切面的鉴别点。通过该申诉,可使医师对“无不足原因”这两个切面有进一步的理解。智能模型自动检测为右心室流出道切面的标准切面,“无不足原因”,医师认为该切面是三血管气管切面而不是右心室流出道切面,系统判断错误。后台专家仍维持AI判断,并给予申诉回复,让医师认识到右心室流出道切面不等同于三血管气管切面,右心室、肺动脉瓣、主肺动脉显示清晰是右心室流出道标准切面的关键所在。
3. 纠正科室共性切面错误。部分切面可能不仅仅是个人的认识存在错误,整个科室大部分人都存在认识不足,如需要显示的结构显示不清、出现不应出现的结构、图像放大比例不对,图像增益调节不当等。如胎儿头臀长测量切面,部分医师获得的切面通常不是胎儿的正中矢状切面,而是出现了侧脑室、肋骨或锁骨的旁矢状切面,如图2所示。再比如胎儿颅脑切面,以往大家对大脑外侧裂认识不足,常忽略对大脑外侧裂的观察,而外侧裂异常是导致智力障碍、孤独症、癫痫和脑瘫等的主要原因6如胎儿大脑皮层发育畸形与神经元迁移障碍有密切联系。熟悉正常胎儿各孕周对应的大脑外侧裂声像图表现7,可减少颅脑异常的漏诊,如图3所示。AI质控方案实施后,科室医师逐渐对此类结构与切面有了更深入的认识,纠正了科室的共性错误。
综上所述,产前超声图像的智能质控客观、高效、便捷,能够使用统一标准在短时间内实现大量的产前超声图像质控。配合申诉-专家质控的双闭环管理,使产前超声图像质控准确率几乎达到100%,真正实现质控的智能化、规范化及统一化。该系统可以提高医师对切面和结构的认知,提高产前超声检查的切面标准度,在产前超声质控工作中具有较高应用价值。
1
姜玉新, 李建初, 王红燕, 等. 科学管理勇于创新严控质量:超声质控常用方法及研究 [J/OL]. 中华医学超声杂志(电子版), 2020, 17(7): 597-601.

2
Salim I, Cavallaro A, Ciofolo-Veit C, et al. Evaluation of automated tool for two-dimensional fetal biometry [J]. Ultrasound Obstet Gynecol, 2019, 54(5): 650-654.

3
王红燕, 马莉, 谷杨, 等. 加强超声医学质量控制促进学科创新发展 [J/CD]. 中华医学超声杂志(电子版), 2019, 16(5): 321-326.

4
李胜利, 邓学东. 产前超声检查指南(2012) [J/CD]. 中华医学超声杂志(电子版), 2012, 9(7): 574-580.

5
张红梅, 尹立雪, 李春梅, 等. 四川省155家哨点医院质控评价指标差异原因的大数据分析: 2018年报告 [J/OL]. 中华医学超声杂志(电子版), 2020, 17(7): 629-637.

6
Guibaud L, Selleret L, Larroche JC, et al. Abnormal Sylvian fissure on prenatal cerebral imaging: significance and correlation with neuropathological and postnatal data [J]. Ultrasound Obstet Gynecol, 2008, 32(1): 50-60.

7
Chen X, Li SL, Luo GY, et al. Ultrasonographic characteristics of cortical sulcus development in the human fetus between 18 and 41 weeks of gestation [J]. Chin Med J (Engl), 2017, 130(8): 920-928.

Outlines

/

Copyright © Chinese Journal of Medical Ultrasound (Electronic Edition), All Rights Reserved.
Tel: 010-51322630、2632、2628 Fax: 010-51322630 E-mail: csbjb@cma.org.cn
Powered by Beijing Magtech Co. Ltd