切换至 "中华医学电子期刊资源库"

中华医学超声杂志(电子版) ›› 2025, Vol. 22 ›› Issue (08) : 703 -710. doi: 10.3877/cma.j.issn.1672-6448.2025.08.004

妇产科超声影像学

基于注意力机制改进的子宫解剖结构检测与分割多任务模型的性能评估
江瑶1, 蒋程2, 余翔1, 谭莹1, 温昕1, 温慧莹1, 彭桂艳1, 李胜利1,()   
  1. 1 518028 南方医科大学妇女儿童医学中心深圳市妇幼保健院超声科
    2 410082 长沙,湖南大学计算机学院
  • 收稿日期:2025-06-20 出版日期:2025-08-01
  • 通信作者: 李胜利
  • 基金资助:
    深圳市自然科学基金基础研究面上项目(JCYJ20240813115114020)

Performance of an attention-enhanced multi-task model for uterine anatomical structure detection and segmentation

Yao Jiang1, Cheng Jiang2, Xiang Yu1, Ying Tan1, Xin Wen1, Huiying Wen1, Guiyan Peng1, Shengli Li1,()   

  1. 1 Department of Ultrasonography, Shenzhen Maternal and Child Healthcare Hospital, Women and Children's Medical Center, Southern Medical University, Shenzhen 518028, China
    2 College of Computer Science, Hunan University, Changsha 410082, China
  • Received:2025-06-20 Published:2025-08-01
  • Corresponding author: Shengli Li
引用本文:

江瑶, 蒋程, 余翔, 谭莹, 温昕, 温慧莹, 彭桂艳, 李胜利. 基于注意力机制改进的子宫解剖结构检测与分割多任务模型的性能评估[J/OL]. 中华医学超声杂志(电子版), 2025, 22(08): 703-710.

Yao Jiang, Cheng Jiang, Xiang Yu, Ying Tan, Xin Wen, Huiying Wen, Guiyan Peng, Shengli Li. Performance of an attention-enhanced multi-task model for uterine anatomical structure detection and segmentation[J/OL]. Chinese Journal of Medical Ultrasound (Electronic Edition), 2025, 22(08): 703-710.

目的

以YOLOv8框架为基础,引入高效多尺度注意力(EMA)机制,构建子宫解剖结构检测与分割智能模型(IMSU),并评估其性能。

方法

回顾性收集2021年1月至2022年12月深圳市妇幼保健院共计4326张非妊娠子宫正中矢状切面超声图像,人工标注子宫宫体、宫颈及内膜3个关键解剖结构,建立图像数据库。按8∶1∶1比例划分为训练集(3460张)、验证集(433张)与测试集(424张),引入EMA机制对YOLOv8模型进行改进,构建IMSU。首先训练并验证原始YOLOv8标准模型及基于EMA模块改进的模型(IMSU),随后在测试集上对两种模型对子宫宫体、宫颈及内膜的自动结构检测与分割性能进行评估,评估指标包括精确率、召回率、平均精度(mAP)2个层级指标(mAP@50与mAP@50-95)。

结果

在3个关键结构自动检测任务中,IMSU的整体平均精确率(0.920 vs 0.905)、召回率(0.939 vs 0.917)及mAP@50(0.952 vs 0.933)均优于YOLOv8;尤其对宫颈的检测mAP@50值由0.858提升至0.919,召回率由0.778提升至0.842。在自动分割任务中,与YOLOv8相比,IMSU整体平均精确率由0.905提升至0.914,召回率由0.915提升至0.933,mAP@50由0.930提升至0.952,mAP@50-95亦从0.661提升至0.677;对宫颈的分割mAP@50-95由0.570提升至0.597。

结论

融合EMA机制的IMSU显著提升了非妊娠子宫正中矢状切面关键结构的自动检测性能与分割精度,为实现子宫结构的智能量化测量及超声辅助诊断提供了技术支持,具有良好的临床应用前景。

Objective

 To develop an intelligent model for uterine anatomical structure detection and segmentation (IMSU) by integrating the Efficient Multi-scale Attention (EMA) mechanism into the You Only Look Once version 8 (YOLOv8) framework and evaluate its performance.

Methods

 A total of 4326 non-pregnant mid-sagittal uterine ultrasound images were retrospectively collected from Shenzhen Maternity and Child Healthcare Hospital (January 2021-December 2022). Three key anatomical structures (uterine corpus, cervix, and endometrium) were manually annotated to establish an image database. The dataset was divided into training (3460 images), validation (433 images), and test sets (424 images) at an 8∶1∶1 ratio. An IMSU model was constructed by enhancing YOLOv8 with the EMA module. Both the baseline YOLOv8 and IMSU models were trained and validated, followed by performance evaluation on the test set for automated detection and segmentation of uterine structures. Metrics included precision, recall, and mean Average Precision (mAP) at two levels: mAP@50 and mAP@50-95.

Results

 For detection tasks, IMSU outperformed YOLOv8 in overall precision (0.920 vs 0.905), recall (0.939 vs 0.917), and mAP@50 (0.952 vs 0.933). Notably, cervical detection mAP@50 improved from 0.858 to 0.919 and recall increased from 0.778 to 0.842. In segmentation tasks, IMSU achieved higher precision (0.914 vs 0.905), recall (0.933 vs 0.915), mAP@50 (0.952 vs 0.930), and mAP@50-95 (0.677 vs 0.661). Cervical segmentation mAP@50-95 rose from 0.570 to 0.597.

Conclusion

 The EMA-enhanced IMSU significantly improves automated detection and segmentation accuracy for key uterine structures in mid-sagittal ultrasound images, providing technical support for intelligent quantitative uterine measurements and ultrasound-assisted diagnosis with promising clinical applicability.

图1 YOLOv8模型网络结构图。模型由骨干网络、颈部网络和网络输出头3个部分组成,骨干网络通过多个卷积层(Conv1至Conv5)提取特征,并在每个阶段后进行通道维度拼接(Concat);颈部网络(PANet)通过上采样(Upsample)和卷积模块(Conv7和Conv8)进一步融合不同尺度的特征;最终,网络输出头生成不同层级的预测结果(Head_Mask、Head_Box和Head_Cls),适用于多任务检测和分割任务
图2 高效多尺度注意力(EMA)机制的结构示意图。输入数据首先被分组处理,每组数据尺寸为C/G×H×W,其中C、H、W分别代表通道数、高度和宽度,G为分组数;在分组内部,数据通过X轴池化和Y轴池化进行特征提取,并经过拼接与1×1卷积层处理,随后通过Sigmoid激活函数生成权重;同时,3×3卷积层处理后的特征通过Softmax激活函数计算得到归一化的权重;这些权重与原始特征通过矩阵乘法结合,再与另一路径的直接矩阵乘法结果相加,最终通过Sigmoid激活函数输出调整后的特征图,尺寸保持为C×H×W;整个过程体现了EMA机制对不同特征通道和空间位置的动态加权,以增强模型对关键信息的关注度
图3 基于高效多尺度注意力(EMA)机制改进的YOLOv8检测及实例分割模型。将EMA加至颈部网络的关键位置,即在卷积层Conv7和Conv8之后,以及C2f模块与网络输出头之间;这样设计的目的在于让EMA充分发挥其在多尺度特征融合和注意力调整上的优势,为最终的预测结果提供更丰富和准确的特征表示
表1 YOLOv8标准模型与改进的IMSU对非妊娠期子宫正中矢状切面结构的检测结果
表2 YOLOv8标准模型与改进的IMSU对非妊娠期子宫正中矢状切面结构的分割结果
图4 超声图像中基于YOLOv8模型和子宫正中矢状切面智能模型(IMSU)对子宫宫体、内膜与宫颈的分割实例效果对比展示。图a~d、e~h、i~l分别为子宫宫体、内膜与宫颈结构的超声原始图像及专家标注、YOLOv8模型自动分割、IMSU自动分割的结果
图5 超声图像中基于YOLOv8模型和子宫正中矢状切面智能模型(IMSU)对子宫宫体、内膜与宫颈的分割结果进行测量的对比展示。图a~d、e~h、i~l分别为子宫宫体、内膜与宫颈结构的超声原始图像及专家测量、YOLOv8模型测量、IMSU测量的结果
1
AIUM practice parameter for the performance of ultrasound of the female pelvis, 2024 revision [J]. J Ultrasound Med, 2024, 43(11): E56-E64.
2
Du H, Zhang X, Zhang Y, et al. A review of robot-assisted ultrasound examination: Systems and technology [J]. Int J Med Robot, 2024, 20(4): e2660.
3
Thomassin-Naggara I, Rousset P, Touboul C, et al. Reasons why it is time to change imaging guidelines on endometriosis[J]. Eur Radiol, 2024, 34(9): 6175-6181.
4
Shiina T, Nightingale KR, Palmeri ML, et al. WFUMB guidelines and recommendations for clinical use of ultrasound elastography: Part 1: basic principles and terminology [J]. Ultrasound Med Biol, 2015, 41(5):1126-1147.
5
Fascilla FD, Cramarossa P, Cannone R, et al. Ultrasound diagnosis of uterine myomas [J]. Minerva Ginecol, 2016, 68(3): 297-312.
6
Dhombres F, Bonnard J, Bailly K, et al. Contributions of artificial intelligence reported in obstetrics and gynecology journals: systematic review [J]. J Med Internet Res, 2022, 24(4): e35465.
7
Mension E, Carmona F, Vannuccini S, et al. Clinical signs and diagnosis of fibroids from adolescence to menopause [J]. Fertil Steril, 2024, 122(1): 12-19.
8
张朝阳, 张上, 胡益民, 等. 动态聚焦多维注意力遥感弱小目标检测[J]. 无线电通信技术, 2025, 51(1): 196-209.
9
苏警. 基于深度学习的图像分类与目标检测算法研究[J]. 电脑编程技巧与维护, 2025, (5): 131-133.
10
杨仕伟, 南新元, 蔡鑫, 等. PAMNS-Net: 基于原型学习和自适应多分支融合的细胞核分割网络[J]. 激光与光电子学进展, 2025, 62(24): 3.
11
Ramachandran A, Clottey KD, Gordon A, et al. Quality assessment and systematic review of prediction and prevention of preterm birth: Quality assessment and systematic review of clinical practice guidelines using the AGREE Ⅱ framework [J]. Int J Gynaecol Obstet, 2024, 166(3): 932-942.
12
Melcer Y, Maymon R, Jauniaux E. Vasa previa: prenatal diagnosis and management [J]. Curr Opin Obstet Gyneco, 2018, 30(6): 385-391.
13
林小辉, 陈晓华. 阴道超声测量宫颈长度及子宫宫颈前角用于早产预测中的价值[J]. 中国医疗器械信息, 2024, 36(3): 36-38.
14
林举, 陈德高, 林玉玲, 等. 阴道超声测量子宫内膜厚度与异常子宫出血者组织病理学结果的相关性[J]. 中国卫生工程学, 2022, 21(4): 661-663.
15
Vitale SG, Riemma G, Haimovich S, et al. Risk of endometrial cancer in asymptomatic postmenopausal women in relation to ultrasonographic endometrial thickness: systematic review and diagnostic test accuracy meta-analysis [J]. Am J Obstet Gynecol, 2023, 228(1): 22-35.
[1] 傅小芳, 杨青翰, 孙昌琴, 豆梦杰, 胡峻溥, 孙灏, 吕发勤. 基于YOLO 11的肢体长骨骨折断端超声检测模型的临床价值[J/OL]. 中华医学超声杂志(电子版), 2025, 22(06): 541-546.
[2] 汪浪, 何怡华, 李征毅, 刘翠云, 颉剑锋, 陈健. 母胎超声参数对复发性流产孕妇不良妊娠结局的预测价值[J/OL]. 中华医学超声杂志(电子版), 2025, 22(06): 556-563.
[3] 何冠南, 谭莹, 路玉欢, 蒲斌, 扬水华, 张仁铁, 陈明, 石智红, 钟晓红, 陈曦, 燕柳屹, 李胜利. 人工智能在胎儿超声心动图标准切面质量控制中的多中心应用研究[J/OL]. 中华医学超声杂志(电子版), 2025, 22(05): 388-396.
[4] 纪韦琪, 李昆萍, 窦羡纳, 郭志伟, 魏淑如. 品管圈提升超声诊断子宫肌瘤准确率的应用效果[J/OL]. 中华医学超声杂志(电子版), 2025, 22(05): 427-433.
[5] 陈茵, 谭莹, 谭渤瀚, 何冠南, 王磊, 温昕, 朱巧珍, 梁博诚, 李胜利. 基于YOLO V8 的胎儿脐膨出超声智能质量评估与诊断[J/OL]. 中华医学超声杂志(电子版), 2025, 22(04): 305-310.
[6] 张克诚, 王瑞, 易磊, 周增丁. 烧烫伤创面深度评估模型HFNet 的构建及测试效果[J/OL]. 中华损伤与修复杂志(电子版), 2025, 20(03): 192-198.
[7] 郑仁杰, 张尊庶, 黄陈. 病理组学在胃癌诊治中的应用与挑战[J/OL]. 中华普通外科学文献(电子版), 2025, 19(04): 274-280.
[8] 王明媚, 李勇. 肾盂癌的影像诊断及进展[J/OL]. 中华腔镜泌尿外科杂志(电子版), 2025, 19(04): 412-417.
[9] 詹彧鸣, 张翔, 翁山耕. 人工智能在腹膜后肿瘤精准诊疗中的研究进展[J/OL]. 中华疝和腹壁外科杂志(电子版), 2025, 19(04): 371-376.
[10] 李媛媛, 李荣山. 机器学习:肾脏疾病研究与诊疗的新前沿[J/OL]. 中华肾病研究电子杂志, 2025, 14(04): 181-187.
[11] 王柯云, 孙雅佳, 李甜, 张钰哲, 郑颖, 张伟光, 王倩, 董哲毅. 糖尿病肾脏疾病早期发生风险预测模型的研究进展[J/OL]. 中华肾病研究电子杂志, 2025, 14(04): 218-225.
[12] 王玲洁, 王瑷萍, 李朝军, 丁跃有, 杨德业, 赵清, 崔兆强, 王京昆, 王宏宇. 心脏和血管健康技术创新研发策略专家共识(2024第一次报告,上海)[J/OL]. 中华临床医师杂志(电子版), 2025, 19(05): 323-336.
[13] 卢兴华, 张珊珊, 王文倩, 许寿星, 应斌, 陈晓婷, 朱玮. 肛塞消炎痛栓在经阴道四维超声子宫输卵管造影中的临床应用[J/OL]. 中华临床医师杂志(电子版), 2025, 19(04): 302-306.
[14] 卫焱星, 黄莉萍. 缩宫素在防治产后出血临床应用中的过去、现在和未来[J/OL]. 中华产科急救电子杂志, 2025, 14(03): 139-143.
[15] 杜培丽, 王志坚. 严重产后出血子宫切除的指征、时机及手术操作[J/OL]. 中华产科急救电子杂志, 2025, 14(03): 147-151.
阅读次数
全文


摘要


AI


AI小编
你好!我是《中华医学电子期刊资源库》AI小编,有什么可以帮您的吗?