基于注意力机制改进的子宫解剖结构检测与分割多任务模型的性能评估

doi:10.3877/cma.j.issn.1672-6448.2025.08.004

目的

以YOLOv8框架为基础，引入高效多尺度注意力（EMA）机制，构建子宫解剖结构检测与分割智能模型（IMSU），并评估其性能。

方法

回顾性收集2021年1月至2022年12月深圳市妇幼保健院共计4326张非妊娠子宫正中矢状切面超声图像，人工标注子宫宫体、宫颈及内膜3个关键解剖结构，建立图像数据库。按8∶1∶1比例划分为训练集（3460张）、验证集（433张）与测试集（424张），引入EMA机制对YOLOv8模型进行改进，构建IMSU。首先训练并验证原始YOLOv8标准模型及基于EMA模块改进的模型（IMSU），随后在测试集上对两种模型对子宫宫体、宫颈及内膜的自动结构检测与分割性能进行评估，评估指标包括精确率、召回率、平均精度（mAP）2个层级指标（mAP@50与mAP@50-95）。

结果

在3个关键结构自动检测任务中，IMSU的整体平均精确率（0.920 vs 0.905）、召回率（0.939 vs 0.917）及mAP@50（0.952 vs 0.933）均优于YOLOv8；尤其对宫颈的检测mAP@50值由0.858提升至0.919，召回率由0.778提升至0.842。在自动分割任务中，与YOLOv8相比，IMSU整体平均精确率由0.905提升至0.914，召回率由0.915提升至0.933，mAP@50由0.930提升至0.952，mAP@50-95亦从0.661提升至0.677；对宫颈的分割mAP@50-95由0.570提升至0.597。

结论

融合EMA机制的IMSU显著提升了非妊娠子宫正中矢状切面关键结构的自动检测性能与分割精度，为实现子宫结构的智能量化测量及超声辅助诊断提供了技术支持，具有良好的临床应用前景。

关键词: 子宫, 人工智能, 深度学习, 自动分割, 超声成像

Objective

To develop an intelligent model for uterine anatomical structure detection and segmentation (IMSU) by integrating the Efficient Multi-scale Attention (EMA) mechanism into the You Only Look Once version 8 (YOLOv8) framework and evaluate its performance.

Methods

A total of 4326 non-pregnant mid-sagittal uterine ultrasound images were retrospectively collected from Shenzhen Maternity and Child Healthcare Hospital (January 2021-December 2022). Three key anatomical structures (uterine corpus, cervix, and endometrium) were manually annotated to establish an image database. The dataset was divided into training (3460 images), validation (433 images), and test sets (424 images) at an 8∶1∶1 ratio. An IMSU model was constructed by enhancing YOLOv8 with the EMA module. Both the baseline YOLOv8 and IMSU models were trained and validated, followed by performance evaluation on the test set for automated detection and segmentation of uterine structures. Metrics included precision, recall, and mean Average Precision (mAP) at two levels: mAP@50 and mAP@50-95.

Results

For detection tasks, IMSU outperformed YOLOv8 in overall precision (0.920 vs 0.905), recall (0.939 vs 0.917), and mAP@50 (0.952 vs 0.933). Notably, cervical detection mAP@50 improved from 0.858 to 0.919 and recall increased from 0.778 to 0.842. In segmentation tasks, IMSU achieved higher precision (0.914 vs 0.905), recall (0.933 vs 0.915), mAP@50 (0.952 vs 0.930), and mAP@50-95 (0.677 vs 0.661). Cervical segmentation mAP@50-95 rose from 0.570 to 0.597.

Conclusion

The EMA-enhanced IMSU significantly improves automated detection and segmentation accuracy for key uterine structures in mid-sagittal ultrasound images, providing technical support for intelligent quantitative uterine measurements and ultrasound-assisted diagnosis with promising clinical applicability.

Key words: Uterus, Artificial intelligence, Deep learning, Automatic segmentation, Ultrasound imaging

图1 YOLOv8模型网络结构图。模型由骨干网络、颈部网络和网络输出头3个部分组成，骨干网络通过多个卷积层（Conv1至Conv5）提取特征，并在每个阶段后进行通道维度拼接（Concat）；颈部网络（PANet）通过上采样（Upsample）和卷积模块（Conv7和Conv8）进一步融合不同尺度的特征；最终，网络输出头生成不同层级的预测结果（Head_Mask、Head_Box和Head_Cls），适用于多任务检测和分割任务

图2 高效多尺度注意力（EMA）机制的结构示意图。输入数据首先被分组处理，每组数据尺寸为C/G×H×W，其中C、H、W分别代表通道数、高度和宽度，G为分组数；在分组内部，数据通过X轴池化和Y轴池化进行特征提取，并经过拼接与1×1卷积层处理，随后通过Sigmoid激活函数生成权重；同时，3×3卷积层处理后的特征通过Softmax激活函数计算得到归一化的权重；这些权重与原始特征通过矩阵乘法结合，再与另一路径的直接矩阵乘法结果相加，最终通过Sigmoid激活函数输出调整后的特征图，尺寸保持为C×H×W；整个过程体现了EMA机制对不同特征通道和空间位置的动态加权，以增强模型对关键信息的关注度

图3 基于高效多尺度注意力（EMA）机制改进的YOLOv8检测及实例分割模型。将EMA加至颈部网络的关键位置，即在卷积层Conv7和Conv8之后，以及C2f模块与网络输出头之间；这样设计的目的在于让EMA充分发挥其在多尺度特征融合和注意力调整上的优势，为最终的预测结果提供更丰富和准确的特征表示

表1 YOLOv8标准模型与改进的IMSU对非妊娠期子宫正中矢状切面结构的检测结果

解剖结构	检测精确率		检测召回率		检测mAP@50		检测mAP@50-95
解剖结构	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8
子宫宫体	0.980	0.969	0.992	0.992	0.991	0.994	0.912	0.884
子宫内膜	0.939	0.914	0.983	0.983	0.946	0.948	0.611	0.600
子宫宫颈	0.840	0.831	0.842	0.778	0.919	0.858	0.654	0.617
整体平均	0.920	0.905	0.939	0.917	0.952	0.933	0.726	0.700

表1 YOLOv8标准模型与改进的IMSU对非妊娠期子宫正中矢状切面结构的检测结果

解剖结构	检测精确率		检测召回率		检测mAP@50		检测mAP@50-95
解剖结构	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8
子宫宫体	0.980	0.969	0.992	0.992	0.991	0.994	0.912	0.884
子宫内膜	0.939	0.914	0.983	0.983	0.946	0.948	0.611	0.600
子宫宫颈	0.840	0.831	0.842	0.778	0.919	0.858	0.654	0.617
整体平均	0.920	0.905	0.939	0.917	0.952	0.933	0.726	0.700

表2 YOLOv8标准模型与改进的IMSU对非妊娠期子宫正中矢状切面结构的分割结果

解剖结构	分割精确率		分割召回率		分割mAP@50		分割mAP@50-95
解剖结构	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8
子宫宫体	0.980	0.980	0.992	0.992	0.991	0.994	0.897	0.895
子宫内膜	0.923	0.903	0.965	0.973	0.946	0.939	0.535	0.519
子宫宫颈	0.840	0.832	0.842	0.781	0.919	0.858	0.597	0.570
整体平均	0.914	0.905	0.933	0.915	0.952	0.930	0.677	0.661

表2 YOLOv8标准模型与改进的IMSU对非妊娠期子宫正中矢状切面结构的分割结果

解剖结构	分割精确率		分割召回率		分割mAP@50		分割mAP@50-95
解剖结构	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8	IMSU	YOLOv8
子宫宫体	0.980	0.980	0.992	0.992	0.991	0.994	0.897	0.895
子宫内膜	0.923	0.903	0.965	0.973	0.946	0.939	0.535	0.519
子宫宫颈	0.840	0.832	0.842	0.781	0.919	0.858	0.597	0.570
整体平均	0.914	0.905	0.933	0.915	0.952	0.930	0.677	0.661

图4 超声图像中基于YOLOv8模型和子宫正中矢状切面智能模型（IMSU）对子宫宫体、内膜与宫颈的分割实例效果对比展示。图a~d、e~h、i~l分别为子宫宫体、内膜与宫颈结构的超声原始图像及专家标注、YOLOv8模型自动分割、IMSU自动分割的结果

图5 超声图像中基于YOLOv8模型和子宫正中矢状切面智能模型（IMSU）对子宫宫体、内膜与宫颈的分割结果进行测量的对比展示。图a~d、e~h、i~l分别为子宫宫体、内膜与宫颈结构的超声原始图像及专家测量、YOLOv8模型测量、IMSU测量的结果

1	AIUM practice parameter for the performance of ultrasound of the female pelvis, 2024 revision [J]. J Ultrasound Med, 2024, 43(11): E56-E64.
2	Du H, Zhang X, Zhang Y, et al. A review of robot-assisted ultrasound examination: Systems and technology [J]. Int J Med Robot, 2024, 20(4): e2660.
3	Thomassin-Naggara I, Rousset P, Touboul C, et al. Reasons why it is time to change imaging guidelines on endometriosis[J]. Eur Radiol, 2024, 34(9): 6175-6181.
4	Shiina T, Nightingale KR, Palmeri ML, et al. WFUMB guidelines and recommendations for clinical use of ultrasound elastography: Part 1: basic principles and terminology [J]. Ultrasound Med Biol, 2015, 41(5):1126-1147.
5	Fascilla FD, Cramarossa P, Cannone R, et al. Ultrasound diagnosis of uterine myomas [J]. Minerva Ginecol, 2016, 68(3): 297-312.
6	Dhombres F, Bonnard J, Bailly K, et al. Contributions of artificial intelligence reported in obstetrics and gynecology journals: systematic review [J]. J Med Internet Res, 2022, 24(4): e35465.
7	Mension E, Carmona F, Vannuccini S, et al. Clinical signs and diagnosis of fibroids from adolescence to menopause [J]. Fertil Steril, 2024, 122(1): 12-19.
8	张朝阳, 张上, 胡益民, 等. 动态聚焦多维注意力遥感弱小目标检测[J]. 无线电通信技术, 2025, 51(1): 196-209.
9	苏警. 基于深度学习的图像分类与目标检测算法研究[J]. 电脑编程技巧与维护, 2025, (5): 131-133.
10	杨仕伟, 南新元, 蔡鑫, 等. PAMNS-Net: 基于原型学习和自适应多分支融合的细胞核分割网络[J]. 激光与光电子学进展, 2025, 62(24): 3.
11	Ramachandran A, Clottey KD, Gordon A, et al. Quality assessment and systematic review of prediction and prevention of preterm birth: Quality assessment and systematic review of clinical practice guidelines using the AGREE Ⅱ framework [J]. Int J Gynaecol Obstet, 2024, 166(3): 932-942.
12	Melcer Y, Maymon R, Jauniaux E. Vasa previa: prenatal diagnosis and management [J]. Curr Opin Obstet Gyneco, 2018, 30(6): 385-391.
13	林小辉, 陈晓华. 阴道超声测量宫颈长度及子宫宫颈前角用于早产预测中的价值[J]. 中国医疗器械信息, 2024, 36(3): 36-38.
14	林举, 陈德高, 林玉玲, 等. 阴道超声测量子宫内膜厚度与异常子宫出血者组织病理学结果的相关性[J]. 中国卫生工程学, 2022, 21(4): 661-663．
15	Vitale SG, Riemma G, Haimovich S, et al. Risk of endometrial cancer in asymptomatic postmenopausal women in relation to ultrasonographic endometrial thickness: systematic review and diagnostic test accuracy meta-analysis [J]. Am J Obstet Gynecol, 2023, 228(1): 22-35.

[1]	陈明朗, 许凯, 黄稚熙, 梁博诚, 贺杰, 黄海珊, 马微波, 谭莹, 邹志英, 刘晓棠, 彭桂艳, 陈家希, 钟晓红. MobileNetV4：面向产前超声的主动脉弓分支异常智能诊断研究[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(08): 711-720.
[2]	杨丽仙, 黄稚熙, 梁博诚, 欧阳淑媛, 陈明朗, 赵英丽, 马薇波, 缪敬, 王磊, 袁鹰. 基于产前时序超声数据的新生儿出生体重智能预测[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(08): 721-732.
[3]	康林立, 陈璐, 张天歌, 刘勤, 汪龙霞. 妊娠期卵巢子宫内膜异位囊肿蜕膜化的临床及超声影像学特征[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(08): 733-739.
[4]	刘晴晴, 俞劲, 徐玮泽, 张志伟, 潘晓华, 舒强, 叶菁菁. OBICnet图像分类模型在小儿先天性心脏病超声筛查中的应用价值[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(08): 754-760.
[5]	傅小芳, 杨青翰, 孙昌琴, 豆梦杰, 胡峻溥, 孙灏, 吕发勤. 基于YOLO 11的肢体长骨骨折断端超声检测模型的临床价值[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(06): 541-546.
[6]	汪浪, 何怡华, 李征毅, 刘翠云, 颉剑锋, 陈健. 母胎超声参数对复发性流产孕妇不良妊娠结局的预测价值[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(06): 556-563.
[7]	何冠南, 谭莹, 路玉欢, 蒲斌, 扬水华, 张仁铁, 陈明, 石智红, 钟晓红, 陈曦, 燕柳屹, 李胜利. 人工智能在胎儿超声心动图标准切面质量控制中的多中心应用研究[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(05): 388-396.
[8]	纪韦琪, 李昆萍, 窦羡纳, 郭志伟, 魏淑如. 品管圈提升超声诊断子宫肌瘤准确率的应用效果[J/OL]. 中华医学超声杂志（电子版）, 2025, 22(05): 427-433.
[9]	张家乐, 田璐, 伍国胜, 刘莹莹, 李志, 吴琼, 纪世召. 浅析人工智能在海战烧伤诊疗中的应用前景[J/OL]. 中华损伤与修复杂志(电子版), 2025, 20(05): 426-430.
[10]	石爽, 王艺, 史娜, 徐微. 多源信息融合下人工智能在慢性伤口管理中的精准应用与展望[J/OL]. 中华损伤与修复杂志(电子版), 2025, 20(05): 431-435.
[11]	左泽平, 宇洪涛, 朱金海, 钱俊杰, 徐秀民, 王一行, 梁朝朝, 郝宗耀. 智能无线腔镜在超微通道经皮肾镜取石术中的临床应用[J/OL]. 中华腔镜泌尿外科杂志(电子版), 2025, 19(06): 736-741.
[12]	周金玲, 张金伟, 曹迎九, 叶佳. 电刺激生物反馈联合凯格尔运动对Ⅱ~Ⅲ度子宫脱垂患者术后康复的影响[J/OL]. 中华疝和腹壁外科杂志(电子版), 2025, 19(05): 552-558.
[13]	谢钰嵘, 唐流康, 陈明政, 王伟利, 缪文学, 谢峰. 人工智能在肝胆外科临床教学中的应用[J/OL]. 中华肝脏外科手术学电子杂志, 2025, 14(06): 822-827.
[14]	鲁莽, 马晓璐, 沈浮, 王颢, 邵成伟, 张卫, 陆建平, 陆海迪. 基于磁共振的深度学习重建方法在直肠癌术前评估中的应用研究[J/OL]. 中华结直肠疾病电子杂志, 2025, 14(05): 445-456.
[15]	王玲洁, 王瑷萍, 李朝军, 丁跃有, 杨德业, 赵清, 崔兆强, 王京昆, 王宏宇. 心脏和血管健康技术创新研发策略专家共识（2024第一次报告，上海）[J/OL]. 中华临床医师杂志(电子版), 2025, 19(05): 323-336.

阅读次数

全文

摘要

选择文件类型/文献管理软件名称

选择包含的内容

Performance of an attention-enhanced multi-task model for uterine anatomical structure detection and segmentation

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

Performance of an attention-enhanced multi-task model for uterine anatomical structure detection and segmentation