基于产前时序超声数据的新生儿出生体重智能预测

杨丽仙; 黄稚熙; 梁博诚; 欧阳淑媛; 陈明朗; 赵英丽; 马薇波; 缪敬; 王磊; 袁鹰

doi:10.3877/cma.j.issn.1672-6448.2025.08.006

中华医学超声杂志（电子版） >

2025 , Vol. 22 >Issue 08: 721 - 732

DOI: https://doi.org/10.3877/cma.j.issn.1672-6448.2025.08.006

妇产科超声影像学

基于产前时序超声数据的新生儿出生体重智能预测

杨丽仙 ¹ ,
黄稚熙 ² ,
梁博诚 ³ ,
欧阳淑媛 ⁴ ,
陈明朗 ⁵ ,
赵英丽 ⁵ ,
马薇波 ⁶ ,
缪敬 ¹ ,
王磊 ⁷ ,
袁鹰 ^,³^,^†

展开

¹　650051　昆明，云南省妇幼保健院影像功能科
²　518028　南方医科大学妇女儿童医学中心深圳市妇幼保健院新生儿科
³　518028　南方医科大学妇女儿童医学中心深圳市妇幼保健院超声科
⁴　518028　南方医科大学妇女儿童医学中心深圳市妇幼保健院医学遗传中心
⁵　543002　梧州学院大数据与软件工程学院广西机器视觉与智能控制重点实验室
⁶　201318　上海健康医学院护理与健康管理学院
⁷　518053　香港大学深圳医院超声医学科

通信作者：

袁鹰，Email：lionliurabbityuan@163.com

Copy editor: 汪荣

收稿日期: 2025-06-07

网络出版日期: 2025-09-29

基金资助

云南省妇幼保健院妇幼健康研究项目(FYJK2022-06)

版权

未经授权，不得转载、摘编本刊文章，不得使用本刊的版式设计，除非特别声明，本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。本刊为电子期刊，以网刊形式出版。

收起

Intelligent prediction of neonatal birth weight based on prenatal sequential ultrasound dataYang

xian Li ¹ ,
Zhixi Huang ² ,
Bocheng Liang ³ ,
Shuyuan Ouyang ⁴ ,
Minglang Chen ⁵ ,
Yingli Zhao ⁵ ,
Weibo Ma ⁶ ,
Jing Miao ¹ ,
Lei Wang ⁷ ,
Ying Yuan ^,³^,^†

Expand

¹ Department of Imaging and Functional Medicine, Yunnan Maternal And Child Health Hospital, Kunming 650051, China
² Department of Neonatology, Shenzhen Maternity and Child Healthcare Hospital (Women and Children's Medical Center), Southern Medical University, Shenzhen 518028, China
³ Department of Ultrasound, Shenzhen Maternity and Child Healthcare Hospital (Women and Children's Medical Center), Southern Medical University, Shenzhen 518028, China
⁴ Medical Genetics Center, Shenzhen Maternity and Child Healthcare Hospital (Women and Children's Medical Center), Southern Medical University, Shenzhen 518028, China
⁵ School of Big Data and Software Engineering, Guangxi Key Laboratory of Machine Vision and Intelligent Control Wuzhou University, Wuzhou 543002, China
⁶ School of Nursing and Health Management, Shanghai University of Medicine and Health Sciences, Shanghai 201318, China
⁷ Department of Ultrasound Medicine, The University of Hong Kong-Shenzhen Hospital, Shenzhen 518053, China

Corresponding author:

Yuan Ying, Email: lionliurabbityuan@163.com

Received date: 2025-06-07

Online published: 2025-09-29

Copyright

No content published by the journals of Chinese Medical Association may be reproduced or abridged without authorization. Please do not use or copy the layout and design of the journals without permission.

All articles published represent the opinions of the authors, and do not reflect the official policy of the Chinese Medical Association or the Editorial Board, unless this is clearly specified.

Fold

摘要

目的

基于XGBoost算法建立新生儿出生体重预测模型，为临床围产期决策提供精准的智能工具。

方法

回顾性纳入2021年1月至2023年4月于云南省妇幼保健院接受常规产前检查并住院分娩的1018例单胎妊娠孕妇数据，包括孕妇基本信息，孕早期、孕中期、孕晚期及分娩前7 d内产前超声检查数据（共53项参数），新生儿数据（分娩时胎儿年龄周数和出生体重）。构建XGBoost预测模型，采用多维度评估指标（平均百分比误差、百分比误差标准差、平均绝对百分比误差、均方根误差、平均绝对误差及临床预测准确率），对比分析XGBoost模型与15种传统预测公式及LightGBM、Logistic、CatBoost 3种机器学习模型的预测性能；并进行模型特征重要性分析。

结果

XGBoost模型预测新生儿出生体重表现良好，百分比误差标准差8.21%、平均绝对百分比误差6.34%、均方根误差245.14 g、平均绝对误差194.39 g，误差指标均低于其他预测方法；临床准确率为71.54%，高于其他预测方法。与其他对比模型相比，XGBoost模型高估率为13.73%、低估率为14.71%，表现相对均衡，高估、低估概率均低于Logistic（23.53%/28.43%）、LightGBM（25.98%/24.02%）及CatBoost（17.16%/17.65%）。模型特征重要性分析筛选出21项关键特征，其中分娩前胎儿腹围、分娩孕龄及分娩前羊水最大深度为最重要的预测变量（特征重要性分数分别为35、22、8）。

结论

XGBoost模型成功构建了具有时序关联性的新生儿体重预测模型，其具备良好的稳定性与精准性，性能优于传统的以回归方程预测胎儿体重的方法。

关键词： 产前超声; 体重预测; 人工智能; XGBoost模型

本文引用格式

杨丽仙 , 黄稚熙 , 梁博诚 , 欧阳淑媛 , 陈明朗 , 赵英丽 , 马薇波 , 缪敬 , 王磊 , 袁鹰 . 基于产前时序超声数据的新生儿出生体重智能预测[J]. 中华医学超声杂志（电子版）, 2025 , 22(08) : 721 -732 . DOI: 10.3877/cma.j.issn.1672-6448.2025.08.006

Abstract

Objective

To establish a neonatal birth weight prediction model based on the XGBoost algorithm to provide a precise intelligent tool for clinical perinatal decision-making.

Methods

A retrospective analysis was conducted on data from 1018 singleton pregnancies who underwent routine prenatal examinations and delivered at the Yunnan Maternal and Child Health Hospital between January 2021 and April 2023. The dataset included maternal basic information, prenatal ultrasound examination parameters (53 variables in total) during the first, second, and third trimesters, as well as within 7 days before delivery, and neonatal data (gestational age at delivery and birth weight). An XGBoost prediction model was constructed, and its performance was evaluated using multidimensional metrics (mean percentage error, standard deviation of percentage error, mean absolute percentage error, root mean square error, mean absolute error, and clinical prediction accuracy). The XGBoost model was compared with 15 traditional prediction formulas and machine learning models (LightGBM, Logistic, and CatBoost). Feature importance analysis was also performed.

Results

The XGBoost model demonstrated strong performance in predicting neonatal birth weight, with a percentage error standard deviation of 8.21%, mean absolute percentage error of 6.34%, root mean square error of 245.14 g, and mean absolute error of 194.39 g, all error metrics were lower than those of other prediction methods. The clinical accuracy rate reached 71.54%, surpassing those of other predictive approaches. Compared to other benchmark models, the XGBoost model exhibited relatively balanced performance with an overestimation rate of 13.73% and an underestimation rate of 14.71%, both lower than those of Logistic (23.53%/28.43%), LightGBM (25.98%/24.02%), and CatBoost (17.16%/17.65%). Feature importance analysis identified 21 key predictors, among which fetal abdominal circumference before delivery, gestational age at delivery, and maximum amniotic fluid depth before delivery emerged as the most significant predictive variables (feature importance scores of 35, 22, and 8, respectively).

Conclusion

An XGBoost-based temporally correlated neonatal weight prediction model with robust stability and precision has been successfully constructed, and it outperforms traditional regression-based fetal weight prediction methods.

Key words： Prenatal ultrasound; Weight prediction; Artificial intelligence; XGBoost model

新生儿出生体重预测直接影响分娩决策和围产期管理效果，对改善母婴结局具有重要临床意义^［1］。全球流行病学研究显示，约23%（≥2300万例/年）的新生儿存在出生体重异常，直接导致40%~60%的新生儿死亡^［2］。目前，临床主要依赖分娩前7 d内超声参数进行预测，但平均绝对误差达±20%，且国际通用公式在中国人群中的适用性较差，亟待建立更精准的新生儿出生体重预测方法^［3］。

近年来，人工智能技术已从产前超声切面智能辅助识别与测量功能^［4］，发展到利用超声图像对胎儿组织结构进行实时检测^［5］、自动抓取标准切面及测量^［6］，其极大地提升了产前超声检查的效率与准确性，为胎儿健康监测带来了革命性的变化^［7］。目前，深度学习技术为新生儿出生体重预测提供了新方向^［8］，但现有的方法主要依赖单次超声检测的静态数据，忽视胎儿生长的动态连续性特征，且母体生化指标因检测复杂难以与超声数据同步整合，新生儿出生的体重预测仍面临挑战^［9］。本研究利用XGBoost模型^［10］，通过整合多维母体特征（基础体征、代谢疾病史）与连续超声监测数据（生长参数、多普勒血流动力学指标）的时序关联，为新生儿体重预测提供解决方案。

资料与方法

一、对象

回顾性纳入2021年1月至2023年4月于云南省妇幼保健院接受常规产前检查并住院分娩的3058例单胎妊娠孕妇数据。数据来源包括：（1）通过电子病历系统提取孕妇年龄、身高、孕前体重、分娩孕龄及新生儿出生体重、身长等基础信息；（2）基于医学影像存储与传输系统（picture archiving and communication system，PACS）获取孕早期（11~13⁺⁶周）胎儿颈项透明层（nuchal translucency，NT）超声产前筛查、孕中期（20~24⁺⁶周）超声产前筛查、孕晚期（28~34周）产前超声检查和分娩前7 d内产前超声检查共4次连续的超声检查资料。超声图像及数据采集严格遵循《超声产前筛查指南2022版》^［11］《中国产科超声检查指南（2019版）》标准^［12］及胎儿生物学参数超声参考值专家共识^［13］相关标准执行。具体胎儿血流测量方法如下：脐血流测量于脐带游离段取长轴切面，设置2~3 mm取样容积，保持超声声束与血流夹角<30°，排除胎儿呼吸及胎动干扰，采集≥3个形态一致的血流波形；大脑中动脉测量选取丘脑水平大脑轴向切面，以彩色多普勒显示Wilis环，将脉冲波多普勒取样框置于大脑中动脉近1/3处（颈内动脉起始点附近），调整声束与血流夹角趋近0°，记录3~10个稳定波形。

纳入标准：（1）单活胎妊娠；（2）孕龄11~41⁺⁶周在本院接受至少4次连续超声检查的患者；（3）胎儿无结构畸形及染色体异常；（4）临床资料完整。排除标准：（1）多胎妊娠；（2）超声提示胎儿水肿、重大结构畸形或死胎；（3）孕妇存在吸烟（>5支/d）、酗酒（乙醇摄入>20 g/d）或药物滥用史；（4）文本收集数据参数缺失>20%。依据纳入和排除标准，本研究最终纳入1018例孕妇数据。本研究经云南省妇幼保健院伦理委员会批准（批件号：LLYJ2024-202-089）。

二、方法

1. 数据收集：所有数据经加密存储及双人独立脱敏处理，移除姓名、身份证号等隐私标识符。具体纳入参数如下：（1）孕妇基本信息：年龄、孕次、产次、孕前体重、孕期增重、身高、是否存在妊娠期糖尿病。（2）产前超声检查数据：共包含53项参数（图1，表1）。（3）新生儿数据：分娩孕龄、出生体重。

显示原图|下载原图ZIP|生成PPT

图1 超声参数测量切面。图a为丘脑水平横切面（测量双顶径和头围）；图b为小脑水平横切面；图c为腹围水平横切面；图d为股骨长轴切面；图e为头臀长标准切面；图f为颈项透明层标准切面；图g为羊水最大深度测量切面；图h为脐动脉游离段血流频谱；图i为大脑中动脉血流频谱

表1 纳入的不同孕期产前超声检查参数

产前超声检查时间	纳入的超声检查数据参数
孕早期（11~13⁺⁶周）	GA，CRL，NT，FHR，MVP
孕中期（20~24⁺⁶周）	GA，BPD，HC，AC，FL，HL，CER，MVP，UA（Vmax、Vmin、S/D、RI、PI），MCA（Vmax、Vmin、S/D、PI、RI），FHR
孕晚期（28~34周）	GA，BPD，HC，AC，FL，MVP，UA（Vmax、Vmin、S/D、RI、PI），MCA（Vmax、Vmin、S/D、PI、RI），FHR
分娩前7 d内	GA，BPD，HC，AC，FL，MVP，UA（Vmax、Vmin、S/D、RI、PI），FHR

注：GA为孕龄；CRL为头臀长；NT为颈项透明层厚度；FHR为胎心率；MVP为羊水最大深度；BPD为双顶径；HC为头围；AC为腹围；FL为股骨长；HL为肱骨长；CER为小脑横径；UA为脐动脉；Vmax为最高流速；Vmin为最低流速；S/D为收缩期峰值流速与舒张末期流速比值；PI为搏动指数；RI为阻力指数；MCA为大脑中动脉

2.机器学习回归模型构建：采用XGBoost算法构建新生儿出生体重预测模型。模型训练采用的原始数据经录入后，使用pandas（2.2.3）和openpyxl（3.1.5）对原始数据集进行异常值剔除、多重插补法处理缺失值，并完成逻辑一致性校验（如孕龄-胎儿参数时序匹配）。

3.特征优化与跨模型效能验证：本研究通过真实出生体重与预测结果之间的误差计算损失函数，自动迭代优化更新模型参数，以达到最小化预测偏差并提升拟合精度。最终选取损失最小的参数组合保存为最优模型，以实现新生儿出生体重的最优预测。为验证模型的稳定性与临床价值，本研究结合LightGBM、Logistic、CatBoost主流机器学习方法进行对比分析，并与15种常用胎儿体重预测公式（表2）进行对比。

表2 15种预测胎儿体重的超声参数回归方程

序号	作者	计算公式
1	Hadlock I^[14]	$lg (W) = 1.3596 + 0.0064 × H C + 0.0424 × A C + 0.174 × F L + 0.00061 × B P D × A C − 0.00386 × A C × F L$
2	Hadlock Ⅳ^[14]	$lg (W) = 1.326 − 0.00326 × A C × F L + 0.0107 × H L + 0.0438 × A C + 0.158 × F L$
3	Hadlock Ⅱ^[14]	$lg (W) = 1.304 + 0.05281 × A C + 0.1938 × F L − 0.004 × A C × F L$
4	Hadlock Ⅲ^[14]	$lg (W) = 1.335 − 0.0034 × A C × F L + 0.0316 × B P D + 0.0457 × A C + 0.1623 × F L$
5	Ott^[14]	$lg (W) = 0.04355 × H C + 0.05394 × A C − 0.0008582 × H C × A C + 1.2504 × F L A C + 0.9339$
6	Combs^[14]	$lg (W) = 0.23718 × A C 2 × F L + 0.03312 × H C 2$
7	Bernstein^[15]	$lg (W) = 1.42482 + 0.01165 × H C + 0.03949 × A C − 0.00028 × A C 2 + 0.14147 × F L − 0.00662 × F L 2$
8	Hadlock V^[14]	$lg (W) = 1.5662 − 0.0108 H C + 0.0468 × A C + 0.171 × F L + 0.00034 × H C 2 − 0.003685 × A C × F L$
9	Jordaan^[16]	$lg (W) = 2.3231 + 0.02904 × A C + 0.0079 × H C − 0.0058 × B P D$
10	ShepardⅡ^[14]	$lg (W) = 1.2508 + 0.166 × B P D + 0.046 × A C − 0.002646 × A C × B P D$
11	Johnson^[15]	$lg (W) = 1.21633 + 0.06076 × H C − 0.00075 × A C 2 + 0.02107 × A C + 0.05261 × F L$
12	Merz^[14]	$W = − 3200.40479 + 57.07186 × A C + 15.90391 × B P D 2$
13	Warsof^[14]	$lg (W) = 1.467 + 0.144 × B P D + 0.032 × A C − 0.000111 × B P D 2 × A C$
14	Campbell^[17]	$l n (W) = (− 4.564 + 0.282 × A C − 0.00331 × A C 2) + 6.9078$
15	Stirnemann^[18]	$l n (W) = 5.084820 − 54.06633 × (A C 100) 3 − 95.80076 × (A C 100 ) 3 × l n (A C 100 ) + 3.136370 × (H C 100 )$

注：HC为头围；AC为腹围；FL为股骨长；BPD为双顶径；W为胎儿体重

4．模型训练及实验参数：本研究中所有机器学习模型训练与验证均在配置为Windows 11、Intel® Core™ i7-10870H @ 2.20 GHz、16 GB RAM 及单块 NVIDIA RTX 3060 GPU（6144 MiB）的本地工作站上完成。机器学习模型初始采用默认超参数设置（表3）。

表3 各机器学习模型的超参数配置

超参数	Logistic	CatBoostr	LightGBM	XGBoost
损失函数	-	-	gbdt	gbtree
提升器类型	reg:gamma	RMSE	regression	reg:gamma
树的最大深度	-	3	3	100
正则项系数	1	2	l2	2
训练样本采样率	-	0.7	0.9	0.7
特征采样率	-	-	0.8	0.7
随机种子	200	200	200	1000
分裂阈值	-	-	0.05	0.1

注：-代表模型不需要提供的参数或者使用模型的默认参数

5.统计学分析：使用Python（3.9.20）中的pandas、openpyxl库进行统计学分析。所用指标包括平均百分比误差（mean percentage error，MPE）、百分比误差标准差（percentage error standard deviation，SDPE）、平均绝对百分比误差（mean absolute percentage error，MAPE）、绝对百分比误差标准差（absolute percentage error standard deviation，SDAPE）、平均绝对误差（mean absolute error，MAE）、绝对误差标准差（standard deviation of absolute error，SDAE）、均方根误差（root mean square error，RMSE）、预测准确率^［19］。本研究认为预测体重与实际出生体重之差<250 g即为预测准确，准确率由准确预测样本除以总体计算，即满足误差<250 g的样本的占比^{［20,21,22］}。利用机器模型内置的特征评分机制提取各特征的重要性，并采用Matplotlib（3.9.2）库绘制特征重要性柱状图。本研究的技术路线图见图2。

显示原图|下载原图ZIP|生成PPT

图2 研究技术路线图

注：RMSE为均方根误差；MAE为平均绝对误差；MAPE为平均绝对百分比误差

结果

一、数据分布

本研究最终纳入1018例研究对象，其中妊娠期糖尿病31例，非妊娠期糖尿病987例。将样本按8:2的比例划分为训练集814例与验证集204例。各项指标数据分布范围见表4，表5，表6，表7，表8，表9。

表4 1018例孕妇基本信息

基本信息	均值	变异系数	数据范围
孕妇年龄（岁）	30.92±4.22	0.13	19~46
孕次	2（1，3）	0.60	1~10
产次	1（0，1）	1.23	0~5
孕前体重（kg）	55.00±8.75	0.15	35.0~96.5
孕期增重（kg)	12.75±4.12	0.32	-2.7~29.0
身高（cm）	157.78±5.59	0.03	137~176

注：表格中符合正态分布的计量资料以

x ¯ ± s

表示；偏态分布的计量资料以M（Q₁，Q₃）表示

表5 孕早期（11~13⁺⁶周）超声产前筛查参数（n=1018）

参数	均数±标准差	变异系数	数据范围
GA（d）	88.66±4.51	0.05	69~100
CRL（cm）	6.34±0.70	0.11	4.5~8.4
NT（cm）	0.16±0.08	0.52	0.08~0.35
FHR	161.12±10.27	0.06	133~188
MVP（cm）	3.61±0.73	0.20	1.5~6.0

注：GA为检查孕龄；CRL为头臀长；NT为颈项透明层厚度；FHR为胎心率；MVP为羊水最大深度

表6 孕中期（20~24⁺⁶周）超声产前筛查参数（n=1018）

参数	均数±标准差	变异系数	数据范围
GA（d）	158.49±5.63	0.03	132~187
BPD（cm）	5.37±0.30	0.05	4.47~6.81
HC（cm）	19.99±0.94	0.04	17.36~27.90
AC（cm）	32.66±5.34	16.34	14.69~21.70
FL（cm）	3.83±0.94	0.24	3.09~4.70
HL（cm）	3.65±1.19	0.32	2.39~4.50
CER（cm）	2.33±0.13	0.05	1.89~2.95
MVP（cm）	4.21±1.26	0.29	2.23~8.20
UA Vmax（cm/s）	32.24±6.68	0.20	14.39~60.19
UA Vmin（cm/s）	10.04±2.43	0.24	3.80~32.72
UA S/D	3.26±0.62	0.19	0.80~13.11
UA RI	0.67±0.08	0.12	0.30~2.70
UA PI	1.14±0.18	0.16	0.46~1.88
FHR	149.28±7.72	0.05	102~178
MCA Vmax（cm/s）	27.80±5.63	0.20	12.06~46.16
MCA Vmin（cm/s）	5.85±1.58	0.27	2.49~15.60
MCA S/D	4.55±1.07	0.23	2.25~10.47
MCA RI	0.77±0.29	0.37	0.43~0.89
MCA PI	1.58±0.31	0.20	0.73~2.49

注：GA为孕龄；BPD为双顶径；HC为头围；AC为腹围；FL为股骨长；HL为肱骨长；CER为小脑横径；MVP为羊水最大深度；UA为脐动脉；Vmax为最高流速；Vmin为最低流速；S/D为收缩期峰值流速与舒张末期流速比值；PI为搏动指数；RI为阻力指数；FHR为胎儿心率；MCA为大脑中动脉

表7 孕晚期（28~34周）常规产前超声参数（n=1018）

参数	均数±标准差	变异系数	数据范围
GA（d）	210.28±8.87	0.04	168~240
BPD（cm）	7.64±0.39	0.05	6.44~8.90
HC（cm）	27.72±1.41	0.05	24.10~31.48
AC（cm）	25.49±1.53	0.06	20.80~31.50
FL（cm）	5.67±0.62	0.11	4.69~6.59
MVP（cm）	4.29±0.88	0.20	2.19~9.00
UA Vmax(cm/s)	40.97±12.61	0.30	16.46~75.40
UA Vmin(cm/s)	15.40±4.38	0.28	6.43~31.81
UA S/D	2.72±0.45	0.16	1.40~4.55
UA RI	0.67±0.07	0.11	0.30~0.90
UA PI	0.96±0.26	0.27	0.50~1.53
FHR	144.13±7.92	0.05	113~174
MCA Vmax(cm/s)	37.78±8.32	0.22	14.00~63.21
MCA Vmin(cm/s)	7.14±2.56	0.36	2.10~20.00
MCA S/D	5.42±1.49	0.27	1.70~10.20
MCA RI	0.79±0.09	0.11	0.40~0.98
MCA PI	1.79±0.29	0.16	0.60~2.71

注：GA为孕龄；BPD为双顶径；HC为头围；AC为腹围；FL为股骨长；MVP为羊水最大深度；UA为脐动脉；Vmax为最高流速；Vmin为最低流速；S/D为收缩期峰值流速与舒张末期流速比值；PI为搏动指数；RI为阻力指数；FHR为胎儿心率；MCA为大脑中动脉

表8 分娩前7 d内的常规产前超声参数（n=1018）

参数	均数±标准差	变异系数	数据范围
GA（d）	270.04±10.76	0.03	218~290
BPD（cm）	9.28±2.13	0.23	7.40~10.46
HC（cm）	32.95±8.23	0.25	26.97~36.60
AC（cm）	33.31±1.68	0.05	21.70~39.50
FL（cm）	7.27±2.01	0.27	5.79~8.00
MVP（cm）	4.17±1.77	0.42	0.90~9.60
UA Vmax（cm/s）	46.44±11.79	0.25	19.70~89.50
UA Vmin（cm/s）	20.72±5.89	0.28	7.36~44.60
UA S/D	2.27±0.39	0.17	1.40~4.190
UA RI	0.55±0.06	0.11	0.30~0.80
UA PI	0.83±0.14	0.17	0.40~1.22
FHR	141.70±9.71	0.06	111~189

注：GA为孕龄；BPD为双顶径；HC为头围；AC为腹围；FL为股骨长；MVP为羊水最大深度；UA为脐动脉；Vmax为最高流速；Vmin为最低流速；S/D为收缩期峰值流速与舒张末期流速比值；PI为搏动指数；RI为阻力指数；FHR为胎儿心率

表9 新生儿相关信息（n=1018）

资料	均数±标准差	变异系数	数据范围
分娩孕龄（d）	275.17±8.66	0.03	219~292
新生儿体重（g）	3167.90±402.60	0.12	1200~4500

二、高估与低估概率分析

15个常用估算公式及4种预测模型的高估率范围为6.37%（weight8）~32.84%（weight14），低估率范围为3.43%（weight5）~57.84%（weight8）（图3）。其中，weight8 高估率最低（6.37%）但低估率最高（57.84%）；weight14高估率最高（32.84%）而低估率较低（5.39%）。与其他对比模型相比，XGBoost模型高估率为13.73%、低估率为14.71%，表现相对均衡，且高估、低估概率均低于Logistic（23.53%/28.43%）、LightGBM（25.98%/24.02%）及CatBoost（17.16%/17.65%）。

显示原图|下载原图ZIP|生成PPT

图3 新生儿体重预测模型及传统估算公式的高估与低估概率分析图

注：weight1至weight15为15种传统胎儿体重预测公式分别为：Hadlock I、Hadlock Ⅳ、Hadlock Ⅱ、Hadlock Ⅲ、Ott、Combs、Bernstein、Hadlock V、Jordaan、ShepardⅡ、Johnson、Merz、Warsof、Campbell、Stirnemann；XGBoost、CatBoost、LightGBM、Logistic为4种预测模型

三、传统公式及不同预测模型的误差指标和预测准确率分析

除XGBoost算法，作为参照，本研究还采用国内外常用的15种胎儿体重预测公式以及LightGBM、Logistic和CatBoost 3种机器学习模型对出生体重进行预测。

1. MPE：MPE反映预测值相对真实值的系统偏倚方向（正值为高估，负值为低估）。15个传统公式及4种预测模型的MPE范围为-5.80%~12.76%，其中XGBoost模型的MPE为0.53%，趋近零偏倚（图4），表明XGBoost模型预测结果未出现显著的系统性偏差，其预测值分布紧密围绕真实值。

显示原图|下载原图ZIP|生成PPT

图4 新生儿体重预测模型及传统估算公式的平均误差百分比

2.SDPE、MAPE：SDPE、MAPE均反映预测结果的稳定性（波动性及离散程度）。数值越低，说明预测误差的波动性越小、离散程度越低，预测结果越稳定；反之亦反。其中XGBoost的SDPE及MAPE分别为8.21%、6.34%，二者在对比的模型中均居最低水平（图5、图6），表明XGBoost对于新生儿出生体重的预测误差波动较小，预测结果稳健可靠。

显示原图|下载原图ZIP|生成PPT

图5 新生儿体重预测模型及传统估算公式的百分比误差标准差

显示原图|下载原图ZIP|生成PPT

图6 新生儿体重预测模型及传统估算公式的平均绝对百分比误差

3.SDAPE：SDAPE评估预测误差的相对离散度（值越低表明模型稳定性越强）。XGBoost的SDAPE为5.25%，在对比的模型中最低（图7），表明模型预测稳定性好。

显示原图|下载原图ZIP|生成PPT

图7 新生儿体重预测模型及传统估算公式的绝对百分比误差标准差

4.SDAE、RMSE、MAE：SDAE、RMSE、MAE量化了预测误差（波动性及误差大小）。XGBoost的SADE、RMSE及MAE分别为149.35、245.14、194.39 g，三者在对比的模型中均居最低水平（图8，图9，图10）。

显示原图|下载原图ZIP|生成PPT

图8 新生儿体重预测模型及传统估算公式的绝对误差标准差

显示原图|下载原图ZIP|生成PPT

图9 新生儿体重预测模型及传统估算公式的均方根误差

显示原图|下载原图ZIP|生成PPT

图10 新生儿体重预测模型及传统估算公式的平均绝对误差

5.预测准确率：各模型预测准确率存在差异。其中，XGBoost的预测准确率为71.54%，在对比的所有模型中居首位（图11）。

显示原图|下载原图ZIP|生成PPT

图11 新生儿体重预测模型及传统估算公式的预测准确率

四、特征重要性分析

特征重要性分析筛选出21项对新生儿出生体重有价值的预测指标（图12），包括不同孕期的羊水深度、血流动力学指标及肢体发育参数。分娩前7 d内超声检查获取的腹围特征重要性分数为35，位居各项指标评分的首位；其次为孕龄，特征重要性分数为22。

显示原图|下载原图ZIP|生成PPT

图12 特征重要性分析筛选出的21项对新生儿出生体重有价值的预测指标

注：AC为腹围；GA为孕龄；MVP为羊水最大深度；FL为股骨长；HC为头围；BPD为双顶径；MCA为大脑中动脉；S/D为收缩期峰值流速与舒张末期流速比值；UA为脐动脉；RI为阻力指数；PI为搏动指数；Vmin为最低流速；HL为肱骨长

讨论

本研究基于XGBoost算法构建了新生儿出生体重智能预测模型，通过整合4个关键妊娠时间窗：孕早期（11~13⁺⁶周）、孕中期（20~24⁺⁶周）、孕晚期（28~34周）及分娩前7 d的超声数据，突破传统单时间点预测局限，纳入了20项结构参数和29项血流动力学指标，实现了新生儿出生体重的预测。这种连续的超声参数的纳入，克服了传统单一孕龄预测的局限性。将孕早期至孕晚期的多阶段超声参数整合纳入模型，是兼具理论深度与实践价值的创新尝试。在模型性能层面，借助XGBoost算法对多阶段特征的深度挖掘，有效捕捉胎儿生长轨迹，使预测准确率显著提升；从医学解释维度，孕早期及孕中期参数为探究胎儿发育规律提供了时间序列视角^［23-24］，揭示了个体发育起点差异对最终体重的潜在影响；在临床应用领域，精准的出生体重预测能够助力早期风险识别，推动产检、营养干预及分娩管理的个性化升级，改善围产期母婴健康结局。此外，本研究纳入孕中期脐动脉的阻力指数与孕晚期大脑中动脉的收缩期峰值流速与舒张末期流速比值等彩色多普勒参数，可更敏感地捕捉胎盘功能代偿性变化对胎儿体重的影响。

在模型验证阶段，XGBoost算法展现出卓越的预测性能：其SDPE为8.21%，较最优传统方法（8.98%）降低0.77%；MAPE为6.34%，较最优传统方法（6.99%）降低0.65%；SDAPE为5.25%，较最优传统对照组（6.09%）降低0.84%。尤其值得注意的是，模型总体预测准确率达到71.54%，较传统方法的最佳方法（66.80%）提升了4.74%，这一改进意味着在每100例新生儿中，约有5例原本被误分类的体重评估（正常/巨大儿/低体重儿）能够得到准确修正，充分证明了机器学习算法在处理多维医学预测问题时的显著优势^［25］。

相较于LightGBM（RMSE 407.38 g）、Logistic（RMSE 412.24 g）等机器学习模型，XGBoost（RMSE 245.14 g）展现出的优势可归因于其梯度提升算法对“多时间窗+多模态数据”的非线性拟合能力：有效解析了“孕早期NT+孕中期股骨长+孕晚期腹围+分娩前羊水最大深度”的复杂关联；而LightGBM的直方图算法在处理小样本时序数据时易丢失细节特征，Logistic回归则受限于其线性假设，难以刻画脐动脉阻力指数与大脑中动脉收缩期峰值流速与舒张末期流速比值等血流参数的动态平衡关系。

从算法特性看，XGBoost在处理胎儿体重预测的多维非线性关系中表现出独特优势。传统线性回归受限于变量线性假设，难以解析腹围、股骨长等生长参数与孕龄的动态交互。XGBoost则通过梯度提升决策树的集成学习框架，实现腹围、孕龄等核心指标的自动识别。

腹围作为直接反映胎儿营养状态与肝脏发育情况的指标，其在预测中呈现的主导作用，与 “腹围是体重预测最核心的参数”这一已有研究结论一致^［26］。孕龄的显著影响则符合胎儿生长曲线的阶段性规律，提示动态监测的必要性^［27］。特征重要性分析不仅确认了经典超声指标（如腹围、孕龄）的核心地位，还拓展了血流动力学参数对新生儿出生体重预测的价值。研究结果显示，孕晚期脐动脉阻力指数与大脑中动脉收缩期峰值流速与舒张末期流速比值等参数的特征重要性评分之和达到10，提示胎盘血流动力学参数对胎儿体重具有较高的预测价值和协同调控作用，可能共同构成了影响胎儿生长发育的关键血流动力学组合。这一发现表明，胎盘循环阻力对胎儿体重的调控作用在既往研究中可能被长期低估^［28］。

然而，受限于单中心回顾性研究设计，亚组分析难以深入开展（如糖尿病和非糖尿病组），尤其是针对高危妊娠群体的精准研究面临挑战。此外，样本来源单一导致覆盖人群多样性不足，难以反映不同地域、种族及生活环境下的差异；父亲遗传信息缺失，阻碍了对胎儿生长发育遗传机制的全面解析；巨大儿、小于胎龄儿及妊娠期糖尿病等关键临床样本占比不足，一定程度削弱了研究成果在复杂临床场景的适用性。

因此，未来研究可从多维度进行优化。在研究设计层面，积极开展多中心协作，广泛采集不同地区临床数据，扩大样本规模以提升研究普适性，同时补充父亲遗传信息采集，完善遗传机制研究的数据基础；可引入特征交互项分析、SHAP交互值解读等方法，深入探索胎儿生长指标间的潜在协同效应。在样本收集方面，制定靶向招募策略，着重增加特殊临床群体样本比例，并结合前瞻性队列研究，动态监测孕期指标变化，围绕临床决策流程收集数据，切实推动智能化预测工具在产前保健领域的临床转化与广泛应用。

综上所述，XGBoost模型通过融合4次连续的超声测值及母亲特征数据，提升了新生儿出生体重预测的准确性，性能优于15种传统公式及LightGBM等算法，在新生儿体重预测等相关临床应用场景中，具备更好的稳定性与精准性。特征分析揭示腹围、孕龄、羊水最大深度为核心预测因子，血流动力学参数可作为重要补充。尽管存在单中心数据局限，该模型仍为临床提供了“关键指标优先、多维度整合”的预测框架，有助于早期识别胎儿生长异常，优化分娩决策。未来需通过多中心研究与技术创新，推动智能化预测工具在产前保健中的普及应用。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

1	Lubrano C, Taricco E, Coco C, et al. Perinatal and neonatal outcomes in fetal growth restriction and small for gestational age[J]. J Clin Med, 2022, 11(10): 2729.

2	Lu Y, Fu X, Chen F, et al. Prediction of fetal weight at varying gestational age in the absence of ultrasound examination using ensemble learning[J]. Artif Intell Med, 2020, 102: 101748.

3	Ma J, Cheng D, Zhang Z, et al. Evaluating the accuracy of sonographic fetal weight estimations using the Hadlock IV formula in a Chinese population[J]. Quant Imaging Med Surg, 2023, 13(6): 3726-3734.

4	Pu B, Li K, Li S, et al. Automatic fetal ultrasound standard plane recognition based on deep learning and ⅡoT[J]. IEEE Transactions on Industrial Informatics, 2021, 17(11): 7771-7780.

5	Pu B, Li K, Chen J, et al. HFSCCD: A hybrid neural network for fetal standard cardiac cycle detection in ultrasound videos[J]. IEEE J Biomed Health Inform, 2024, 28(5): 2943-2954.

6	He J, Yang L, Liang B, et al. Fetal cardiac ultrasound standard section detection model based on multitask learning and mixed attention mechanism[J]. Neurocomputing, 2024, 579: 127443.

7	石智红,李胜利. 人工智能在产前超声中的应用和研究进展[J/OL]. 中华医学超声杂志 (电子版), 2023, 20(1): 113-117.

8	谢子勋, 陈億龙, 宋维, 等. 融合科学智算的高危产妇妊娠结果评估模型及其应用研究[J]. 人工智能, 2024, (5): 109-125.

9	李昆, 柴玉梅, 赵红领, 等. 基于深度神经网络的胎儿体重预测[J]. 计算机科学, 2016, 43(z2): 73-76,82.

10	Caramês ETS, de Moraes-Neto VF, Bertozzi BG, et al. Identification of Fusarium sambucinum species complex by surface-enhanced Raman spectroscopy and XGBoost algorithm[J]. Food Chem, 2025, 480: 143848.

11	中华医学会超声医学分会妇产超声学组, 国家卫生健康委妇幼司全国产前诊断专家组医学影像组. 超声产前筛查指南 [J]. 中华超声影像学杂志, 2022, 31(1): 1-12.

12	任芸芸, 谢洪宁, 杨敏, 等. 中国产科超声检查指南[M].北京: 人民卫生出版社, 2019.

13	中华预防医学会出生缺陷预防与控制专业委员会产前超声诊断学组, 中华医学会超声医学分会妇产学组. 胎儿生物学参数超声参考值专家共识: 估测胎儿体重[J/OL]. 中华医学超声杂志(电子版), 2024, 21(8): 762-765.

14	Hammami A, Mazer Zumaeta A, Syngelaki A, et al. Ultrasonographic estimation of fetal weight: development of new model and assessment of performance of previous models[J]. Ultrasound Obstet Gynecol, 2018, 52(1): 35-43.

15	Lanowski JS, Lanowski G, Schippert C, et al. Ultrasound versus clinical examination to estimate fetal weight at term[J]. Geburtshilfe Frauenheilkd, 2017, 77(3): 276-283.

16	Eze CU, Egwuanumku KI, Agwuna KK, et al. Validity of common ultrasound methods of fetal weight estimation in late pregnancy among women in Kwale, Niger Delta region, Nigeria[J]. Afr Health Sci, 2015, 15(1): 206-216.

17	Campbell WA, Vintzileos AM, Neckles S, et al. Use of the femur length to estimate fetal weight in premature infants: preliminary results[J]. J Ultrasound Med, 1985, 4(11): 583-590.

18	Stirnemann J, Villar J, Salomon LJ, et al. International estimated fetal weight standards of the INTERGROWTH-21(st) Project[J]. Ultrasound Obstet Gynecol, 2017, 49(4): 478-486.

19	De Myttenaere A, Golden B, Le Grand B, et al. Using the mean absolute percentage error for regression models[DB/OL]. (2015-06-12)[2025-06-07].

20	林丽辉, 李国香, 刘良刚, 等. 应用超声胎儿测量系统预测胎儿体重的符合率研究[J]. 影像研究与医学应用, 2021, 5(15): 34-35.

21	王海红, 韩冰, 张慧. 影响超声估计胎儿体重准确性因素的研究进展[J]. 中华围产医学杂志, 2018, 21(10): 706-711.

22	Nash CM, Woolcott C, O'connell C, et al. Optimal timing of prenatal ultrasound in predicting birth weight in diabetic pregnancies[J]. J Obstet Gynaecol Can, 2020, 42(1): 48-53.

23	Dias T, Thilaganathan B. Is first-trimester crown-rump length associated with birthweight?[J]. BJOG, 2012, 119(3): 380.

24	Wang B, Zhang C. Risk evaluation of fetal growth restriction by combined screening in early and mid-pregnancy[J]. Pak J Med Sci, 2020, 36(7): 1708-1713.

25	蒋雯音.机器学习方法在早产和低出生体重儿预测中的应用[J]. 医学信息学杂志, 2019, 40(4): 59-63.

26	Plotka SS, Grzeszczyk MK, Szenejko PI, et al. Deep learning for estimation of fetal weight throughout the pregnancy from fetal abdominal ultrasound[J]. Am J Obstet Gynecol MFM, 2023, 5(12): 101182.

27	郭长胜. 胎儿宫内发育迟缓的危险因素及孕期运动对其干预作用的研究进展[J]. 儿童保健杂志, 2022, 30(10): 1091.

28	Ishrat S, Rahman MW, Rahman MR, et al. Leptin concentrations in maternal and umbilical cord blood in relation to maternal weight, birth weight and weight of the placenta[J]. Bangladesh Journal of Obstetrics & Gynaecology, 2008, 23(1): 3-7.

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

资料与方法

一、对象

二、方法

表1 纳入的不同孕期产前超声检查参数

表2 15种预测胎儿体重的超声参数回归方程

表3 各机器学习模型的超参数配置

图2 研究技术路线图

结果

一、数据分布

表4 1018例孕妇基本信息

表5 孕早期（11~13+6周）超声产前筛查参数（n=1018）

表6 孕中期（20~24+6周）超声产前筛查参数（n=1018）

表7 孕晚期（28~34周）常规产前超声参数（n=1018）

表8 分娩前7 d内的常规产前超声参数（n=1018）

表9 新生儿相关信息（n=1018）

二、高估与低估概率分析

图3 新生儿体重预测模型及传统估算公式的高估与低估概率分析图

三、传统公式及不同预测模型的误差指标和预测准确率分析

图4 新生儿体重预测模型及传统估算公式的平均误差百分比

图5 新生儿体重预测模型及传统估算公式的百分比误差标准差

图6 新生儿体重预测模型及传统估算公式的平均绝对百分比误差

图7 新生儿体重预测模型及传统估算公式的绝对百分比误差标准差

图8 新生儿体重预测模型及传统估算公式的绝对误差标准差

图9 新生儿体重预测模型及传统估算公式的均方根误差

图10 新生儿体重预测模型及传统估算公式的平均绝对误差

图11 新生儿体重预测模型及传统估算公式的预测准确率

四、特征重要性分析

图12 特征重要性分析筛选出的21项对新生儿出生体重有价值的预测指标

讨论

参考文献

表5 孕早期（11~13⁺⁶周）超声产前筛查参数（n=1018）

表6 孕中期（20~24⁺⁶周）超声产前筛查参数（n=1018）