2025 , Vol. 22 >Issue 08: 721 - 732
DOI: https://doi.org/10.3877/cma.j.issn.1672-6448.2025.08.006
基于产前时序超声数据的新生儿出生体重智能预测
通信作者:
袁鹰,Email:lionliurabbityuan@163.comCopy editor: 汪荣
收稿日期: 2025-06-07
网络出版日期: 2025-09-29
基金资助
云南省妇幼保健院妇幼健康研究项目(FYJK2022-06)
版权
Intelligent prediction of neonatal birth weight based on prenatal sequential ultrasound dataYang
Corresponding author:
Yuan Ying, Email: lionliurabbityuan@163.comReceived date: 2025-06-07
Online published: 2025-09-29
Copyright
基于XGBoost算法建立新生儿出生体重预测模型,为临床围产期决策提供精准的智能工具。
回顾性纳入2021年1月至2023年4月于云南省妇幼保健院接受常规产前检查并住院分娩的1018例单胎妊娠孕妇数据,包括孕妇基本信息,孕早期、孕中期、孕晚期及分娩前7 d内产前超声检查数据(共53项参数),新生儿数据(分娩时胎儿年龄周数和出生体重)。构建XGBoost预测模型,采用多维度评估指标(平均百分比误差、百分比误差标准差、平均绝对百分比误差、均方根误差、平均绝对误差及临床预测准确率),对比分析XGBoost模型与15种传统预测公式及LightGBM、Logistic、CatBoost 3种机器学习模型的预测性能;并进行模型特征重要性分析。
XGBoost模型预测新生儿出生体重表现良好,百分比误差标准差8.21%、平均绝对百分比误差6.34%、均方根误差245.14 g、平均绝对误差194.39 g,误差指标均低于其他预测方法;临床准确率为71.54%,高于其他预测方法。与其他对比模型相比,XGBoost模型高估率为13.73%、低估率为14.71%,表现相对均衡,高估、低估概率均低于Logistic(23.53%/28.43%)、LightGBM(25.98%/24.02%)及CatBoost(17.16%/17.65%)。模型特征重要性分析筛选出21项关键特征,其中分娩前胎儿腹围、分娩孕龄及分娩前羊水最大深度为最重要的预测变量(特征重要性分数分别为35、22、8)。
XGBoost模型成功构建了具有时序关联性的新生儿体重预测模型,其具备良好的稳定性与精准性,性能优于传统的以回归方程预测胎儿体重的方法。
杨丽仙 , 黄稚熙 , 梁博诚 , 欧阳淑媛 , 陈明朗 , 赵英丽 , 马薇波 , 缪敬 , 王磊 , 袁鹰 . 基于产前时序超声数据的新生儿出生体重智能预测[J]. 中华医学超声杂志(电子版), 2025 , 22(08) : 721 -732 . DOI: 10.3877/cma.j.issn.1672-6448.2025.08.006
To establish a neonatal birth weight prediction model based on the XGBoost algorithm to provide a precise intelligent tool for clinical perinatal decision-making.
A retrospective analysis was conducted on data from 1018 singleton pregnancies who underwent routine prenatal examinations and delivered at the Yunnan Maternal and Child Health Hospital between January 2021 and April 2023. The dataset included maternal basic information, prenatal ultrasound examination parameters (53 variables in total) during the first, second, and third trimesters, as well as within 7 days before delivery, and neonatal data (gestational age at delivery and birth weight). An XGBoost prediction model was constructed, and its performance was evaluated using multidimensional metrics (mean percentage error, standard deviation of percentage error, mean absolute percentage error, root mean square error, mean absolute error, and clinical prediction accuracy). The XGBoost model was compared with 15 traditional prediction formulas and machine learning models (LightGBM, Logistic, and CatBoost). Feature importance analysis was also performed.
The XGBoost model demonstrated strong performance in predicting neonatal birth weight, with a percentage error standard deviation of 8.21%, mean absolute percentage error of 6.34%, root mean square error of 245.14 g, and mean absolute error of 194.39 g, all error metrics were lower than those of other prediction methods. The clinical accuracy rate reached 71.54%, surpassing those of other predictive approaches. Compared to other benchmark models, the XGBoost model exhibited relatively balanced performance with an overestimation rate of 13.73% and an underestimation rate of 14.71%, both lower than those of Logistic (23.53%/28.43%), LightGBM (25.98%/24.02%), and CatBoost (17.16%/17.65%). Feature importance analysis identified 21 key predictors, among which fetal abdominal circumference before delivery, gestational age at delivery, and maximum amniotic fluid depth before delivery emerged as the most significant predictive variables (feature importance scores of 35, 22, and 8, respectively).
An XGBoost-based temporally correlated neonatal weight prediction model with robust stability and precision has been successfully constructed, and it outperforms traditional regression-based fetal weight prediction methods.
图1 超声参数测量切面。图a为丘脑水平横切面(测量双顶径和头围);图b为小脑水平横切面;图c为腹围水平横切面;图d为股骨长轴切面;图e为头臀长标准切面;图f为颈项透明层标准切面;图g为羊水最大深度测量切面;图h为脐动脉游离段血流频谱;图i为大脑中动脉血流频谱 |
表1 纳入的不同孕期产前超声检查参数 |
产前超声检查时间 | 纳入的超声检查数据参数 |
---|---|
孕早期(11~13+6周) | GA,CRL,NT,FHR,MVP |
孕中期(20~24+6周) | GA,BPD,HC,AC,FL,HL,CER,MVP,UA(Vmax、Vmin、S/D、RI、PI),MCA(Vmax、Vmin、S/D、PI、RI),FHR |
孕晚期(28~34周) | GA,BPD,HC,AC,FL,MVP,UA(Vmax、Vmin、S/D、RI、PI),MCA(Vmax、Vmin、S/D、PI、RI),FHR |
分娩前7 d内 | GA,BPD,HC,AC,FL,MVP,UA(Vmax、Vmin、S/D、RI、PI),FHR |
注:GA为孕龄;CRL为头臀长;NT为颈项透明层厚度;FHR为胎心率;MVP为羊水最大深度;BPD为双顶径;HC为头围;AC为腹围;FL为股骨长;HL为肱骨长;CER为小脑横径;UA为脐动脉;Vmax为最高流速;Vmin为最低流速;S/D为收缩期峰值流速与舒张末期流速比值;PI为搏动指数;RI为阻力指数;MCA为大脑中动脉 |
表3 各机器学习模型的超参数配置 |
超参数 | Logistic | CatBoostr | LightGBM | XGBoost |
---|---|---|---|---|
损失函数 | - | - | gbdt | gbtree |
提升器类型 | reg:gamma | RMSE | regression | reg:gamma |
树的最大深度 | - | 3 | 3 | 100 |
正则项系数 | 1 | 2 | l2 | 2 |
训练样本采样率 | - | 0.7 | 0.9 | 0.7 |
特征采样率 | - | - | 0.8 | 0.7 |
随机种子 | 200 | 200 | 200 | 1000 |
分裂阈值 | - | - | 0.05 | 0.1 |
注:-代表模型不需要提供的参数或者使用模型的默认参数 |
表4 1018例孕妇基本信息 |
基本信息 | 均值 | 变异系数 | 数据范围 |
---|---|---|---|
孕妇年龄(岁) | 30.92±4.22 | 0.13 | 19~46 |
孕次 | 2(1,3) | 0.60 | 1~10 |
产次 | 1(0,1) | 1.23 | 0~5 |
孕前体重(kg) | 55.00±8.75 | 0.15 | 35.0~96.5 |
孕期增重(kg) | 12.75±4.12 | 0.32 | -2.7~29.0 |
身高(cm) | 157.78±5.59 | 0.03 | 137~176 |
注:表格中符合正态分布的计量资料以 ![]() |
表5 孕早期(11~13+6周)超声产前筛查参数(n=1018) |
参数 | 均数±标准差 | 变异系数 | 数据范围 |
---|---|---|---|
GA(d) | 88.66±4.51 | 0.05 | 69~100 |
CRL(cm) | 6.34±0.70 | 0.11 | 4.5~8.4 |
NT(cm) | 0.16±0.08 | 0.52 | 0.08~0.35 |
FHR | 161.12±10.27 | 0.06 | 133~188 |
MVP(cm) | 3.61±0.73 | 0.20 | 1.5~6.0 |
注:GA为检查孕龄;CRL为头臀长;NT为颈项透明层厚度;FHR为胎心率;MVP为羊水最大深度 |
表6 孕中期(20~24+6周)超声产前筛查参数(n=1018) |
参数 | 均数±标准差 | 变异系数 | 数据范围 |
---|---|---|---|
GA(d) | 158.49±5.63 | 0.03 | 132~187 |
BPD(cm) | 5.37±0.30 | 0.05 | 4.47~6.81 |
HC(cm) | 19.99±0.94 | 0.04 | 17.36~27.90 |
AC(cm) | 32.66±5.34 | 16.34 | 14.69~21.70 |
FL(cm) | 3.83±0.94 | 0.24 | 3.09~4.70 |
HL(cm) | 3.65±1.19 | 0.32 | 2.39~4.50 |
CER(cm) | 2.33±0.13 | 0.05 | 1.89~2.95 |
MVP(cm) | 4.21±1.26 | 0.29 | 2.23~8.20 |
UA Vmax(cm/s) | 32.24±6.68 | 0.20 | 14.39~60.19 |
UA Vmin(cm/s) | 10.04±2.43 | 0.24 | 3.80~32.72 |
UA S/D | 3.26±0.62 | 0.19 | 0.80~13.11 |
UA RI | 0.67±0.08 | 0.12 | 0.30~2.70 |
UA PI | 1.14±0.18 | 0.16 | 0.46~1.88 |
FHR | 149.28±7.72 | 0.05 | 102~178 |
MCA Vmax(cm/s) | 27.80±5.63 | 0.20 | 12.06~46.16 |
MCA Vmin(cm/s) | 5.85±1.58 | 0.27 | 2.49~15.60 |
MCA S/D | 4.55±1.07 | 0.23 | 2.25~10.47 |
MCA RI | 0.77±0.29 | 0.37 | 0.43~0.89 |
MCA PI | 1.58±0.31 | 0.20 | 0.73~2.49 |
注:GA为孕龄;BPD为双顶径;HC为头围;AC为腹围;FL为股骨长;HL为肱骨长;CER为小脑横径;MVP为羊水最大深度;UA为脐动脉;Vmax为最高流速;Vmin为最低流速;S/D为收缩期峰值流速与舒张末期流速比值;PI为搏动指数;RI为阻力指数;FHR为胎儿心率;MCA为大脑中动脉 |
表7 孕晚期(28~34周)常规产前超声参数(n=1018) |
参数 | 均数±标准差 | 变异系数 | 数据范围 |
---|---|---|---|
GA(d) | 210.28±8.87 | 0.04 | 168~240 |
BPD(cm) | 7.64±0.39 | 0.05 | 6.44~8.90 |
HC(cm) | 27.72±1.41 | 0.05 | 24.10~31.48 |
AC(cm) | 25.49±1.53 | 0.06 | 20.80~31.50 |
FL(cm) | 5.67±0.62 | 0.11 | 4.69~6.59 |
MVP(cm) | 4.29±0.88 | 0.20 | 2.19~9.00 |
UA Vmax(cm/s) | 40.97±12.61 | 0.30 | 16.46~75.40 |
UA Vmin(cm/s) | 15.40±4.38 | 0.28 | 6.43~31.81 |
UA S/D | 2.72±0.45 | 0.16 | 1.40~4.55 |
UA RI | 0.67±0.07 | 0.11 | 0.30~0.90 |
UA PI | 0.96±0.26 | 0.27 | 0.50~1.53 |
FHR | 144.13±7.92 | 0.05 | 113~174 |
MCA Vmax(cm/s) | 37.78±8.32 | 0.22 | 14.00~63.21 |
MCA Vmin(cm/s) | 7.14±2.56 | 0.36 | 2.10~20.00 |
MCA S/D | 5.42±1.49 | 0.27 | 1.70~10.20 |
MCA RI | 0.79±0.09 | 0.11 | 0.40~0.98 |
MCA PI | 1.79±0.29 | 0.16 | 0.60~2.71 |
注:GA为孕龄;BPD为双顶径;HC为头围;AC为腹围;FL为股骨长;MVP为羊水最大深度;UA为脐动脉;Vmax为最高流速;Vmin为最低流速;S/D为收缩期峰值流速与舒张末期流速比值;PI为搏动指数;RI为阻力指数;FHR为胎儿心率;MCA为大脑中动脉 |
表8 分娩前7 d内的常规产前超声参数(n=1018) |
参数 | 均数±标准差 | 变异系数 | 数据范围 |
---|---|---|---|
GA(d) | 270.04±10.76 | 0.03 | 218~290 |
BPD(cm) | 9.28±2.13 | 0.23 | 7.40~10.46 |
HC(cm) | 32.95±8.23 | 0.25 | 26.97~36.60 |
AC(cm) | 33.31±1.68 | 0.05 | 21.70~39.50 |
FL(cm) | 7.27±2.01 | 0.27 | 5.79~8.00 |
MVP(cm) | 4.17±1.77 | 0.42 | 0.90~9.60 |
UA Vmax(cm/s) | 46.44±11.79 | 0.25 | 19.70~89.50 |
UA Vmin(cm/s) | 20.72±5.89 | 0.28 | 7.36~44.60 |
UA S/D | 2.27±0.39 | 0.17 | 1.40~4.190 |
UA RI | 0.55±0.06 | 0.11 | 0.30~0.80 |
UA PI | 0.83±0.14 | 0.17 | 0.40~1.22 |
FHR | 141.70±9.71 | 0.06 | 111~189 |
注:GA为孕龄;BPD为双顶径;HC为头围;AC为腹围;FL为股骨长;MVP为羊水最大深度;UA为脐动脉;Vmax为最高流速;Vmin为最低流速;S/D为收缩期峰值流速与舒张末期流速比值;PI为搏动指数;RI为阻力指数;FHR为胎儿心率 |
表9 新生儿相关信息(n=1018) |
资料 | 均数±标准差 | 变异系数 | 数据范围 |
---|---|---|---|
分娩孕龄(d) | 275.17±8.66 | 0.03 | 219~292 |
新生儿体重(g) | 3167.90±402.60 | 0.12 | 1200~4500 |
图5 新生儿体重预测模型及传统估算公式的百分比误差标准差注:weight1至weight15为15种传统胎儿体重预测公式分别为:Hadlock I、Hadlock Ⅳ、Hadlock Ⅱ、Hadlock Ⅲ、Ott、Combs、Bernstein、Hadlock V、Jordaan、ShepardⅡ、Johnson、Merz、Warsof、Campbell、Stirnemann;XGBoost、CatBoost、LightGBM、Logistic为4种预测模型 |
图8 新生儿体重预测模型及传统估算公式的绝对误差标准差注:weight1至weight15为15种传统胎儿体重预测公式分别为:Hadlock I、Hadlock Ⅳ、Hadlock Ⅱ、Hadlock Ⅲ、Ott、Combs、Bernstein、Hadlock V、Jordaan、ShepardⅡ、Johnson、Merz、Warsof、Campbell、Stirnemann;XGBoost、CatBoost、LightGBM、Logistic为4种预测模型 |
图9 新生儿体重预测模型及传统估算公式的均方根误差注:weight1至weight15为15种传统胎儿体重预测公式分别为:Hadlock I、Hadlock Ⅳ、Hadlock Ⅱ、Hadlock Ⅲ、Ott、Combs、Bernstein、Hadlock V、Jordaan、ShepardⅡ、Johnson、Merz、Warsof、Campbell、Stirnemann;XGBoost、CatBoost、LightGBM、Logistic为4种预测模型 |
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
6 |
|
7 |
石智红,李胜利. 人工智能在产前超声中的应用和研究进展[J/OL]. 中华医学超声杂志 (电子版), 2023, 20(1): 113-117.
|
8 |
谢子勋, 陈億龙, 宋维, 等. 融合科学智算的高危产妇妊娠结果评估模型及其应用研究[J]. 人工智能, 2024, (5): 109-125.
|
9 |
李昆, 柴玉梅, 赵红领, 等. 基于深度神经网络的胎儿体重预测[J]. 计算机科学, 2016, 43(z2): 73-76,82.
|
10 |
|
11 |
中华医学会超声医学分会妇产超声学组, 国家卫生健康委妇幼司全国产前诊断专家组医学影像组. 超声产前筛查指南 [J]. 中华超声影像学杂志, 2022, 31(1): 1-12.
|
12 |
任芸芸, 谢洪宁, 杨敏, 等. 中国产科超声检查指南[M].北京: 人民卫生出版社, 2019.
|
13 |
中华预防医学会出生缺陷预防与控制专业委员会产前超声诊断学组, 中华医学会超声医学分会妇产学组. 胎儿生物学参数超声参考值专家共识: 估测胎儿体重[J/OL]. 中华医学超声杂志(电子版), 2024, 21(8): 762-765.
|
14 |
|
15 |
|
16 |
|
17 |
|
18 |
|
19 |
|
20 |
林丽辉, 李国香, 刘良刚, 等. 应用超声胎儿测量系统预测胎儿体重的符合率研究[J]. 影像研究与医学应用, 2021, 5(15): 34-35.
|
21 |
王海红, 韩冰, 张慧. 影响超声估计胎儿体重准确性因素的研究进展[J]. 中华围产医学杂志, 2018, 21(10): 706-711.
|
22 |
|
23 |
|
24 |
|
25 |
蒋雯音.机器学习方法在早产和低出生体重儿预测中的应用[J]. 医学信息学杂志, 2019, 40(4): 59-63.
|
26 |
|
27 |
郭长胜. 胎儿宫内发育迟缓的危险因素及孕期运动对其干预作用的研究进展[J]. 儿童保健杂志, 2022, 30(10): 1091.
|
28 |
|
/
〈 |
|
〉 |