Machine Learning for Predicting the Number of Children Among Maternal Health in Inimutaba – Minas Gerais

Main Article Content

Aurélio Aquino
Ricardo Cerri
https://orcid.org/0000-0002-2582-1695

Abstract

This study describes the profile of low-income mothers who already had children and received prenatal care in the municipality of Inimutaba, Minas Gerais, between January 2020 and December 2023. Sociodemographic variables were analyzed to identify the factors most strongly associated with the number of children per woman. The sample included 134 women with an average age of 29 years, the majority of whom self-identified as 86.56%, living on a minimum wage 94%, and having completed high school 94%. To investigate the determinants of fertility within this population, we applied an Ordinary Least Squares (OLS) regression and a Classification and Regression Tree (CART) algorithm. Although the in-sample OLS model initially exhibited a high coefficient of determination approx 0.91%, internal validation through 10-fold cross-validation demonstrated substantially lower generalization performance approx 0.37%, indicating overfitting. The most relevant predictors after model refinement were family size, household income, marital status (single), and age. The CART model showed similar patterns. The fully grown tree overfitted the training data, whereas cost-complexity pruning with an optimal parameter of 0.113% improved test accuracy to 74%. Despite this improvement, the model exhibited limited discriminative ability (AUC = 0.55), reinforcing the importance of careful interpretation in small epidemiological datasets. Overall, the findings indicate that fertility patterns among low-income mothers in Inimutaba are closely linked to socioeconomic vulnerability. Machine learning and statistical models, when combined with rigorous internal validation, can help identify high-risk subgroups and support targeted interventions for maternal health.

Article Details

How to Cite
Aquino, A., & Cerri, R. (2026). Machine Learning for Predicting the Number of Children Among Maternal Health in Inimutaba – Minas Gerais. Brazilian Journal of Biometrics, 44(2), e-44948. https://doi.org/10.28951/bjb.v44i2.948
Section
Articles

References

1. Almeida, B. & Castro, M. Gravidez e juventude: desafios contemporâneos na saúde pública. Revista Interface: Comunicação, Saúde, Educação 23 (2019).

2. Arlot, S. & Celisse, A. A survey of cross-validation procedures for model selection. Statistics Surveys 4, 40–79 (2010).

3. Babyak, M. A. What you see may not be what you get: a brief, nontechnical introduction to verfitting in regression-type models. Psychosomatic Medicine 66, 411–421 (2004).

4. Barros, D. & Rocha, V. Educação, gênero e reprodução social em adolescentes grávidas. Revista Educação & Sociedade 41, 1–18 (2020).

5. Breiman, L., Friedman, J., Olshen, R. & Stone, C. Classification and Regression Trees (Chapman and Hall/CRC, New York, 1984).

6. Campos, L. & Silva, R. Impactos da pobreza na primeira infância: uma revisão sistemática. Revista Psicologia em Pesquisa 14, 35–43 (2020).

7. Costa, F. & Almeida, J. Desigualdade social e saúde materna: uma análise regional. Revista Brasileira de Epidemiologia 22, e190046. doi:10.1590/1980-549720190046 (2019).

8. Cunha, R. & Oliveira, P. Gênero, trabalho e cuidado: desafios para a equidade nas famílias brasileiras. Revista de Estudos Feministas 29, 1–14 (2021).

9. Da Cidadania, M. Indicadores de pobreza e vulnerabilidade social no Brasil. Governo Federal (2021).

10. Da Saúde, M. Sistema de Informação sobre Nascidos Vivos (SINASC): Estatísticas de ascimentos por Idade da Mã https : / / datasus . saude .gov . br /nascidos - vivos - sinasc/. Acessado em 27 de novembro de 2025. 2020.

11. D’Agostino, R. B. & Pearson, E. S. Tests for normal distribution. Biometrika 60, 613–622.

doi:10.1093/biomet/60.3.613 (1973).

12. Freitas, J.&Santos, R.Vivências da gravidez e construção de identidade social. Revista Psicologia:

Teoria e Prática 21, 56–68 (2019).

13. Gonçalves, R. & Lima, T. Famílias chefiadas por mulheres e os desafios da desigualdade de

renda. Revista Brasileira de Estudos de População 37, e0120 (2020).

14. Harrell Jr, F. E. Regression Modeling Strategies: With Applications to Linear Models, Logistic and

Ordinal Regression, and Survival Analysis 2nd ed. (Springer, 2015).

15. Hastie, T., Tibshirani, R. & Friedman, J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction 2nd ed. (Springer, 2009).

16. IBGE. Estatísticas de Gênero: Indicadores sociais das mulheres no Brasil. Instituto Brasileiro de

Geografia e Estatística. Disponível em: https://www.ibge.gov.br/estatisticas/sociais/populacao/

20189-estatisticas-de-genero.html (2021).

17. IBGE. Síntese de Indicadores Sociais: uma análise das condições de vida da população brasileira. Instituto Brasileiro de Geografia e Estatística. Disponível em: https : / / biblioteca . ibge . gov . br /visualizacao/livros/liv101760.pdf (2022).

18. IPEA. Retrato das desigualdades de gênero e raça. Instituto de Pesquisa Econômica Aplicada.

Disponível em: https://www.ipea.gov.br/retratos/ (2019).

19. Kuhn, M. & Johnson, K. Applied Predictive Modeling (Springer, 2013).

20. Loh, W.-Y. Classification and regression trees.Wiley Interdisciplinary Reviews: Data Mining and

Knowledge Discovery 1, 14–23 (2011).

21. Mainardi, P. H. & Bidoia, E. D. Fundamental concepts and recent applications of factorial

statistical designs. Brazilian Journal of Biometrics (2022).

22. Martins, E. & Pereira, C. Gravidez e exclusão social: uma análise das mulheres em situação de

vulnerabilidade. Revista Katálysis 22, 204–212 (2019).

23. Moura, L. & Barbosa, A. C. Consequências sociais da gravidez na adolescência: desafios e perspectivas. Revista Saúde e Sociedade 27, 755–766. doi:10.1590/S0104-12902018170301 (2018).

24. Nascimento, P. & Moreira, C. Infância, desigualdade social e políticas públicas no Brasil. Revista

Brasileira de Educação 25 (2020).

25. Oliveira, C. S. & Fernandes, J. L. A importância do pré-natal para a saúde materna e neonatal:

revisão integrativa. Revista Brasileira de Enfermagem 74, e20200783. doi:10.1590/0034-7167-

2020-0783 (2021).

26. Oliveira, C. & Lima, J. A trajetória das mães solo e o impacto na estrutura familiar. Cadernos

de Pesquisa 50, 80–100 (2020).

27. Pereira, C. A. B.,Nakamura, L. R. & Rodrigues, P. C.Naive statistical analyses for COVID-19:

application to data from Brazil and Italy. Brazilian Journal of Biometrics 39, 158–176 (2021).

28. Rodrigues, A. R. & Nascimento, T. Saúde da mulher e maternidade no Brasil contemporâneo.

Revista Brasileira de Saúde Materno Infantil 20, 789–800. doi:10.1590/1806-93042020000300005

(2020).

29. Santos, F. & Lima, A. P. Gravidez precoce e vulnerabilidade social: reflexos na vida das adolescentes. Revista da Escola de Enfermagem da USP 51, 1–8. doi:10.1590/S1980-220X2016041903252 (2017).

30. Silva, J.&Andrade, P. A pobreza como violação de direitos sociais. Revista Direitos Fundamentais

14, 45–59 (2021).

31. Silva, M. C. & Gomes, E. Políticas públicas e saúde da mulher: uma análise crítica. Revista

Ciência & Saúde Coletiva 24, 1125–1133 (2019).

32. Silva, M. A. & Souza, L. B. Desigualdade de gênero e maternidade no Brasil. Revista Estudos

Feministas 26, e48412. doi:10.1590/1806-9584-2018v26n148412 (2018).

33. Souza, A. C. & Matos, F. Maternidade e relações sociais em contextos de pobreza. Revista

Ciência & Saúde Coletiva 25, 1927–1934 (2020).

34. Vieira, M. & Lopes, F. Ações de combate à pobreza no Brasil contemporâneo. Revista de Políticas Públicas 23, 115–127 (2019).

Similar Articles

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 > >> 

You may also start an advanced similarity search for this article.