Machine Learning for Predicting the Number of Children Among Maternal Health in Inimutaba – Minas Gerais
Main Article Content
Abstract
This study describes the profile of low-income mothers who already had children and received prenatal care in the municipality of Inimutaba, Minas Gerais, between January 2020 and December 2023. Sociodemographic variables were analyzed to identify the factors most strongly associated with the number of children per woman. The sample included 134 women with an average age of 29 years, the majority of whom self-identified as 86.56%, living on a minimum wage 94%, and having completed high school 94%. To investigate the determinants of fertility within this population, we applied an Ordinary Least Squares (OLS) regression and a Classification and Regression Tree (CART) algorithm. Although the in-sample OLS model initially exhibited a high coefficient of determination approx 0.91%, internal validation through 10-fold cross-validation demonstrated substantially lower generalization performance approx 0.37%, indicating overfitting. The most relevant predictors after model refinement were family size, household income, marital status (single), and age. The CART model showed similar patterns. The fully grown tree overfitted the training data, whereas cost-complexity pruning with an optimal parameter of 0.113% improved test accuracy to 74%. Despite this improvement, the model exhibited limited discriminative ability (AUC = 0.55), reinforcing the importance of careful interpretation in small epidemiological datasets. Overall, the findings indicate that fertility patterns among low-income mothers in Inimutaba are closely linked to socioeconomic vulnerability. Machine learning and statistical models, when combined with rigorous internal validation, can help identify high-risk subgroups and support targeted interventions for maternal health.
Article Details

This work is licensed under a Creative Commons Attribution 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).
References
1. Almeida, B. & Castro, M. Gravidez e juventude: desafios contemporâneos na saúde pública. Revista Interface: Comunicação, Saúde, Educação 23 (2019).
2. Arlot, S. & Celisse, A. A survey of cross-validation procedures for model selection. Statistics Surveys 4, 40–79 (2010).
3. Babyak, M. A. What you see may not be what you get: a brief, nontechnical introduction to verfitting in regression-type models. Psychosomatic Medicine 66, 411–421 (2004).
4. Barros, D. & Rocha, V. Educação, gênero e reprodução social em adolescentes grávidas. Revista Educação & Sociedade 41, 1–18 (2020).
5. Breiman, L., Friedman, J., Olshen, R. & Stone, C. Classification and Regression Trees (Chapman and Hall/CRC, New York, 1984).
6. Campos, L. & Silva, R. Impactos da pobreza na primeira infância: uma revisão sistemática. Revista Psicologia em Pesquisa 14, 35–43 (2020).
7. Costa, F. & Almeida, J. Desigualdade social e saúde materna: uma análise regional. Revista Brasileira de Epidemiologia 22, e190046. doi:10.1590/1980-549720190046 (2019).
8. Cunha, R. & Oliveira, P. Gênero, trabalho e cuidado: desafios para a equidade nas famílias brasileiras. Revista de Estudos Feministas 29, 1–14 (2021).
9. Da Cidadania, M. Indicadores de pobreza e vulnerabilidade social no Brasil. Governo Federal (2021).
10. Da Saúde, M. Sistema de Informação sobre Nascidos Vivos (SINASC): Estatísticas de ascimentos por Idade da Mã https : / / datasus . saude .gov . br /nascidos - vivos - sinasc/. Acessado em 27 de novembro de 2025. 2020.
11. D’Agostino, R. B. & Pearson, E. S. Tests for normal distribution. Biometrika 60, 613–622.
doi:10.1093/biomet/60.3.613 (1973).
12. Freitas, J.&Santos, R.Vivências da gravidez e construção de identidade social. Revista Psicologia:
Teoria e Prática 21, 56–68 (2019).
13. Gonçalves, R. & Lima, T. Famílias chefiadas por mulheres e os desafios da desigualdade de
renda. Revista Brasileira de Estudos de População 37, e0120 (2020).
14. Harrell Jr, F. E. Regression Modeling Strategies: With Applications to Linear Models, Logistic and
Ordinal Regression, and Survival Analysis 2nd ed. (Springer, 2015).
15. Hastie, T., Tibshirani, R. & Friedman, J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction 2nd ed. (Springer, 2009).
16. IBGE. Estatísticas de Gênero: Indicadores sociais das mulheres no Brasil. Instituto Brasileiro de
Geografia e Estatística. Disponível em: https://www.ibge.gov.br/estatisticas/sociais/populacao/
20189-estatisticas-de-genero.html (2021).
17. IBGE. Síntese de Indicadores Sociais: uma análise das condições de vida da população brasileira. Instituto Brasileiro de Geografia e Estatística. Disponível em: https : / / biblioteca . ibge . gov . br /visualizacao/livros/liv101760.pdf (2022).
18. IPEA. Retrato das desigualdades de gênero e raça. Instituto de Pesquisa Econômica Aplicada.
Disponível em: https://www.ipea.gov.br/retratos/ (2019).
19. Kuhn, M. & Johnson, K. Applied Predictive Modeling (Springer, 2013).
20. Loh, W.-Y. Classification and regression trees.Wiley Interdisciplinary Reviews: Data Mining and
Knowledge Discovery 1, 14–23 (2011).
21. Mainardi, P. H. & Bidoia, E. D. Fundamental concepts and recent applications of factorial
statistical designs. Brazilian Journal of Biometrics (2022).
22. Martins, E. & Pereira, C. Gravidez e exclusão social: uma análise das mulheres em situação de
vulnerabilidade. Revista Katálysis 22, 204–212 (2019).
23. Moura, L. & Barbosa, A. C. Consequências sociais da gravidez na adolescência: desafios e perspectivas. Revista Saúde e Sociedade 27, 755–766. doi:10.1590/S0104-12902018170301 (2018).
24. Nascimento, P. & Moreira, C. Infância, desigualdade social e políticas públicas no Brasil. Revista
Brasileira de Educação 25 (2020).
25. Oliveira, C. S. & Fernandes, J. L. A importância do pré-natal para a saúde materna e neonatal:
revisão integrativa. Revista Brasileira de Enfermagem 74, e20200783. doi:10.1590/0034-7167-
2020-0783 (2021).
26. Oliveira, C. & Lima, J. A trajetória das mães solo e o impacto na estrutura familiar. Cadernos
de Pesquisa 50, 80–100 (2020).
27. Pereira, C. A. B.,Nakamura, L. R. & Rodrigues, P. C.Naive statistical analyses for COVID-19:
application to data from Brazil and Italy. Brazilian Journal of Biometrics 39, 158–176 (2021).
28. Rodrigues, A. R. & Nascimento, T. Saúde da mulher e maternidade no Brasil contemporâneo.
Revista Brasileira de Saúde Materno Infantil 20, 789–800. doi:10.1590/1806-93042020000300005
(2020).
29. Santos, F. & Lima, A. P. Gravidez precoce e vulnerabilidade social: reflexos na vida das adolescentes. Revista da Escola de Enfermagem da USP 51, 1–8. doi:10.1590/S1980-220X2016041903252 (2017).
30. Silva, J.&Andrade, P. A pobreza como violação de direitos sociais. Revista Direitos Fundamentais
14, 45–59 (2021).
31. Silva, M. C. & Gomes, E. Políticas públicas e saúde da mulher: uma análise crítica. Revista
Ciência & Saúde Coletiva 24, 1125–1133 (2019).
32. Silva, M. A. & Souza, L. B. Desigualdade de gênero e maternidade no Brasil. Revista Estudos
Feministas 26, e48412. doi:10.1590/1806-9584-2018v26n148412 (2018).
33. Souza, A. C. & Matos, F. Maternidade e relações sociais em contextos de pobreza. Revista
Ciência & Saúde Coletiva 25, 1927–1934 (2020).
34. Vieira, M. & Lopes, F. Ações de combate à pobreza no Brasil contemporâneo. Revista de Políticas Públicas 23, 115–127 (2019).