Use este identificador para citar ou linkar para este item: https://repositorio.idp.edu.br//handle/123456789/5621
Título: Modelagem preditiva da eficiência dos investimentos públicos em obras e infraestrutura no estado do Amapá
Autor(es): Amanajás, Ivy Thiago Vasconcelos
Orientador(es): Monastério, Leonardo Monteiro
Palavras-chave: Eficiência (serviço publico);Políticas públicas;Criação de empregos
Editor: Idp
Citação: AMANAJÁS, Ivy Thiago Vasconcelos. Modelagem preditiva da eficiência dos investimentos públicos em obras e infraestrutura no estado do Amapá. 2025. 101 f. Dissertação  (Mestrado Profissional em Economia) - Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa - IDP. Brasília, 2025.
Resumo: Este trabalho avalia a eficiência dos investimentos públicos em obras e infraestrutura no Estado do Amapá, mensurando sua capacidade de gerar emprego e renda a partir de recursos orçamentários. Utilizamos 703 registros oficiais (2007-2025), submetidos a um protocolo de limpeza que descartou projetos com valor global igual a zero, converteu variáveis monetárias para formato numérico uniforme e imputou faltantes críticos por Predictive Mean Matching. Geramos dois indicadores-chave de eficiência — empregos por real investido e receita por real investido — além de variáveis de controle (etapa da obra, eixo temático, região administrativa, impacto local). A estratégia empírica combinou técnicas de Machine Learning (Random Forest, Gradient Boosting, XGBoost e Redes Neurais) com métodos estatísticos convencionais. Os modelos foram estimados em amostras de treino/ teste (70 %/30 %) sob validação cruzada repetida (5 folds × 2 repetições). O Random Forest apresentou o melhor desempenho geral (R² = 0,956; MAE = 3,04; RMSE = 32,41), seguido de perto pelo XGBoost (R² = 0,959; MAE = 2,65; RMSE = 35,05). O Gradient Boosting obteve performance intermediária (R² = 0,562), enquanto a Rede Neural mostrou instabilidade na validação (R² não estatisticamente definido). As análises de importância de variáveis convergiram na primazia do valor_global, do impacto_por_projeto e do impacto_por_eixo, sugerindo que escala financeira e externalidades locais são determinantes centrais da eficiência. Técnicas de agrupamento (k-means, DBSCAN) identificaram três perfis distintos de custo-benefício, com um grande cluster de baixa eficiência e dois grupos menores de alto desempenho. Testes t e ANOVA indicaram que projetos estratégicos apresentam, em média, maior eficiência de emprego (p ≈ 0,045), ao passo que projetos terceirizados exibem eficiência inferior (p < 0,001). Um modelo difference-in-differences controlado por efeitos fixos de eixo mostrou aumento significativo da eficiência média após 2020 (β = 11,46; p < 0,05), ainda que o efeito marginal do valor investido permaneça estatisticamente frágil. 6 Os resultados apontam para oportunidades de reordenação de prioridades, privilegiando eixos com alto impacto local documentado e evitando a dispersão de recursos em iniciativas terceirizadas de baixo retorno. Apesar da robustez relativa dos modelos, as conclusões dependem da qualidade dos registros administrativos e exigem monitoramento contínuo para embasar decisões orçamentárias futuras.
Abstract:This dissertation evaluates the efficiency of public investments in construction and infrastructure projects in the State of Amapá, measuring their capacity to generate employment and income from budgetary resources. The analysis draws on 703 official records (2007– 2025), processed through a cleaning protocol that removed projects with zero total value, standardized monetary variables, and imputed critical missing data using Predictive Mean Matching. Two key efficiency indicators were constructed—jobs per real invested and revenue per real invested—alongside control variables such as project stage, thematic axis, administrative region, and local impact. The empirical strategy combined Machine Learning techniques (Random Forest, Gradient Boosting, XGBoost, and Neural Networks) with conventional statistical methods. Models were estimated using 70/30 train–test splits under repeated cross-validation (5 folds × 2 repetitions). Random Forest achieved the best overall performance (R² = 0.956; MAE = 3.04; RMSE = 32.41), closely followed by XGBoost (R² = 0.959; MAE = 2.65; RMSE = 35.05). Gradient Boosting presented intermediate results (R² = 0.562), while the Neural Network showed instability during validation (R² not statistically defined). Variable importance analyses consistently highlighted total project value, project-level impact, and axis-level impact as key determinants of efficiency, indicating that financial scale and local externalities play central roles. Clustering techniques (k-means, DBSCAN) identified three distinct cost–benefit profiles, with one large low-efficiency cluster and two smaller high-performing groups. t-tests and ANOVA indicated that strategic projects exhibit higher employment efficiency on average (p ≈ 0.045), whereas outsourced projects display significantly lower efficiency (p < 0.001). A difference-in-differences model with axis fixed effects revealed a significant increase in average efficiency after 2020 (β = 11.46; p < 0.05), although the marginal effect of investment value remains statistically weak. Overall, the findings point to opportunities for reallocating priorities toward axes with documented high local impact and away 8 from low-return outsourced initiatives. Despite the relative robustness of the models, the conclusions depend on the quality of administrative records and call for continuous monitoring to support future budgetary decision-making.
URI: https://repositorio.idp.edu.br//handle/123456789/5621
Aparece nas coleções:Mestrado Profissional em Economia

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_IVY THIAGO VASCONCELOS AMANAJÁS_Mestrado Profissional em Economia.pdf2.45 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.