Maestría en Ciencias Computacionales

Permanent URI for this collectionhttps://repositorio.pascualbravo.edu.co/handle/pascualbravo/2794

Browse

Recent Submissions

Now showing 1 - 2 of 2
  • Item
    Modelos espacio-temporales para la predicción del crimen en microterritorios: caso de estudio Medellín, Colombia.
    (Institución Universitaria Pascual Bravo, 2025) Londoño Cano, Daniel; Patiño Hoyos, Alejandra Estefanía; Rico García, Mateo
    Esta tesis desarrolla un marco estadístico avanzado para modelar y predecir la dinámica espacio–temporal del homicidio en Medellín, combinando inferencia bayesiana jerárquica, regionalización mediante grillas hexagonales y estimación eficiente con Integrated Nested Laplace Approximation (INLA). A diferencia de los enfoques basados en límites administrativos, la discretización hexagonal reduce los efectos del modifiable areal unit problem (MAUP) y permite representar de manera continua la estructura territorial del riesgo. Se estimaron modelos de conteo con estructuras espaciales BYM, BYM2 e ICAR y las cuatro interacciones espacio–temporales (Tipos I–IV), evaluados en celdas elementales y regionalizaciones contiguas a 22 resoluciones de apotema. En total se compararon 528 configuraciones con criterios de ajuste (DIC, WAIC), validación geográfica (LGOCV) y desempeño predictivo (MAE, RMSE, IS). La escala espacial emergió como el determinante principal del rendimiento: las regionalizaciones intermedias entre 1 900 y 2 500 metros ofrecieron el mejor equilibrio entre granularidad, estabilidad e interpretabilidad. Entre las estructuras evaluadas, el modelo ICAR con interacción Tipo IV mostró la mayor consistencia en escenarios de ajuste y predicción. El modelo reproduce la persistencia de corredores históricos de alta incidencia en la zona centro–norte y nororiental, evidenciando que el homicidio urbano presenta una fuerte inercia espacio–temporal y una propagación local bien capturada por estructuras que integran dependencia espacial y memoria temporal. Las predicciones mantienen una calibración elevada a uno y dos años y conservan la jerarquía relativa del riesgo sin generar artefactos derivados de la escala. Abstract: This thesis develops an advanced statistical framework to model and forecast the spatio– temporal dynamics of homicide in Medellín by integrating hierarchical Bayesian inference, a spatial regionalization based on hexagonal grids, and efficient estimation through Integrated Nested Laplace Approximation (INLA). Unlike approaches built upon administrative boundaries, the hexagonal discretization mitigates the effects of the modifiable areal unit problem (MAUP) and enables a continuous and homogeneous representation of the underlying risk surface. Count models with BYM, BYM2 and ICAR spatial structures and the four standard space–time interactions (Types I–IV) were estimated across elemental cells and contiguous regionalizations at 22 spatial resolutions. A total of 528 configurations were evaluated using model–based criteria (DIC, WAIC), geographically informed cross–validation (LGOCV), and out–of–sample predictive metrics (MAE, RMSE, IS). Spatial scale emerged as the principal determinant of performance: intermediate regionalizations between 1,900 and 2,500 meters provided the best balance between granularity, stability and interpretability. Among the structures assessed, the ICAR model with Type IV interaction exhibited the most consistent behaviour in both fitting and forecasting. The models reproduce persistent high–risk corridors in the central–north and northeastern sectors of the city, demonstrating that urban homicide exhibits strong spatio–temporal inertia and short–range propagation well captured by structures combining spatial dependence and temporal memory. Forecasts remain well–calibrated at one– and two–year horizons and preserve the relative risk hierarchy without generating scale–induced artefacts.
  • Item
    Representación visual de datos de baja dimensión para la toma de decisiones informadas con modelos de Deep Learning
    (Institución Universitaria Pascual Bravo, 2025) Restrepo Loaiza, Farley Albeiro; Briñez de León, Juan Carlos; Gómez Miranda, Ingry Natalia
    La toma de decisiones informada es crucial para las organizaciones, ya que permite optimizar procesos y avanzar estratégicamente. En este contexto, los algoritmos de Aprendizaje de Máquina (Machine Learning) han emergido como herramientas clave para respaldar estas decisiones. Sin embargo, las dimensiones y la calidad de los datos juegan un papel fundamental en su desempeño, ya que características como la cantidad de atributos, su variabilidad o la presencia de valores atípicos condicionan la eficacia de los modelos y, por ende, el impacto en las decisiones organizacionales. Se ha identificado que, al incrementar la cantidad de dimensiones en los datos, los algoritmos convencionales tienden a experimentar variaciones significativas en su rendimiento. Esto ha obligado al área de las ciencias computacionales a incorporar extensas etapas de ingeniería de características para mejorar los algoritmos. No obstante, dichas etapas representan desafíos para las organizaciones; por un lado, requieren expertos altamente capacitados, lo que no siempre está disponible; por otro, dependen de la calidad del proceso implementado. Este panorama ha impulsado la búsqueda de estrategias que minimicen la dependencia de la ingeniería de características y, al mismo tiempo, garanticen un buen desempeño incluso con datos de baja dimensionalidad, es decir, escenarios en los que las variables medibles son limitadas en comparación con los modelos de alto desempeño. En respuesta a estas oportunidades y restricciones, este trabajo desarrolla una estrategia para el mapeo de representaciones visuales de datos de baja dimensionalidad. Para ello, se utiliza un caso representativo de la literatura, el conjunto de datos PIMA Indians Diabetes. La estrategia propuesta incluye dos enfoques principales; primero, un mapeo hacia representaciones visuales mediante superficies gaussianas, y segundo, un mapeo a imágenes de patrones de franjas de Moiré generadas a partir de las superficies gaussianas. Estas representaciones alimentan modelos de deep learning ampliamente reconocidos en la comunidad científica para respaldar la toma de decisiones. Los resultados obtenidos demuestran que estas representaciones visuales superan las expectativas de los modelos convencionales y de las estrategias paralelas reportadas en la literatura, posicionándose como una contribución significativa en este campo de estudio.