Colombia: Desplazamiento y Confinamiento - Probabilidad y estimación

  • 20+ Downloads
  • This dataset updates: Every six months
Additional information
Time Period of the Dataset [?]
January 01, 2025-June 30, 2025 ... More
Modified [?]
27 March 2025
Dataset Added on HDX [?]
27 March 2025 Less
Expected Update Frequency
Every six months
Location
Source
Humanitarian partners
Contributor
Methodology

El proceso de estimación de personas por desplazamiento y confinamiento se basó en la integración de datos históricos (2008–2022) con registros actualizados extraídos para el periodo 2023–2025, con el objetivo de construir una base unificada y confiable de eventos. Esta base fue sometida a un riguroso proceso de limpieza y transformación, en el cual se estandarizaron fechas, se ajustaron variables clave como municipio, año y mes, y se recodificaron categorías con el fin de agrupar eventos similares. Una vez consolidada la información, se agregaron los datos por municipio, mes y año, sumando el total de víctimas para estimar el número de personas desplazadas en cada combinación espaciotemporal.

La estimación del número de personas afectadas se fundamenta en un enfoque estadístico que busca captar la variabilidad de los eventos mediante la aplicación de modelos, particularmente la regresión de Poisson. Este modelo garantiza que las predicciones sean siempre valores positivos y permite capturar diferencias específicas entre municipios y periodos. Además, se realizaron chequeos de idoneidad, como la evaluación de sobre dispersión, para asegurar la coherencia del modelo y la calidad de los resultados. Esto permitió construir una línea base sólida para cada municipio, ajustada a su comportamiento histórico y contexto geográfico.

Paralelamente, para definir la probabilidad de ocurrencia, se implementó un modelo basado en Random Forest, seleccionado por su capacidad para detectar patrones complejos en conjuntos de datos heterogéneos. Este modelo fue entrenado con datos históricos y adaptado a la cantidad de registros disponibles en cada municipio. Adicionalmente, se evaluaron otros algoritmos de regresión como Decision Tree, SVR y regresión polinomial, utilizando el Error Cuadrático Medio como criterio de selección del mejor desempeño. Cabe destacar que, debido al incremento reciente de desplazamientos masivos en regiones como el Catatumbo, se identificaron outliers que fueron tratados con especial atención para evitar distorsiones en las proyecciones generales.

Caveats / Comments
File Format
Visibility
Public
Export metadata for this dataset: JSON | CSV
[{"date": "2024-11-25", "value": 0}, {"date": "2024-12-02", "value": 0}, {"date": "2024-12-09", "value": 0}, {"date": "2024-12-16", "value": 0}, {"date": "2024-12-23", "value": 0}, {"date": "2024-12-30", "value": 0}, {"date": "2025-01-06", "value": 0}, {"date": "2025-01-13", "value": 0}, {"date": "2025-01-20", "value": 0}, {"date": "2025-01-27", "value": 0}, {"date": "2025-02-03", "value": 0}, {"date": "2025-02-10", "value": 0}, {"date": "2025-02-17", "value": 0}, {"date": "2025-02-24", "value": 0}, {"date": "2025-03-03", "value": 0}, {"date": "2025-03-10", "value": 0}, {"date": "2025-03-17", "value": 0}, {"value": 7, "date": "2025-03-24"}, {"value": 9, "date": "2025-03-31"}, {"value": 8, "date": "2025-04-07"}, {"value": 2, "date": "2025-04-14"}, {"value": 5, "date": "2025-04-21"}, {"date": "2025-04-28", "value": 0}, {"value": 2, "date": "2025-05-05"}, {"value": 7, "date": "2025-05-12"}]

Downloads

Related Showcases

There are no showcases for this dataset.


Data and Resources [1]