Resultados de la clusterización
Debido a temas de anonimización de la información censal, no todos los resultados de las preguntas del cuestionario son de dominio público. Lo anterior exige el acceso a las salas de procesamiento del DANE[7], con el fin de procesar la información con todas las bases e información disponible.
Con el objetivo de que el ICVU sea de fácil replicabilidad, la estimación se realiza a partir de la información del CNPV 2018 publicada en el Archivo Nacional de Datos – ANDA. Lo anterior supone algunos cambios en la programación, los cuales se detallan en el cuadro 5.
📘 Lea la primera parte –> Indicador de Condiciones de Vulnerabilidad Urbana
Cuadro 5. Variables modificadas por censura de información
Variable | Programación original | Programación ajustada para información pública |
---|---|---|
Atención inadecuada de menores de 5 años | Hogares con niños de 5 o menos años que permanecen la mayor parte del tiempo entre semana con su padre o madre en el trabajo, al cuidado de un pariente o una persona menor de 18 años o en la vivienda solo. | Variable censurada. No se incluye |
3 o más niños o adolescentes | Hogares con más de 3 niños o adolescentes menores de 17 años. | Información pública ofrece las edades por quinquenio, lo que impide hacer el corte en 17 años. Por tanto la variable queda así: % de personas de 10 años o más que reportan estar en busca de trabajo, sobre la población económicamente activa del hogar (los que están trabajando + los que están buscando empleo). |
Dependientes | % de personas en el hogar en condición de dependencia (menores de 5 años, mayores de 64 años, o personas con condición de discapacidad que requiere ayuda permanente), respecto al total de personas del hogar. | Información de tipo de discapacidad es censurada. Por tanto, la variable queda así: % de personas en el hogar en condición de dependencia (menores de 5 años y mayores de 64 años), sobre total de personas del hogar. |
Condición de migración | Hogares cuyo jefe reportó vivir en Venezuela hace 5 años | Variable censurada. No se incluye |
Inasistencia escolar | Hogares con personas de 5 y hasta 17 años que no asista al colegio. | Hogares con personas de 5 y hasta 19 años que no asista al colegio. |
Desocupados | % de personas de 12 años o más que reportan estar en busca de trabajo, sobre la población económicamente activa del hogar (los que están trabajando + los que están buscando empleo). | Información pública ofrece las edades por quinquenio, lo que impide hacer el corte en 12 años. Por tanto la variable queda así: % de personas de 10 años o más que reportan estar en busca de trabajo, sobre la población económicamente activa del hogar (los que están trabajando + los que están buscando empleo). |
Trabajo infantil | Hogares con personas entre 5 y 17 años trabajando. | Hogares con personas entre 5 y 19 años trabajando. |
Trabajo en adulto mayor | Hogares con personas entre de 64 años o más trabajando. | Hogares con personas de más de 64 años trabajando. |
Trabajo no remunerado | % de personas de 12 años o más trabajando sin remuneración, sobre la población económicamente activa del hogar (los que están trabajando + los que están buscando empleo). | Información pública ofrece las edades por quinquenio, lo que impide hacer el corte en 12 años. Por tanto la variable queda así: % de personas de 10 años o más trabajando sin remuneración, sobre la población económicamente activa del hogar (los que están trabajando + los que están buscando empleo). |
Embarazo adolescente | Hogares con mujeres menores a 18 años con hijos nacidos vivos en el momento del censo o mujeres cuyo último hijo nacido vivo haya nacido antes de la mayoría de edad de la madre. | Debido censura en fechas de nacimiento, por temas de anonimización, únicamente se incluyen las mujeres que al momento del censo reportaron tener menores de 18 años y tener hijos. |
De manera particular se destaca la eliminación de 2 variables por censura en la información pública (Atención inadecuada de menores de 5 años y Condición de migración).
Si bien variables como Trabajo no remunerado y Desocupados mostraron una disminución en las observaciones, se decidió mantenerlas ya que, a pesar de la perdida de datos, permiten contar con observaciones para el 82,6 % de los hogares nacionales en áreas urbanas. En consecuencia, los resultados que se muestran a continuación corresponden a 9.190.823 observaciones, analizadas a través de 21 variables, de las cuales 17 son dicótomas.
Una vez se aplica el proceso de k_medians, se generan los clústeres a partir de 4 grupos distribuidos de la siguiente manera:
Cuadro 6. Distribución de grupos resultantes del proceso de clusterización nacional
Clúster | Hogares | % | % acumulado |
---|---|---|---|
C1 | 5.051.026 | 54,96 | 54,96 |
C2 | 1.145.397 | 12,46 | 67,42 |
C3 | 2.309.401 | 25,13 | 92,55 |
C4 | 684.999 | 7,45 | 100 |
Total | 9.190.823 | 100 | |
Fuente: elaborado por los autores |
Esta agrupación no necesariamente identifica el orden de los hogares más vulnerables. Para ello se genera el indicador auxiliar, construido a partir de las 17 variables dicótomas incluidas en la clusterización, el cual permite agrupar los hogares de acuerdo con el número de privaciones[8].
Cuadro 7. Distribución del indicador auxiliar nacional
Indicador de verificación | Hogares | % | % acumulado |
---|---|---|---|
Iv.0 | 4.530.354 | 41,89 | 41,89 |
Iv.1 | 3.530.588 | 32,65 | 74,54 |
Iv.2 | 1.386.982 | 12,82 | 87,36 |
Iv.3 | 615.301 | 5,69 | 93,05 |
Iv.4 | 324.361 | 3 | 96,05 |
Iv.5 | 187.170 | 1,73 | 97,78 |
Iv.6 | 110.105 | 1,02 | 98,8 |
Iv.7 | 63.527 | 0,59 | 99,39 |
Iv.8 | 35.417 | 0,33 | 99,71 |
Iv.9 | 18.768 | 0,17 | 99,89 |
Iv.10 | 8.006 | 0,07 | 99,96 |
Iv.11 | 3.050 | 0,03 | 99,99 |
Iv.12 | 1.036 | 0,01 | 100 |
Iv.13 | 209 | 0 | 100 |
Iv.14 | 17 | 0 | 100 |
Iv.15 | 2 | 0 | 100 |
Total |
Fuente: elaborado por los autores
En concordancia con la distribución del indicador auxiliar, se recodifica el indicador de acuerdo con los 4 grupos, de la siguiente manera:
Cuadro 8. Distribución del indicador auxiliar ajustado nacional
Indicador de Verificación | Hogares | % | % acumulado |
---|---|---|---|
Iv.1 | 4.530.354 | 41,89 | 41,89 |
Iv.2 | 3.530.588 | 32,65 | 74,54 |
Iv.3 | 1.386.982 | 12,82 | 87,36 |
Iv.4 | 1.366.969 | 12,64 | 100 |
Total | 10.814.893 | 100 | |
Fuente: elaborado por los autores |
Hogares con 0 privaciones – grupo Iv.1 indicando que son menos vulnerables.
Hogares con Iv.1 privación – grupo Iv.2.
Hogares con Iv.2 privaciones – grupo Iv.3.
Hogares con Iv.3 o más privaciones – grupo Iv.4 indicando que son los más vulnerables.
Estos grupos se cruzan con los clústeres resultado del k_medians, lo que da como resultado la siguiente ordenación de los grupos:
Cuadro 9. Cruce entre indicador de verificación y el resultado de la clusterización nacional– antes de ordenar
Indicador de Verificación | C1 | C2 | C3 | C4 | Total |
---|---|---|---|---|---|
Iv.1 | 76,44 | 0 | 0 | 0 | 42,01 |
Iv.2 | 17,24 | 50,87 | 61,13 | 2,43 | 31,36 |
Iv.3 | 4,57 | 29,11 | 24,07 | 17,53 | 13,49 |
Iv.4 | 1,74 | 20,02 | 14,8 | 80,04 | 13,14 |
Total | 100 | 100 | 100 | 100 | 100 |
Fuente: elaborado por los autores |
Como se puede observar el grupo 2 evidencia mayor porcentaje de hogares con menos privaciones, mientras que el 3 muestra lo contrario. Por tanto, se invierten los grupos 2 y 3 para obtener una ordenación adecuada de los clústeres, donde 1 son los hogares no vulnerables y el 4 los más vulnerables.
Cuadro 10. Cruce entre indicador de verificación y el resultado de la clusterización nacional – después de ordenar
Clúster | Hogares | % | % acumulado |
---|---|---|---|
C1 | 5.051.026 | 54,96 | 54,96 |
C2 | 2.309.401 | 25,13 | 80,08 |
C3 | 1.145.397 | 12,46 | 92,55 |
C4 | 684.999 | 7,45 | 100 |
Total | 9.190.823 | 100 | |
Fuente: elaborado por los autores |
Al realizar las correlaciones de gamma y Kendall entre el indicador de verificación y el indicador de clúster, se obtiene una correlación de un 88 % para el primero y 71 % para el segundo.
Cuadro 11. Correlaciones gamma y Kendall
RECODE of Clúster | |||||
---|---|---|---|---|---|
Indicador de Verificación | C1 | C2 | C3 | C4 | Total |
Iv.1 | 42,01 | 0 | 0 | 0 | 42,01 |
Iv.2 | 9,48 | 15,36 | 6,34 | 0,18 | 31,36 |
Iv.3 | 2,51 | 6,05 | 3,63 | 1,31 | 13,49 |
Iv.4 | 0,96 | 3,72 | 2,49 | 5,97 | 13,14 |
Total | 54,96 | 25,13 | 12,46 | 7,45 | 100 |
gamma = 0,869 ASE = 0.000 Kendal´stau-b = 0,7052 ASE = 0.000 |
|||||
Fuente: elaborado por los autores |
Dado que el propósito del indicador es georreferenciar la condición de vulnerabilidad urbana y visualizar agrupaciones de hogares que potencialmente puedan ser AHDI, se deben agregar los datos a nivel manzana, debido a que la información georreferenciada a nivel hogar no es de acceso público. Para ello, se calcula la media de la clasificación de los hogares para cada manzana, posteriormente agrupándolas, usando el método de clasificación de datos cortes naturales de Jenks, para generar cuatro grupos que toman como parámetro las categorías de clasificación de pobreza en Colombia. Esta clasificación de manzanas es la que se usará para realizar el análisis espacial del ICVU.
Cuadro 12. Grupos ICVU según cortes naturales de Jenks
ICVU Cortes Naturales |
Hogares | % | % acumulado |
---|---|---|---|
G1 | 7.762.333 | 69,75 | 69,75 |
G2 | 1.922.153 | 17,27 | 87,03 |
G3 | 772.965 | 6,95 | 93,97 |
G4 | 670.775 | 6,03 | 100 |
Total | 11.128.226 | 100 | |
Fuente: elaborado por los autores |
Análisis de resultados nacionales[9]
El cálculo del ICVU sobre el total nacional indica que el 67,6 % de la población urbana del país (22’936.508 personas agrupadas en 7’062.333 hogares), se clasifica en el grupo 1 (G1), mientras que el 17,9 % (6’052.169 personas equivalentes a 1’922.153 hogares) corresponde al grupo 2 (G2). Entre tanto, el Grupo 3 (G3) y el grupo 4 (G4) tienen participaciones de 7,6 % y 6,9 %, respectivamente, lo que indica que 4’916.873 personas (agrupadas en 1’443.740 hogares) se ubican en manzanas que presentan un mayor nivel de vulnerabilidad urbana.
Gráfica 1. Proporción de población a nivel nacional, según grupo de condiciones de vulnerabilidad

A escala departamental (gráca 2) se observa que 22 de los 32 departamentos analizados presentan un indicador de población en condiciones de vulnerabilidad urbana superior al promedio nacional (14,5 %). Los departamentos con la mayor población absoluta ubicada en los grupos de vulnerabilidad urbana (G3 y G4) son Bolívar, Atlántico, Magdalena, Córdoba, Antioquia y Sucre.
Entre tanto, al analizar la participación de los hogares vulnerables sobre el total de los hogares del departamento, se encuentra una gran dispersión de los datos donde Vichada tiene un indicador de 96,1 %, mientras que Risaralda es del 3,9 %. Cuando se revisa la distribución de los datos, se evidencia que 16 departamentos tienen un nivel de vulnerabilidad urbana superior al 27,7 %, correspondiente al percentil 50 de la distribución de los datos a nivel departamental.
Gráfica 2. Concentración población en condiciones de precariedad por departamentos

A escala municipal se observa que 790 de 1.102 municipios del país presentan un indicador de población en condiciones de vulnerabilidad urbana superior al promedio nacional (14,5 %). Además, el 25 % del total de hogares urbanos nacionales clasificados en G3 y G4 se concentran en 16 municipios del país[10], destacándose que 10 de estos municipios corresponden a departamentos del Caribe (Mapa 1). Cartagena y Montería son los que tienen un mayor número absoluto de hogares clasificados en G3 y G4 con 38.343 y 30.845 respectivamente.
De otra parte, al analizar la participación de los hogares vulnerables sobre el total de hogares del municipio, se encuentra que 186 municipios tienen más del 70 % de su población en condición de vulnerabilidad urbana, lo que equivale a 468.855 hogares. Se destaca que 5 ciudades capitales hacen parte de este grupo: Puerto Carreño (97 %), Quibdó (84 %), San Andrés (78 %), Leticia (77 %), Inírida (73 %) (Mapa 2). Además, 44 de estos municipios tienen el 100 % de su población en G3 y G4. Las regiones Caribe y Pacífica concentran el 61 % y el 24 %, respectivamente, de los municipios con más del 70 % de su población en condicion de vulnerabilidad urbana.
Ahora bien, 335 municipios tienen menos del 15,9 % de su población en condición de vulnerabilidad urbana, lo que equivale a 282.415 hogares. Se destaca que 18 ciudades capitales[11] hacen parte de este grupo; no obstante, 4 de ellas (Valledupar, Cúcuta, Barranquilla y Medellín) junto con el municipio de Soacha, hacen parte del grupo que concentra un mayor número de hogares absolutos en condición de vulnerabilidad urbana (98.700 hogares).
Mapa 1. Porcentaje de hogares por municipio clasificados en G3 y G4 respecto al total de hogares nacionales en G3 y G4
Mapa 2. Porcentaje de hogares clasificados en G3 y G4 respecto al total de hogares por municipio
Vale la pena mencionar que el ICVU además de generar una clasificación de vulnerabilidad urbana permite caracterizar e identificar las principales carencias socioeconómicas de los hogares y físicas de las viviendas. El Cuadro 13 muestra el nivel de incidencia de cada una de las variables del ICVU dentro de los grupos G3 y G4.
Cuadro 13. Caracterización de los resultados nacionales de los grupos G3 y G4 por variables

En la estructura de la vivienda, el hacinamiento es la principal condición que afecta a los hogares (27,1 % para G3 y 37,2 % para G4). En particular para G4 otras condiciones predominantes son la falta de cocina (23,8 %) y material de paredes inadecuado (25 %).
En cuanto a servicios domiciliarios la mayor carencia es la falta de acceso a internet (89,3 % para G3 y 92,4 % para G4). En el G4 hay una alta afectación por falta de acceso a servicios de alcantarillado con una participación del más del 90 %.
Finalmente, en cuanto a las condiciones sociales, se evidencia que las mayores necesidades de la población son las relacionadas con educación, particularmente la inasistencia escolar que para G3 y G4 se encuentra alrededor del 14 %.
Esta caracterización se puede hacer para revisar los resultados nacionales a nivel municipal, con lo cual se podrían comprender las diferencias en las necesidades de cada municipio. Por último, la espacialización de los resultados nacionales evidencia marcadas diferencias de la concentración de la vulnerabilidad urbana. Además, devela la necesidad de generar análisis territoriales de menor escala.
Mapa 3. Visualización de resultados ICVU nacional por municipio
A escala del Sistema de Ciudades (SC), de acuerdo con los datos del CNPV 2018 en este habitan 27’072.586 personas agrupadas en 8’906.469 hogares, de los cuales el 63 % (5’612.940 hogares) se ubican en los centros de las 18 aglomeraciones, 19,5 % (1’740.690 hogares) en los municipios aglomerados y un 17,4 % (1’552.839) en municipios de tipo uninodal. Por su parte, los municipios por fuera del SC habitan 2´221.757 hogares.
En el SC, conformado por aglomeraciones urbanas y ciudades uninodales[12], los resultados del indicador muestran que, de la población en condiciones de vulnerabilidad (Grupos 3 y 4), el 21,7 % se encuentra ubicada en las ciudades uninodades (1´068.277 personas y 308.591 hogares), seguido de los municipios aglomerados alrededor de los nodos que concentran el 13,9 % (685.581 personas y 190.991 hogares). Por su parte, se evidencia que los centros de aglomeración concentran 10,7 % de la población vulnerable identificada a través del ICVU (528.172 personas y 154.788 hogares) (Gráfica 3). Finalmente, la mayor parte de la población identificada en condición de vulnerabilidad urbana se concentra en los municipios que se encuentran fuera del SC con 53,6 % (2´634.843 personas y 789.370 hogares).
Gráfica 3. Proporción de población en condiciones de vulnerabilidad según su función en el SC

En la Gráfica 4 se observa que, la aglomeración de Cartagena presenta la mayor proporción de población en condiciones de vulnerabilidad urbana respecto a su población total (G3 y G4) la cual asciende al 31,1 % (311.219 personas). Seguidamente, se encuentra la aglomeración de Barranquilla y la de Cúcuta con 20,5 % (434.316 personas) y 12 % (93.134 personas), respectivamente. En contraste, las aglomeraciones de Rionegro, Manizales y Bogotá tienen las menores incidencias respecto a su población total con 0.5 %, 1 % y 1.2 %, respectivamente. Vale la pena mencionar que el 70 % de las personas en grupo de vulnerabilidad urbana más alto (G4) se ubican en las aglomeraciones de Cartagena y Barranquilla.
En cuanto a los municipios uninodales, la ciudad con el mayor número de población en condiciones de vulnerabilidad urbana (G3 y G4) es la ciudad de Montería (29,4 % – 103.656 personas), seguida de Buenaventura (44,1 % – 94.130 personas), Quibdó (85 % – 91.691 personas) y Santa Marta (24,4 % – 89.107 personas). En términos relativos, respecto a la población total del municipio, la Gráfica 5 devela que 19 de los 38 municipios uninodales tienen una participación de población en condición de vulnerabilidad urbana superior al 20,5 %, que corresponde al percentil 50 de la distribución de los datos.
Gráfica 4. Concentración población en condiciones de vulnerabilidad urbana por aglomeraciones (Grupos en miles de personas)

Gráfica 5. Concentración población en condiciones de vulnerabilidad urbana por ciudades uninodales

Con el fin de detallar el comportamiento de los municipios que forman parte del SC, a continuación, se presenta el top15 de los municipios con mayor población clasificada en el grupo de mayor vulnerabilidad urbana a nivel nacional (G4). Además, se puede observar el número de manzanas y hogares para cada caso y su participación frente al total de cada municipio.
Cuadro 14. Municipios del SC con mayor porcentaje de población en el G4

Asimismo, se presenta el top15 de municipios con un mayor número de personas clasificadas en el G3 del ICVU en su cálculo nacional.
Cuadro 15. Municipios del SC con mayor porcentaje de población en el G3

Como se mencionó anteriormente, el ICVU puede ser calculado a diversas escalas territoriales, lo que permite analizar la condición de vulnerabilidad urbana dentro de un territorio específico. Esto tiene dos ventajas:
- Visibilizar mejor la vulnerabilidad urbana local, ya que dentro el análisis de clasificación de grupos se realiza únicamente entre los hogares del municipio.
- Identificar espacialmente áreas urbanas donde potencialmente se puede estar concentrando la precariedad urbana (AHDI).
Con el fin de ilustrar el valor agregado de generar el ICVU a escala municipal se selecciona Barranquilla como caso de estudio debido a que ha sido un aliado estratégico al servir como ciudad laboratorio para diversos ejercicios relacionados con AHDI.
Siguiendo el procedimiento descrito en la sección Propuesta metodológica se estimó el ICVU municipal para Barranquilla. Los resultados se pueden visualizar en el Mapa 4 (Panel A), los cuales se pueden comparar con la estimación para Barranquilla usando la base nacional (Panel B).
Mapa 4. Comparación de resultados ICVU municipal vs ICVU nacional para Barranquilla

Como se puede observar en el Mapa 4, la georreferenciación de los resultados de la clusterización municipal (es decir, aquella cuyo universo es la población del municipio) (Panel A), muestra un mayor gradiente de vulnerabilidad, frente a los resultados a nivel nacional (es decir, aquella cuyo universo es la población nacional) (Panel B).
Lo anterior indica que la estimación del indicador local presenta un nuevo gradiente de la vulnerabilidad urbana que solo es aplicable para Barranquilla. Es decir, la escala de análisis nacional es de utilidad para identificar las regiones con mayor profundidad de vulnerabilidad. Por su parte, la escala de análisis municipal permite ver zonas de precariedad local, que a la escala nacional no se visibilizan, pues comparativamente no son tan profundas como otras del resto del país.
Teniendo en cuenta la necesidad de realizar estimaciones municipales que brinden mejor información sobre la vulnerabilidad urbana local, se han generado ejercicios de prueba de la metodología, encontrando que esta puede ser replicada en municipios con al menos 10.000 hogares en las cabeceras urbanas (121 municipios, con cifras a 2018), ya que estos permiten generar grupos de clasificación consistentes.
Se ha evidenciado que para poblaciones pequeñas, poblaciones con condiciones relativamente homogéneas o poblaciones con condiciones muy marcadas de vulnerabilidad versus no vulnerabilidad, al no haber suficiente varianza (número de observaciones y diversidad de las características de estas) se va a dificultar diferenciar grupos en el proceso de clusterización.

- [7] Teniendo en cuenta que el día 9 de noviembre de 2021, el DANE fue víctima de un acceso forzoso al sistema de información, lo que llevo a la deshabilitación de los servicios informáticos de la entidad y, por ende, de la sala de procesamiento, fue necesario correr el indicador haciendo uso de la información publicada en el ANDA.
- [8] Debido a la ausencia de datos en algunas variables, este indicador sólo se calcula para aquellos hogares que cuentan con información para todas las variables.
- [9] Si bien debido a la perdida de observaciones por ausencia de información en algunas variables, el análisis de la clusterización arrojó una clasificación para 9.190.823 hogares, para el análisis de resultados georreferenciados se tom nuevamente el universo total de hogares nacionales.
- [10] Cartagena, Montería, Quibdó, Barranquilla, Buenaventura, Soledad, Santa Marta, San Andrés de Tumaco, Cúcuta, Soacha, Turbaco, Maicao, Medellín, Magangué, Valledupar, Ciénaga.
- [11] Valledupar, Mocoa, Cúcuta, Yopal, Barranquilla, Popayán, Neiva, Bucaramanga, Armenia, Pereira, Ibagué, Medellín, Pasto, Cali, Tunja, Manizales y Bogotá.
- [12] Las aglomeraciones son conjuntos de ciudades y/o centros urbanos, cuyas relaciones funcionales, asociadas a actividades económicas y servicios, superan los límites político administrativos. Por su parte, las ciudades uninodales son centros urbanos que mantienen sus relaciones funcionales dentro del límite político administrativo del municipio.
-
Foto: Bogotá, Colombia. Creditos: BID