Capítulo 5 Cálculo de Pobreza por Línea
En esta clase abordaremos conceptos teóricos y definiciones metodológicas de la medición “indirecta” de la pobreza, a través del metodo usualmente conococido como “Porbreza por Línea”, acorde a la Metodología n° 22 de INDEC.
Luego, procederemos a realizar una estimación de la incidencia de la pobreza e indigencia por personas.
Conceptos a abordar:
- Medición indirecta de la satisfacción de necesidades básicas
- Umbral de necesidades energéticas y proteicas
- Unidades de Adulto Equivalente
- Composición de la canasta básica alimentaria (Diferenciación regional)
- Población de Referencia
- Coeficiente de Engel
- Canasta Básica Total
- Pobreza como fenómeno del hogar
- Ingreso total familiar
Reiniciar R
Cargamos las librerías necesarias para realizar este ejercicio
library(tidyverse, warn = FALSE)
library(openxlsx, warn = FALSE)
Aprovechando la facilidad que presenta el R para trabajar con multiples bases de datos, realizaremos la estimación de la incidencia para 2 trimestres consecutivos. Previo a levantar las bases, definimos un vector que contiene las variables relevantes para el ejercicio. Luego a la hora de levantar aplicamos un select al *dataframe** para conservar solo estas variables. Finalmente, para realizar la estimación conjunta de los dos trimestres, unimos ambas bases de datos
var.ind <- c('CODUSU','NRO_HOGAR' ,'COMPONENTE','ANO4','TRIMESTRE','REGION',
'AGLOMERADO', 'PONDERA', 'CH04', 'CH06', 'ITF', 'PONDIH','P21')
individual.316 <- read.table("Fuentes/usu_individual_t316.txt", sep=";", dec=",", header = TRUE, fill = TRUE) %>%
select(var.ind)
individual.416 <- read.table("Fuentes/usu_individual_t416.txt", sep=";", dec=",", header = TRUE, fill = TRUE) %>%
select(var.ind)
Bases <- bind_rows(individual.316,individual.416)
A su vez levantaremos las siguientes fuentes secundarias:
- Unidades de Adulto equivalente según sexo y edad
- Canasta Básica Alimentaria Regionales de cada una de las regiones
- Canasta Básica Total Regionales de cada una de las regiones
- Diccionario de códigos de regiones y aglomerados de EPH
La información de estos cuadros fue extraída del comunicado de pobreza.
Adequi <- read.xlsx("Fuentes/ADEQUI.xlsx")
CBA <- read.xlsx("Fuentes/CANASTAS.xlsx",sheet = "CBA")
CBT <- read.xlsx("Fuentes/CANASTAS.xlsx",sheet = "CBT")
dic.regiones <- read.xlsx("Fuentes/Regiones.xlsx")
CBT
## Año Mes GBA Pampeana Noroeste Noreste Cuyo Patagonia
## 1 2016 7 4032.88 4017.66 3281.04 3396.40 3854.62 4712.59
## 2 2016 8 4036.87 4007.81 3269.01 3394.32 3844.95 4723.38
## 3 2016 9 4089.82 4075.69 3326.94 3451.12 3917.54 4790.98
## 4 2016 10 4191.81 4173.73 3397.68 3524.49 4006.63 4924.99
## 5 2016 11 4247.99 4225.38 3417.85 3539.66 4038.84 4967.62
## 6 2016 12 4257.55 4227.33 3420.17 3551.79 4045.75 4994.91
CBA
## Año Mes GBA Pampeana Noroeste Noreste Cuyo Patagonia
## 1 2016 7 1666.48 1660.19 1458.24 1496.21 1494.04 1713.67
## 2 2016 8 1675.05 1662.99 1459.38 1501.91 1496.09 1723.86
## 3 2016 9 1711.22 1705.31 1498.62 1540.68 1536.29 1767.89
## 4 2016 10 1739.34 1731.84 1516.82 1559.51 1559.00 1797.44
## 5 2016 11 1762.65 1753.27 1532.67 1573.18 1577.67 1819.64
## 6 2016 12 1766.62 1754.08 1526.86 1571.59 1574.22 1822.96
Adequi[1:10,]
## CH04 CH06 adequi
## 1 1 -1 0.35
## 2 1 1 0.37
## 3 1 2 0.46
## 4 1 3 0.51
## 5 1 4 0.55
## 6 1 5 0.60
## 7 1 6 0.64
## 8 1 7 0.66
## 9 1 8 0.68
## 10 1 9 0.69
dic.regiones
## Region REGION
## 1 GBA 1
## 2 Pampeana 43
## 3 Noroeste 40
## 4 Noreste 41
## 5 Cuyo 42
## 6 Patagonia 44
5.1 Canastas Trimestrales por Region
Dado que en las bases de microdatos de EPH no se publica el mes correspondiente a cada uno de los registros individuales, las estimación de pobreza que pueden realizar los usuarios necesariamente debe ser a partir de canastas trimestrales.
Para ello, a partir de los datos mensuales de la Canasta Básica Alimentaria y Total publicados por INDEC, calculamos un valor trimestral de ambas canastas, para un Adulto Equivalente perteneciente a cada una de las regiones. A vez, necesitaremos una tabla que pueda unirse con la base de datos de la EPH para asignar a cada registro, su canasta correspondiente (acorde al trimestre y a la región).
CBA <- CBA %>%
mutate(Canasta = 'CBA')
CBT <- CBT %>%
mutate(Canasta = 'CBT')
Canastas_Reg <- bind_rows(CBA,CBT) %>%
gather(.,Region, Valor, c(3:(ncol(.)-1) )) %>%
mutate(Trimestre = case_when(Mes %in% c(1:3) ~1,
Mes %in% c(4:6) ~2,
Mes %in% c(7:9) ~3,
Mes %in% c(10:12) ~4),
Periodo = paste(Año, Trimestre, sep='.'))
Canastas_Reg[1:10,]
## Año Mes Canasta Region Valor Trimestre Periodo
## 1 2016 7 CBA GBA 1666.48 3 2016.3
## 2 2016 8 CBA GBA 1675.05 3 2016.3
## 3 2016 9 CBA GBA 1711.22 3 2016.3
## 4 2016 10 CBA GBA 1739.34 4 2016.4
## 5 2016 11 CBA GBA 1762.65 4 2016.4
## 6 2016 12 CBA GBA 1766.62 4 2016.4
## 7 2016 7 CBT GBA 4032.88 3 2016.3
## 8 2016 8 CBT GBA 4036.87 3 2016.3
## 9 2016 9 CBT GBA 4089.82 3 2016.3
## 10 2016 10 CBT GBA 4191.81 4 2016.4
Habiendo agregado el identificador del período, promediamos las canastas de un mismo trimestre y luego le agregamos el código de la region correspondiente que nos permitirá unir este Dataframe con la base de microdatos de la EPH
Canastas_Reg_2 <- Canastas_Reg %>%
group_by(Canasta, Region, Periodo) %>%
summarise(Valor = mean(Valor)) %>%
spread(., Canasta,Valor) %>%
left_join(., dic.regiones, by = "Region") %>%
ungroup()
Canastas_Reg_2
## # A tibble: 12 x 5
## Region Periodo CBA CBT REGION
## <chr> <chr> <dbl> <dbl> <dbl>
## 1 Cuyo 2016.3 1509. 3872. 42
## 2 Cuyo 2016.4 1570. 4030. 42
## 3 GBA 2016.3 1684. 4053. 1
## 4 GBA 2016.4 1756. 4232. 1
## 5 Noreste 2016.3 1513. 3414. 41
## 6 Noreste 2016.4 1568. 3539. 41
## 7 Noroeste 2016.3 1472. 3292. 40
## 8 Noroeste 2016.4 1525. 3412. 40
## 9 Pampeana 2016.3 1676. 4034. 43
## 10 Pampeana 2016.4 1746. 4209. 43
## 11 Patagonia 2016.3 1735. 4742. 44
## 12 Patagonia 2016.4 1813. 4963. 44
5.2 Unidades de Adulto Equivalente por hogar en la base Individual
- Incorporamos a cada registro de nuestra base la Unidad de Adulto Equivalente (UAE) correspondiente, matcheando las columnas de Edad (CH06) y Sexo (CH04) mediante la función left_join.
Pobreza_Individual <- Bases %>%
mutate(Periodo = paste(ANO4, TRIMESTRE, sep='.')) %>%
left_join(., Adequi, by = c("CH04", "CH06")) %>%
left_join(., Canastas_Reg_2, by = c("REGION", "Periodo"))
Pobreza_Individual[1:10,1:10]
## CODUSU NRO_HOGAR COMPONENTE ANO4 TRIMESTRE
## 1 TQRMNOQWXHLMMLCDEFIAH00469008 1 3 2016 3
## 2 TQRMNORPTHJMKTCDEFIAH00469111 1 1 2016 3
## 3 TQRMNORPTHJMKTCDEFIAH00469111 1 2 2016 3
## 4 TQRMNORPTHJMKTCDEFIAH00469111 1 3 2016 3
## 5 TQRMNORPTHJMKTCDEFIAH00469111 1 4 2016 3
## 6 TQRMNORPUHJMKTCDEFIAH00469112 1 1 2016 3
## 7 TQRMNORPUHJMKTCDEFIAH00469112 1 2 2016 3
## 8 TQRMNOTPSHJMKTCDEFIAH00469114 1 1 2016 3
## 9 TQRMNOTPSHJMKTCDEFIAH00469114 1 2 2016 3
## 10 TQRMNOTPSHJMKTCDEFIAH00469114 1 3 2016 3
## REGION AGLOMERADO PONDERA CH04 CH06
## 1 43 2 561 1 17
## 2 43 2 569 1 50
## 3 43 2 569 2 48
## 4 43 2 569 2 23
## 5 43 2 569 1 15
## 6 43 2 569 2 55
## 7 43 2 569 1 34
## 8 43 2 569 1 70
## 9 43 2 569 2 61
## 10 43 2 569 2 17
- Utilizamos la función group_by para calcular el total de UAE por hogar. Notesé que al usar la función mutate creamos una nueva columna, permitiendo conservar la dimensión individual de la base.
Pobreza_Individual_paso2 <- Pobreza_Individual %>%
group_by(CODUSU, NRO_HOGAR, Periodo) %>%
mutate(Adequi_hogar = sum(adequi)) %>%
ungroup()
Pobreza_Individual_paso2[1:10,1:10]
## # A tibble: 10 x 10
## CODUSU NRO_HOGAR COMPONENTE ANO4 TRIMESTRE REGION AGLOMERADO PONDERA
## <chr> <int> <int> <int> <int> <dbl> <int> <int>
## 1 TQRMN… 1 3 2016 3 43 2 561
## 2 TQRMN… 1 1 2016 3 43 2 569
## 3 TQRMN… 1 2 2016 3 43 2 569
## 4 TQRMN… 1 3 2016 3 43 2 569
## 5 TQRMN… 1 4 2016 3 43 2 569
## 6 TQRMN… 1 1 2016 3 43 2 569
## 7 TQRMN… 1 2 2016 3 43 2 569
## 8 TQRMN… 1 1 2016 3 43 2 569
## 9 TQRMN… 1 2 2016 3 43 2 569
## 10 TQRMN… 1 3 2016 3 43 2 569
## # … with 2 more variables: CH04 <dbl>, CH06 <dbl>
- En base a las UAE del hogar al que pertenece cada individuo calculamos el valor de las canastas que delimitan las lineas de pobreza e indigencia correspondientes.
- Realizamos la comparación lógica entre el Ingreso Total Familiar y las Canastas calculadas para asignar a cada individuo su “situación” mediante la función case_when.
Pobreza_Individual_paso3 <- Pobreza_Individual_paso2 %>%
mutate(CBA = CBA*Adequi_hogar,
CBT = CBT*Adequi_hogar,
Situacion = case_when(ITF<CBA ~ 'Indigente',
ITF>=CBA & ITF<CBT ~ 'Pobre',
ITF>=CBT ~ 'No.Pobre'))
Pobreza_Individual_paso3[1:10,1:10]
## # A tibble: 10 x 10
## CODUSU NRO_HOGAR COMPONENTE ANO4 TRIMESTRE REGION AGLOMERADO PONDERA
## <chr> <int> <int> <int> <int> <dbl> <int> <int>
## 1 TQRMN… 1 3 2016 3 43 2 561
## 2 TQRMN… 1 1 2016 3 43 2 569
## 3 TQRMN… 1 2 2016 3 43 2 569
## 4 TQRMN… 1 3 2016 3 43 2 569
## 5 TQRMN… 1 4 2016 3 43 2 569
## 6 TQRMN… 1 1 2016 3 43 2 569
## 7 TQRMN… 1 2 2016 3 43 2 569
## 8 TQRMN… 1 1 2016 3 43 2 569
## 9 TQRMN… 1 2 2016 3 43 2 569
## 10 TQRMN… 1 3 2016 3 43 2 569
## # … with 2 more variables: CH04 <dbl>, CH06 <dbl>
5.3 Cálculo de Tasas de Pobreza e Indigencia
Habiendo identificado a cada persona como pobre, indigente o no pobre el paso final para calcular la incidencia de la pobreza e indigencia requiere realizar un conteo de estos casos (Para lo cual se requiere sumar los ponderadores (PONDIH) de los registros que cumplen con una u otroa condición)
Pobreza_resumen <- Pobreza_Individual_paso3 %>%
group_by(Periodo) %>%
summarise(Tasa_pobreza = sum(PONDIH[Situacion %in% c('Pobre', 'Indigente')],na.rm = TRUE)/
sum(PONDIH,na.rm = TRUE),
Tasa_indigencia = sum(PONDIH[Situacion == 'Indigente'],na.rm = TRUE)/
sum(PONDIH,na.rm = TRUE))
Pobreza_resumen
## # A tibble: 2 x 3
## Periodo Tasa_pobreza Tasa_indigencia
## <chr> <dbl> <dbl>
## 1 2016.3 0.307 0.0662
## 2 2016.4 0.300 0.0568
En caso de querer calcular la pobreza para otros subgrupos poblacionales, simplemente se requiere replicar el cálculo con la tabla agrupada según la variable de interés
Pobreza_resumen_region <- Pobreza_Individual_paso3 %>%
group_by(Periodo,Region) %>%
summarise(Tasa_pobreza = sum(PONDIH[Situacion %in% c('Pobre', 'Indigente')],na.rm = TRUE)/
sum(PONDIH,na.rm = TRUE),
Tasa_indigencia = sum(PONDIH[Situacion == 'Indigente'],na.rm = TRUE)/
sum(PONDIH,na.rm = TRUE))
Pobreza_resumen_region
## # A tibble: 12 x 4
## # Groups: Periodo [2]
## Periodo Region Tasa_pobreza Tasa_indigencia
## <chr> <chr> <dbl> <dbl>
## 1 2016.3 Cuyo 0.350 0.0469
## 2 2016.3 GBA 0.304 0.0714
## 3 2016.3 Noreste 0.339 0.0575
## 4 2016.3 Noroeste 0.311 0.0530
## 5 2016.3 Pampeana 0.308 0.0716
## 6 2016.3 Patagonia 0.220 0.0349
## 7 2016.4 Cuyo 0.364 0.0405
## 8 2016.4 GBA 0.289 0.0597
## 9 2016.4 Noreste 0.319 0.0455
## 10 2016.4 Noroeste 0.322 0.0566
## 11 2016.4 Pampeana 0.301 0.0613
## 12 2016.4 Patagonia 0.258 0.0312
5.4 Ejercicios Para prácticar
- Calcular el % de pobreza e indigencia para mujeres y varones (3 y 4to trimestre 2017)
- Calcular el % de hogares bajo la linea de pobreza e indigencia, a nivel nacional y abierto por regiones (3 y 4to trimestre 2017)
5.5 Ejercicios de tarea
- Calcular el % de pobreza e indigencia para mujeres y varones en cada una de las regiones(3 y 4to trimestre 2017)