Capítulo 5 Cálculo de Pobreza por Línea

En esta clase abordaremos conceptos teóricos y definiciones metodológicas de la medición “indirecta” de la pobreza, a través del metodo usualmente conococido como “Porbreza por Línea”, acorde a la Metodología n° 22 de INDEC.
Luego, procederemos a realizar una estimación de la incidencia de la pobreza e indigencia por personas.

Conceptos a abordar:

Medición indirecta de la satisfacción de necesidades básicas
Umbral de necesidades energéticas y proteicas
Unidades de Adulto Equivalente
Composición de la canasta básica alimentaria (Diferenciación regional)
Población de Referencia
Coeficiente de Engel
Canasta Básica Total
Pobreza como fenómeno del hogar
Ingreso total familiar

Reiniciar R

Cargamos las librerías necesarias para realizar este ejercicio

library(tidyverse, warn = FALSE)
library(openxlsx, warn = FALSE)

Aprovechando la facilidad que presenta el R para trabajar con multiples bases de datos, realizaremos la estimación de la incidencia para 2 trimestres consecutivos. Previo a levantar las bases, definimos un vector que contiene las variables relevantes para el ejercicio. Luego a la hora de levantar aplicamos un select al *dataframe** para conservar solo estas variables. Finalmente, para realizar la estimación conjunta de los dos trimestres, unimos ambas bases de datos

var.ind <- c('CODUSU','NRO_HOGAR' ,'COMPONENTE','ANO4','TRIMESTRE','REGION',
             'AGLOMERADO', 'PONDERA', 'CH04', 'CH06', 'ITF', 'PONDIH','P21')

individual.316 <- read.table("Fuentes/usu_individual_t316.txt", sep=";", dec=",", header = TRUE, fill = TRUE) %>% 
  select(var.ind)
individual.416 <- read.table("Fuentes/usu_individual_t416.txt", sep=";", dec=",", header = TRUE, fill = TRUE) %>% 
  select(var.ind)

Bases <- bind_rows(individual.316,individual.416)

A su vez levantaremos las siguientes fuentes secundarias:

Unidades de Adulto equivalente según sexo y edad
Canasta Básica Alimentaria Regionales de cada una de las regiones
Canasta Básica Total Regionales de cada una de las regiones
Diccionario de códigos de regiones y aglomerados de EPH

La información de estos cuadros fue extraída del comunicado de pobreza.

Adequi <- read.xlsx("Fuentes/ADEQUI.xlsx")
CBA    <- read.xlsx("Fuentes/CANASTAS.xlsx",sheet = "CBA")
CBT    <- read.xlsx("Fuentes/CANASTAS.xlsx",sheet = "CBT")
dic.regiones <- read.xlsx("Fuentes/Regiones.xlsx")

CBT

##    Año Mes     GBA Pampeana Noroeste Noreste    Cuyo Patagonia
## 1 2016   7 4032.88  4017.66  3281.04 3396.40 3854.62   4712.59
## 2 2016   8 4036.87  4007.81  3269.01 3394.32 3844.95   4723.38
## 3 2016   9 4089.82  4075.69  3326.94 3451.12 3917.54   4790.98
## 4 2016  10 4191.81  4173.73  3397.68 3524.49 4006.63   4924.99
## 5 2016  11 4247.99  4225.38  3417.85 3539.66 4038.84   4967.62
## 6 2016  12 4257.55  4227.33  3420.17 3551.79 4045.75   4994.91

CBA

##    Año Mes     GBA Pampeana Noroeste Noreste    Cuyo Patagonia
## 1 2016   7 1666.48  1660.19  1458.24 1496.21 1494.04   1713.67
## 2 2016   8 1675.05  1662.99  1459.38 1501.91 1496.09   1723.86
## 3 2016   9 1711.22  1705.31  1498.62 1540.68 1536.29   1767.89
## 4 2016  10 1739.34  1731.84  1516.82 1559.51 1559.00   1797.44
## 5 2016  11 1762.65  1753.27  1532.67 1573.18 1577.67   1819.64
## 6 2016  12 1766.62  1754.08  1526.86 1571.59 1574.22   1822.96

Adequi[1:10,]

##    CH04 CH06 adequi
## 1     1   -1   0.35
## 2     1    1   0.37
## 3     1    2   0.46
## 4     1    3   0.51
## 5     1    4   0.55
## 6     1    5   0.60
## 7     1    6   0.64
## 8     1    7   0.66
## 9     1    8   0.68
## 10    1    9   0.69

dic.regiones

##      Region REGION
## 1       GBA      1
## 2  Pampeana     43
## 3  Noroeste     40
## 4   Noreste     41
## 5      Cuyo     42
## 6 Patagonia     44

5.1 Canastas Trimestrales por Region

Dado que en las bases de microdatos de EPH no se publica el mes correspondiente a cada uno de los registros individuales, las estimación de pobreza que pueden realizar los usuarios necesariamente debe ser a partir de canastas trimestrales.

Para ello, a partir de los datos mensuales de la Canasta Básica Alimentaria y Total publicados por INDEC, calculamos un valor trimestral de ambas canastas, para un Adulto Equivalente perteneciente a cada una de las regiones. A vez, necesitaremos una tabla que pueda unirse con la base de datos de la EPH para asignar a cada registro, su canasta correspondiente (acorde al trimestre y a la región).

CBA <- CBA %>% 
  mutate(Canasta = 'CBA')

CBT <- CBT %>% 
  mutate(Canasta = 'CBT')

Canastas_Reg <- bind_rows(CBA,CBT)                       %>% 
  gather(.,Region, Valor, c(3:(ncol(.)-1) ))             %>%
  mutate(Trimestre = case_when(Mes %in% c(1:3)   ~1,
                               Mes %in% c(4:6)   ~2,
                               Mes %in% c(7:9)   ~3,
                               Mes %in% c(10:12) ~4),
         Periodo = paste(Año, Trimestre, sep='.'))      
Canastas_Reg[1:10,]

##     Año Mes Canasta Region   Valor Trimestre Periodo
## 1  2016   7     CBA    GBA 1666.48         3  2016.3
## 2  2016   8     CBA    GBA 1675.05         3  2016.3
## 3  2016   9     CBA    GBA 1711.22         3  2016.3
## 4  2016  10     CBA    GBA 1739.34         4  2016.4
## 5  2016  11     CBA    GBA 1762.65         4  2016.4
## 6  2016  12     CBA    GBA 1766.62         4  2016.4
## 7  2016   7     CBT    GBA 4032.88         3  2016.3
## 8  2016   8     CBT    GBA 4036.87         3  2016.3
## 9  2016   9     CBT    GBA 4089.82         3  2016.3
## 10 2016  10     CBT    GBA 4191.81         4  2016.4

Habiendo agregado el identificador del período, promediamos las canastas de un mismo trimestre y luego le agregamos el código de la region correspondiente que nos permitirá unir este Dataframe con la base de microdatos de la EPH

Canastas_Reg_2 <- Canastas_Reg %>% 
  group_by(Canasta, Region, Periodo)                     %>% 
  summarise(Valor = mean(Valor))                         %>% 
  spread(., Canasta,Valor)                               %>% 
  left_join(., dic.regiones, by = "Region")              %>% 
  ungroup()                                              
Canastas_Reg_2

## # A tibble: 12 x 5
##    Region    Periodo   CBA   CBT REGION
##    <chr>     <chr>   <dbl> <dbl>  <dbl>
##  1 Cuyo      2016.3  1509. 3872.     42
##  2 Cuyo      2016.4  1570. 4030.     42
##  3 GBA       2016.3  1684. 4053.      1
##  4 GBA       2016.4  1756. 4232.      1
##  5 Noreste   2016.3  1513. 3414.     41
##  6 Noreste   2016.4  1568. 3539.     41
##  7 Noroeste  2016.3  1472. 3292.     40
##  8 Noroeste  2016.4  1525. 3412.     40
##  9 Pampeana  2016.3  1676. 4034.     43
## 10 Pampeana  2016.4  1746. 4209.     43
## 11 Patagonia 2016.3  1735. 4742.     44
## 12 Patagonia 2016.4  1813. 4963.     44

5.2 Unidades de Adulto Equivalente por hogar en la base Individual

Incorporamos a cada registro de nuestra base la Unidad de Adulto Equivalente (UAE) correspondiente, matcheando las columnas de Edad (CH06) y Sexo (CH04) mediante la función left_join.

Pobreza_Individual <- Bases %>% 
  mutate(Periodo = paste(ANO4, TRIMESTRE, sep='.')) %>% 
  left_join(., Adequi, by = c("CH04", "CH06")) %>% 
  left_join(., Canastas_Reg_2, by = c("REGION", "Periodo"))    


Pobreza_Individual[1:10,1:10]

##                           CODUSU NRO_HOGAR COMPONENTE ANO4 TRIMESTRE
## 1  TQRMNOQWXHLMMLCDEFIAH00469008         1          3 2016         3
## 2  TQRMNORPTHJMKTCDEFIAH00469111         1          1 2016         3
## 3  TQRMNORPTHJMKTCDEFIAH00469111         1          2 2016         3
## 4  TQRMNORPTHJMKTCDEFIAH00469111         1          3 2016         3
## 5  TQRMNORPTHJMKTCDEFIAH00469111         1          4 2016         3
## 6  TQRMNORPUHJMKTCDEFIAH00469112         1          1 2016         3
## 7  TQRMNORPUHJMKTCDEFIAH00469112         1          2 2016         3
## 8  TQRMNOTPSHJMKTCDEFIAH00469114         1          1 2016         3
## 9  TQRMNOTPSHJMKTCDEFIAH00469114         1          2 2016         3
## 10 TQRMNOTPSHJMKTCDEFIAH00469114         1          3 2016         3
##    REGION AGLOMERADO PONDERA CH04 CH06
## 1      43          2     561    1   17
## 2      43          2     569    1   50
## 3      43          2     569    2   48
## 4      43          2     569    2   23
## 5      43          2     569    1   15
## 6      43          2     569    2   55
## 7      43          2     569    1   34
## 8      43          2     569    1   70
## 9      43          2     569    2   61
## 10     43          2     569    2   17

Utilizamos la función group_by para calcular el total de UAE por hogar. Notesé que al usar la función mutate creamos una nueva columna, permitiendo conservar la dimensión individual de la base.

Pobreza_Individual_paso2 <- Pobreza_Individual %>%  
  group_by(CODUSU, NRO_HOGAR, Periodo)                          %>% 
  mutate(Adequi_hogar = sum(adequi))                            %>%
  ungroup()                                                      
Pobreza_Individual_paso2[1:10,1:10]

## # A tibble: 10 x 10
##    CODUSU NRO_HOGAR COMPONENTE  ANO4 TRIMESTRE REGION AGLOMERADO PONDERA
##    <chr>      <int>      <int> <int>     <int>  <dbl>      <int>   <int>
##  1 TQRMN…         1          3  2016         3     43          2     561
##  2 TQRMN…         1          1  2016         3     43          2     569
##  3 TQRMN…         1          2  2016         3     43          2     569
##  4 TQRMN…         1          3  2016         3     43          2     569
##  5 TQRMN…         1          4  2016         3     43          2     569
##  6 TQRMN…         1          1  2016         3     43          2     569
##  7 TQRMN…         1          2  2016         3     43          2     569
##  8 TQRMN…         1          1  2016         3     43          2     569
##  9 TQRMN…         1          2  2016         3     43          2     569
## 10 TQRMN…         1          3  2016         3     43          2     569
## # … with 2 more variables: CH04 <dbl>, CH06 <dbl>

En base a las UAE del hogar al que pertenece cada individuo calculamos el valor de las canastas que delimitan las lineas de pobreza e indigencia correspondientes.
Realizamos la comparación lógica entre el Ingreso Total Familiar y las Canastas calculadas para asignar a cada individuo su “situación” mediante la función case_when.

Pobreza_Individual_paso3 <-  Pobreza_Individual_paso2 %>% 
 mutate(CBA = CBA*Adequi_hogar,
        CBT = CBT*Adequi_hogar,
        Situacion = case_when(ITF<CBA            ~ 'Indigente',
                               ITF>=CBA & ITF<CBT ~ 'Pobre',
                               ITF>=CBT           ~ 'No.Pobre'))  

Pobreza_Individual_paso3[1:10,1:10]

## # A tibble: 10 x 10
##    CODUSU NRO_HOGAR COMPONENTE  ANO4 TRIMESTRE REGION AGLOMERADO PONDERA
##    <chr>      <int>      <int> <int>     <int>  <dbl>      <int>   <int>
##  1 TQRMN…         1          3  2016         3     43          2     561
##  2 TQRMN…         1          1  2016         3     43          2     569
##  3 TQRMN…         1          2  2016         3     43          2     569
##  4 TQRMN…         1          3  2016         3     43          2     569
##  5 TQRMN…         1          4  2016         3     43          2     569
##  6 TQRMN…         1          1  2016         3     43          2     569
##  7 TQRMN…         1          2  2016         3     43          2     569
##  8 TQRMN…         1          1  2016         3     43          2     569
##  9 TQRMN…         1          2  2016         3     43          2     569
## 10 TQRMN…         1          3  2016         3     43          2     569
## # … with 2 more variables: CH04 <dbl>, CH06 <dbl>

5.3 Cálculo de Tasas de Pobreza e Indigencia

Habiendo identificado a cada persona como pobre, indigente o no pobre el paso final para calcular la incidencia de la pobreza e indigencia requiere realizar un conteo de estos casos (Para lo cual se requiere sumar los ponderadores (PONDIH) de los registros que cumplen con una u otroa condición)

Pobreza_resumen <- Pobreza_Individual_paso3 %>% 
  group_by(Periodo) %>% 
  summarise(Tasa_pobreza    = sum(PONDIH[Situacion %in% c('Pobre', 'Indigente')],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE),
            
            Tasa_indigencia = sum(PONDIH[Situacion == 'Indigente'],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE)) 
Pobreza_resumen

## # A tibble: 2 x 3
##   Periodo Tasa_pobreza Tasa_indigencia
##   <chr>          <dbl>           <dbl>
## 1 2016.3         0.307          0.0662
## 2 2016.4         0.300          0.0568

En caso de querer calcular la pobreza para otros subgrupos poblacionales, simplemente se requiere replicar el cálculo con la tabla agrupada según la variable de interés

Pobreza_resumen_region <- Pobreza_Individual_paso3 %>% 
  group_by(Periodo,Region) %>% 
  summarise(Tasa_pobreza    = sum(PONDIH[Situacion %in% c('Pobre', 'Indigente')],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE),
            
            Tasa_indigencia = sum(PONDIH[Situacion == 'Indigente'],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE)) 
Pobreza_resumen_region

## # A tibble: 12 x 4
## # Groups:   Periodo [2]
##    Periodo Region    Tasa_pobreza Tasa_indigencia
##    <chr>   <chr>            <dbl>           <dbl>
##  1 2016.3  Cuyo             0.350          0.0469
##  2 2016.3  GBA              0.304          0.0714
##  3 2016.3  Noreste          0.339          0.0575
##  4 2016.3  Noroeste         0.311          0.0530
##  5 2016.3  Pampeana         0.308          0.0716
##  6 2016.3  Patagonia        0.220          0.0349
##  7 2016.4  Cuyo             0.364          0.0405
##  8 2016.4  GBA              0.289          0.0597
##  9 2016.4  Noreste          0.319          0.0455
## 10 2016.4  Noroeste         0.322          0.0566
## 11 2016.4  Pampeana         0.301          0.0613
## 12 2016.4  Patagonia        0.258          0.0312

5.4 Ejercicios Para prácticar

Calcular el % de pobreza e indigencia para mujeres y varones (3 y 4to trimestre 2017)
Calcular el % de hogares bajo la linea de pobreza e indigencia, a nivel nacional y abierto por regiones (3 y 4to trimestre 2017)

5.5 Ejercicios de tarea

Calcular el % de pobreza e indigencia para mujeres y varones en cada una de las regiones(3 y 4to trimestre 2017)