Capítulo 5 Cálculo de Pobreza por Línea

En esta clase abordaremos conceptos teóricos y definiciones metodológicas de la medición “indirecta” de la pobreza, a través del metodo usualmente conococido como “Porbreza por Línea”, acorde a la Metodología n° 22 de INDEC.
Luego, procederemos a realizar una estimación de la incidencia de la pobreza e indigencia por personas.

Conceptos a abordar:

  • Medición indirecta de la satisfacción de necesidades básicas
  • Umbral de necesidades energéticas y proteicas
  • Unidades de Adulto Equivalente
  • Composición de la canasta básica alimentaria (Diferenciación regional)
  • Población de Referencia
  • Coeficiente de Engel
  • Canasta Básica Total
  • Pobreza como fenómeno del hogar
  • Ingreso total familiar

Reiniciar R

Cargamos las librerías necesarias para realizar este ejercicio

library(tidyverse, warn = FALSE)
library(openxlsx, warn = FALSE)

Aprovechando la facilidad que presenta el R para trabajar con multiples bases de datos, realizaremos la estimación de la incidencia para 2 trimestres consecutivos. Previo a levantar las bases, definimos un vector que contiene las variables relevantes para el ejercicio. Luego a la hora de levantar aplicamos un select al *dataframe** para conservar solo estas variables. Finalmente, para realizar la estimación conjunta de los dos trimestres, unimos ambas bases de datos

var.ind <- c('CODUSU','NRO_HOGAR' ,'COMPONENTE','ANO4','TRIMESTRE','REGION',
             'AGLOMERADO', 'PONDERA', 'CH04', 'CH06', 'ITF', 'PONDIH','P21')

individual.316 <- read.table("Fuentes/usu_individual_t316.txt", sep=";", dec=",", header = TRUE, fill = TRUE) %>% 
  select(var.ind)
individual.416 <- read.table("Fuentes/usu_individual_t416.txt", sep=";", dec=",", header = TRUE, fill = TRUE) %>% 
  select(var.ind)

Bases <- bind_rows(individual.316,individual.416)

A su vez levantaremos las siguientes fuentes secundarias:

  • Unidades de Adulto equivalente según sexo y edad
  • Canasta Básica Alimentaria Regionales de cada una de las regiones
  • Canasta Básica Total Regionales de cada una de las regiones
  • Diccionario de códigos de regiones y aglomerados de EPH

La información de estos cuadros fue extraída del comunicado de pobreza.

Adequi <- read.xlsx("Fuentes/ADEQUI.xlsx")
CBA    <- read.xlsx("Fuentes/CANASTAS.xlsx",sheet = "CBA")
CBT    <- read.xlsx("Fuentes/CANASTAS.xlsx",sheet = "CBT")
dic.regiones <- read.xlsx("Fuentes/Regiones.xlsx")

CBT
##    Año Mes     GBA Pampeana Noroeste Noreste    Cuyo Patagonia
## 1 2016   7 4032.88  4017.66  3281.04 3396.40 3854.62   4712.59
## 2 2016   8 4036.87  4007.81  3269.01 3394.32 3844.95   4723.38
## 3 2016   9 4089.82  4075.69  3326.94 3451.12 3917.54   4790.98
## 4 2016  10 4191.81  4173.73  3397.68 3524.49 4006.63   4924.99
## 5 2016  11 4247.99  4225.38  3417.85 3539.66 4038.84   4967.62
## 6 2016  12 4257.55  4227.33  3420.17 3551.79 4045.75   4994.91
CBA
##    Año Mes     GBA Pampeana Noroeste Noreste    Cuyo Patagonia
## 1 2016   7 1666.48  1660.19  1458.24 1496.21 1494.04   1713.67
## 2 2016   8 1675.05  1662.99  1459.38 1501.91 1496.09   1723.86
## 3 2016   9 1711.22  1705.31  1498.62 1540.68 1536.29   1767.89
## 4 2016  10 1739.34  1731.84  1516.82 1559.51 1559.00   1797.44
## 5 2016  11 1762.65  1753.27  1532.67 1573.18 1577.67   1819.64
## 6 2016  12 1766.62  1754.08  1526.86 1571.59 1574.22   1822.96
Adequi[1:10,]
##    CH04 CH06 adequi
## 1     1   -1   0.35
## 2     1    1   0.37
## 3     1    2   0.46
## 4     1    3   0.51
## 5     1    4   0.55
## 6     1    5   0.60
## 7     1    6   0.64
## 8     1    7   0.66
## 9     1    8   0.68
## 10    1    9   0.69
dic.regiones
##      Region REGION
## 1       GBA      1
## 2  Pampeana     43
## 3  Noroeste     40
## 4   Noreste     41
## 5      Cuyo     42
## 6 Patagonia     44

5.1 Canastas Trimestrales por Region

Dado que en las bases de microdatos de EPH no se publica el mes correspondiente a cada uno de los registros individuales, las estimación de pobreza que pueden realizar los usuarios necesariamente debe ser a partir de canastas trimestrales.

Para ello, a partir de los datos mensuales de la Canasta Básica Alimentaria y Total publicados por INDEC, calculamos un valor trimestral de ambas canastas, para un Adulto Equivalente perteneciente a cada una de las regiones. A vez, necesitaremos una tabla que pueda unirse con la base de datos de la EPH para asignar a cada registro, su canasta correspondiente (acorde al trimestre y a la región).

CBA <- CBA %>% 
  mutate(Canasta = 'CBA')

CBT <- CBT %>% 
  mutate(Canasta = 'CBT')

Canastas_Reg <- bind_rows(CBA,CBT)                       %>% 
  gather(.,Region, Valor, c(3:(ncol(.)-1) ))             %>%
  mutate(Trimestre = case_when(Mes %in% c(1:3)   ~1,
                               Mes %in% c(4:6)   ~2,
                               Mes %in% c(7:9)   ~3,
                               Mes %in% c(10:12) ~4),
         Periodo = paste(Año, Trimestre, sep='.'))      
Canastas_Reg[1:10,]
##     Año Mes Canasta Region   Valor Trimestre Periodo
## 1  2016   7     CBA    GBA 1666.48         3  2016.3
## 2  2016   8     CBA    GBA 1675.05         3  2016.3
## 3  2016   9     CBA    GBA 1711.22         3  2016.3
## 4  2016  10     CBA    GBA 1739.34         4  2016.4
## 5  2016  11     CBA    GBA 1762.65         4  2016.4
## 6  2016  12     CBA    GBA 1766.62         4  2016.4
## 7  2016   7     CBT    GBA 4032.88         3  2016.3
## 8  2016   8     CBT    GBA 4036.87         3  2016.3
## 9  2016   9     CBT    GBA 4089.82         3  2016.3
## 10 2016  10     CBT    GBA 4191.81         4  2016.4

Habiendo agregado el identificador del período, promediamos las canastas de un mismo trimestre y luego le agregamos el código de la region correspondiente que nos permitirá unir este Dataframe con la base de microdatos de la EPH

Canastas_Reg_2 <- Canastas_Reg %>% 
  group_by(Canasta, Region, Periodo)                     %>% 
  summarise(Valor = mean(Valor))                         %>% 
  spread(., Canasta,Valor)                               %>% 
  left_join(., dic.regiones, by = "Region")              %>% 
  ungroup()                                              
Canastas_Reg_2
## # A tibble: 12 x 5
##    Region    Periodo   CBA   CBT REGION
##    <chr>     <chr>   <dbl> <dbl>  <dbl>
##  1 Cuyo      2016.3  1509. 3872.     42
##  2 Cuyo      2016.4  1570. 4030.     42
##  3 GBA       2016.3  1684. 4053.      1
##  4 GBA       2016.4  1756. 4232.      1
##  5 Noreste   2016.3  1513. 3414.     41
##  6 Noreste   2016.4  1568. 3539.     41
##  7 Noroeste  2016.3  1472. 3292.     40
##  8 Noroeste  2016.4  1525. 3412.     40
##  9 Pampeana  2016.3  1676. 4034.     43
## 10 Pampeana  2016.4  1746. 4209.     43
## 11 Patagonia 2016.3  1735. 4742.     44
## 12 Patagonia 2016.4  1813. 4963.     44

5.2 Unidades de Adulto Equivalente por hogar en la base Individual

  1. Incorporamos a cada registro de nuestra base la Unidad de Adulto Equivalente (UAE) correspondiente, matcheando las columnas de Edad (CH06) y Sexo (CH04) mediante la función left_join.
Pobreza_Individual <- Bases %>% 
  mutate(Periodo = paste(ANO4, TRIMESTRE, sep='.')) %>% 
  left_join(., Adequi, by = c("CH04", "CH06")) %>% 
  left_join(., Canastas_Reg_2, by = c("REGION", "Periodo"))    


Pobreza_Individual[1:10,1:10]
##                           CODUSU NRO_HOGAR COMPONENTE ANO4 TRIMESTRE
## 1  TQRMNOQWXHLMMLCDEFIAH00469008         1          3 2016         3
## 2  TQRMNORPTHJMKTCDEFIAH00469111         1          1 2016         3
## 3  TQRMNORPTHJMKTCDEFIAH00469111         1          2 2016         3
## 4  TQRMNORPTHJMKTCDEFIAH00469111         1          3 2016         3
## 5  TQRMNORPTHJMKTCDEFIAH00469111         1          4 2016         3
## 6  TQRMNORPUHJMKTCDEFIAH00469112         1          1 2016         3
## 7  TQRMNORPUHJMKTCDEFIAH00469112         1          2 2016         3
## 8  TQRMNOTPSHJMKTCDEFIAH00469114         1          1 2016         3
## 9  TQRMNOTPSHJMKTCDEFIAH00469114         1          2 2016         3
## 10 TQRMNOTPSHJMKTCDEFIAH00469114         1          3 2016         3
##    REGION AGLOMERADO PONDERA CH04 CH06
## 1      43          2     561    1   17
## 2      43          2     569    1   50
## 3      43          2     569    2   48
## 4      43          2     569    2   23
## 5      43          2     569    1   15
## 6      43          2     569    2   55
## 7      43          2     569    1   34
## 8      43          2     569    1   70
## 9      43          2     569    2   61
## 10     43          2     569    2   17
  1. Utilizamos la función group_by para calcular el total de UAE por hogar. Notesé que al usar la función mutate creamos una nueva columna, permitiendo conservar la dimensión individual de la base.
Pobreza_Individual_paso2 <- Pobreza_Individual %>%  
  group_by(CODUSU, NRO_HOGAR, Periodo)                          %>% 
  mutate(Adequi_hogar = sum(adequi))                            %>%
  ungroup()                                                      
Pobreza_Individual_paso2[1:10,1:10]
## # A tibble: 10 x 10
##    CODUSU NRO_HOGAR COMPONENTE  ANO4 TRIMESTRE REGION AGLOMERADO PONDERA
##    <chr>      <int>      <int> <int>     <int>  <dbl>      <int>   <int>
##  1 TQRMN…         1          3  2016         3     43          2     561
##  2 TQRMN…         1          1  2016         3     43          2     569
##  3 TQRMN…         1          2  2016         3     43          2     569
##  4 TQRMN…         1          3  2016         3     43          2     569
##  5 TQRMN…         1          4  2016         3     43          2     569
##  6 TQRMN…         1          1  2016         3     43          2     569
##  7 TQRMN…         1          2  2016         3     43          2     569
##  8 TQRMN…         1          1  2016         3     43          2     569
##  9 TQRMN…         1          2  2016         3     43          2     569
## 10 TQRMN…         1          3  2016         3     43          2     569
## # … with 2 more variables: CH04 <dbl>, CH06 <dbl>
  1. En base a las UAE del hogar al que pertenece cada individuo calculamos el valor de las canastas que delimitan las lineas de pobreza e indigencia correspondientes.
  2. Realizamos la comparación lógica entre el Ingreso Total Familiar y las Canastas calculadas para asignar a cada individuo su “situación” mediante la función case_when.
Pobreza_Individual_paso3 <-  Pobreza_Individual_paso2 %>% 
 mutate(CBA = CBA*Adequi_hogar,
        CBT = CBT*Adequi_hogar,
        Situacion = case_when(ITF<CBA            ~ 'Indigente',
                               ITF>=CBA & ITF<CBT ~ 'Pobre',
                               ITF>=CBT           ~ 'No.Pobre'))  

Pobreza_Individual_paso3[1:10,1:10]
## # A tibble: 10 x 10
##    CODUSU NRO_HOGAR COMPONENTE  ANO4 TRIMESTRE REGION AGLOMERADO PONDERA
##    <chr>      <int>      <int> <int>     <int>  <dbl>      <int>   <int>
##  1 TQRMN…         1          3  2016         3     43          2     561
##  2 TQRMN…         1          1  2016         3     43          2     569
##  3 TQRMN…         1          2  2016         3     43          2     569
##  4 TQRMN…         1          3  2016         3     43          2     569
##  5 TQRMN…         1          4  2016         3     43          2     569
##  6 TQRMN…         1          1  2016         3     43          2     569
##  7 TQRMN…         1          2  2016         3     43          2     569
##  8 TQRMN…         1          1  2016         3     43          2     569
##  9 TQRMN…         1          2  2016         3     43          2     569
## 10 TQRMN…         1          3  2016         3     43          2     569
## # … with 2 more variables: CH04 <dbl>, CH06 <dbl>

5.3 Cálculo de Tasas de Pobreza e Indigencia

Habiendo identificado a cada persona como pobre, indigente o no pobre el paso final para calcular la incidencia de la pobreza e indigencia requiere realizar un conteo de estos casos (Para lo cual se requiere sumar los ponderadores (PONDIH) de los registros que cumplen con una u otroa condición)

Pobreza_resumen <- Pobreza_Individual_paso3 %>% 
  group_by(Periodo) %>% 
  summarise(Tasa_pobreza    = sum(PONDIH[Situacion %in% c('Pobre', 'Indigente')],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE),
            
            Tasa_indigencia = sum(PONDIH[Situacion == 'Indigente'],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE)) 
Pobreza_resumen
## # A tibble: 2 x 3
##   Periodo Tasa_pobreza Tasa_indigencia
##   <chr>          <dbl>           <dbl>
## 1 2016.3         0.307          0.0662
## 2 2016.4         0.300          0.0568

En caso de querer calcular la pobreza para otros subgrupos poblacionales, simplemente se requiere replicar el cálculo con la tabla agrupada según la variable de interés

Pobreza_resumen_region <- Pobreza_Individual_paso3 %>% 
  group_by(Periodo,Region) %>% 
  summarise(Tasa_pobreza    = sum(PONDIH[Situacion %in% c('Pobre', 'Indigente')],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE),
            
            Tasa_indigencia = sum(PONDIH[Situacion == 'Indigente'],na.rm = TRUE)/
                              sum(PONDIH,na.rm = TRUE)) 
Pobreza_resumen_region
## # A tibble: 12 x 4
## # Groups:   Periodo [2]
##    Periodo Region    Tasa_pobreza Tasa_indigencia
##    <chr>   <chr>            <dbl>           <dbl>
##  1 2016.3  Cuyo             0.350          0.0469
##  2 2016.3  GBA              0.304          0.0714
##  3 2016.3  Noreste          0.339          0.0575
##  4 2016.3  Noroeste         0.311          0.0530
##  5 2016.3  Pampeana         0.308          0.0716
##  6 2016.3  Patagonia        0.220          0.0349
##  7 2016.4  Cuyo             0.364          0.0405
##  8 2016.4  GBA              0.289          0.0597
##  9 2016.4  Noreste          0.319          0.0455
## 10 2016.4  Noroeste         0.322          0.0566
## 11 2016.4  Pampeana         0.301          0.0613
## 12 2016.4  Patagonia        0.258          0.0312

5.4 Ejercicios Para prácticar

  • Calcular el % de pobreza e indigencia para mujeres y varones (3 y 4to trimestre 2017)
  • Calcular el % de hogares bajo la linea de pobreza e indigencia, a nivel nacional y abierto por regiones (3 y 4to trimestre 2017)

5.5 Ejercicios de tarea

  • Calcular el % de pobreza e indigencia para mujeres y varones en cada una de las regiones(3 y 4to trimestre 2017)