En esta sección trabajaremos con las bases de la Encuesta Permanente de Hogares del INDEC, para ejemplificar la forma de trabajar con encuestas en general. Realizaremos tres ejercicios que luego serán replicados, en la sección de práctica independiente, pero con la Encuesta Anual de Hogares de CABA.
Encuesta Permanente de Hogares
Recomendaciones para trabajar con esta encuesta:
- Tener a mano el diseño de registro
- Utilizar el paquete
eph
- Si queremos estar seguros sobre la definición de una categoría, apelar a los documentos metodológicos (por ejemplo: el caso de los asalariados encubiertos)
- tirar frecuencias o plots de las variables antes de usarlas (-9, 0, NAs, etc…)
Cargamos las librerías
# install.packages("eph")
library(eph) # para trabajar con EPH
library(tidyverse)
library(expss) # para trabajar con la etiqueta de los datos
Cargamos las bases con una función del paquete eph
, que no va a descargar en disco la información pero sí la va a cargar en el entorno de trabajo de R.
?eph::get_microdata
individual <- get_microdata(year = 2019, trimester = 1, type = 'individual')
trying URL 'https://www.indec.gob.ar/ftp/cuadros/menusuperior/eph/EPH_usu_1_Trim_2019_txt.zip'
Content type 'application/x-zip-compressed' length 3377209 bytes (3.2 MB)
==================================================
downloaded 3.2 MB
hogar <- get_microdata(year = 2019, trimester = 1, type = 'hogar')
trying URL 'https://www.indec.gob.ar/ftp/cuadros/menusuperior/eph/EPH_usu_1_Trim_2019_txt.zip'
Content type 'application/x-zip-compressed' length 3377209 bytes (3.2 MB)
==================================================
downloaded 3.2 MB
Sobre las bases:
- Qué tienen en común (CODUSU, NRO_HOGAR)
- Para qué nos pueden servir esas variables en común
glimpse(hogar)
glimpse(individual)
- La función
organize_labels()
permite etiquetar los datos
- Seleccionamos variables relevantes para el ejercicio: información contenida en cada una
individual <- organize_labels(individual, type = 'individual') %>%
select(CODUSU, NRO_HOGAR, AGLOMERADO, COMPONENTE, CH04, ESTADO, CAT_OCUP, P21, P47T, PONDERA, PONDII, PONDIIO)
hogar <- organize_labels(hogar, type = 'hogar') %>%
select(CODUSU, NRO_HOGAR, IV12_2, IV12_3)
Ejercicio 1
Cuántas personas viven en viviendas ubicadas en villas de emergencias y en zonas inundables?
Notemos que la pregunta refiere a las personas, pero la información sobre la ubicación de la vivienda figura en la base de hogares.
- Join de bases individual y hogar (y al revés?)
- Las variables de filtro y agrupamiento
- El rol de los ponderadores
- Función para mostrar los resultados etiquetados
ejercicio1 <- left_join(individual, hogar, by = c("CODUSU", "NRO_HOGAR")) %>%
filter(IV12_2 == 1 | IV12_3 == 1) %>%
group_by(IV12_2, IV12_3) %>%
summarise(Cantidad = sum(PONDERA)) %>%
expss::values2labels(.)
ejercicio1
Ejercicio 2
Calcular el ingreso de la ocupación principal promedio, para las/os ocupadas/os por aglomerados y sexo
- La variable de filtro
- Las variables de agrupamiento
- La media ponderada y un nuevo ponderador
- Cálculo de la brecha
- Función para presentar en formato porcentual
ejercicio2 <- individual %>%
filter(ESTADO == 1) %>%
group_by(AGLOMERADO, CH04) %>%
summarise(promedio_iop = weighted.mean(P21, PONDIIO)) %>% # ponderador
spread(., CH04, promedio_iop) %>%
expss::values2labels(.) %>%
mutate(Brecha = ((Varon - Mujer)/Varon)) %>%
arrange(-Brecha) %>%
mutate(Brecha = scales::percent(Brecha))
ejercicio2
Ejercicio 3
Calcular el ingreso total individual promedio, para quienes perciben ingresos, por aglomerados y sexo
- La variable de filtro: Ingreso total individual positivo
- Las variables de agrupamiento: El aglomerado y el sexo
- Un nuevo ponderador
ejercicio3 <- individual %>%
filter(P47T > 0) %>%
group_by(AGLOMERADO, CH04) %>%
summarise(promedio_iti = weighted.mean(P47T, PONDII)) %>% # ponderador
spread(., CH04, promedio_iti) %>%
expss::values2labels(.) %>%
mutate(Brecha = ((Varon - Mujer)/Varon)) %>%
arrange(-Brecha) %>%
mutate(Brecha = scales::percent(Brecha))
ejercicio3
LS0tCnRpdGxlOiBBbsOhbGlzaXMgZGUgZW5jdWVzdGFzCm91dHB1dDoKICBodG1sX25vdGVib29rOgogICAgdG9jOiB5ZXMKICAgIHRvY19mbG9hdDogeWVzCmRhdGU6ICIiCnN1YnRpdGxlOiBQcsOhY3RpY2EgR3VpYWRhCi0tLQoKRW4gZXN0YSBzZWNjacOzbiB0cmFiYWphcmVtb3MgY29uIGxhcyBiYXNlcyBkZSBsYSBFbmN1ZXN0YSBQZXJtYW5lbnRlIGRlIEhvZ2FyZXMgZGVsIElOREVDLCBwYXJhIGVqZW1wbGlmaWNhciBsYSBmb3JtYSBkZSB0cmFiYWphciBjb24gZW5jdWVzdGFzIGVuIGdlbmVyYWwuIFJlYWxpemFyZW1vcyB0cmVzIGVqZXJjaWNpb3MgcXVlIGx1ZWdvIHNlcsOhbiByZXBsaWNhZG9zLCBlbiBsYSBzZWNjacOzbiBkZSBfcHLDoWN0aWNhIGluZGVwZW5kaWVudGVfLCBwZXJvIGNvbiBsYSBFbmN1ZXN0YSBBbnVhbCBkZSBIb2dhcmVzIGRlIENBQkEuCgo+IFJlaW5pY2lhciBSCgojIyMgRW5jdWVzdGEgUGVybWFuZW50ZSBkZSBIb2dhcmVzCgpSZWNvbWVuZGFjaW9uZXMgcGFyYSB0cmFiYWphciBjb24gZXN0YSBlbmN1ZXN0YToKCiogVGVuZXIgYSBtYW5vIGVsIGRpc2XDsW8gZGUgcmVnaXN0cm8KKiBVdGlsaXphciBlbCBwYXF1ZXRlIGBlcGhgCiogU2kgcXVlcmVtb3MgZXN0YXIgc2VndXJvcyBzb2JyZSBsYSBkZWZpbmljacOzbiBkZSB1bmEgY2F0ZWdvcsOtYSwgYXBlbGFyIGEgbG9zIGRvY3VtZW50b3MgbWV0b2RvbMOzZ2ljb3MgKHBvciBlamVtcGxvOiBlbCBjYXNvIGRlIGxvcyBhc2FsYXJpYWRvcyBlbmN1YmllcnRvcykKKiB0aXJhciBmcmVjdWVuY2lhcyBvIHBsb3RzIGRlIGxhcyB2YXJpYWJsZXMgYW50ZXMgZGUgdXNhcmxhcyAoLTksIDAsIE5BcywgZXRjLi4uKQoKQ2FyZ2Ftb3MgbGFzIGxpYnJlcsOtYXMKCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0V9CiMgaW5zdGFsbC5wYWNrYWdlcygiZXBoIikKbGlicmFyeShlcGgpICAgICAgICAgIyBwYXJhIHRyYWJhamFyIGNvbiBFUEgKbGlicmFyeSh0aWR5dmVyc2UpICAgCmxpYnJhcnkoZXhwc3MpICAgICAgICMgcGFyYSB0cmFiYWphciBjb24gbGEgZXRpcXVldGEgZGUgbG9zIGRhdG9zCmBgYAoKQ2FyZ2Ftb3MgbGFzIGJhc2VzIGNvbiB1bmEgZnVuY2nDs24gZGVsIHBhcXVldGUgYGVwaGAsIHF1ZSBubyB2YSBhIGRlc2NhcmdhciBlbiBkaXNjbyBsYSBpbmZvcm1hY2nDs24gcGVybyBzw60gbGEgdmEgYSBjYXJnYXIgZW4gZWwgZW50b3JubyBkZSB0cmFiYWpvIGRlIFIuCgpgYGB7ciBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQo/ZXBoOjpnZXRfbWljcm9kYXRhCgppbmRpdmlkdWFsIDwtIGdldF9taWNyb2RhdGEoeWVhciA9IDIwMTksIHRyaW1lc3RlciA9IDEsIHR5cGUgPSAnaW5kaXZpZHVhbCcpCmhvZ2FyIDwtIGdldF9taWNyb2RhdGEoeWVhciA9IDIwMTksIHRyaW1lc3RlciA9IDEsIHR5cGUgPSAnaG9nYXInKQpgYGAKClNvYnJlIGxhcyBiYXNlczoKCiogUXXDqSB0aWVuZW4gZW4gY29tw7puIChDT0RVU1UsIE5ST19IT0dBUikKKiBQYXJhIHF1w6kgbm9zIHB1ZWRlbiBzZXJ2aXIgZXNhcyB2YXJpYWJsZXMgZW4gY29tw7puCgpgYGB7cn0KZ2xpbXBzZShob2dhcikKZ2xpbXBzZShpbmRpdmlkdWFsKQpgYGAKCiogTGEgZnVuY2nDs24gYG9yZ2FuaXplX2xhYmVscygpYCBwZXJtaXRlIGV0aXF1ZXRhciBsb3MgZGF0b3MKKiBTZWxlY2Npb25hbW9zIHZhcmlhYmxlcyByZWxldmFudGVzIHBhcmEgZWwgZWplcmNpY2lvOiBpbmZvcm1hY2nDs24gY29udGVuaWRhIGVuIGNhZGEgdW5hCgpgYGB7cn0KaW5kaXZpZHVhbCA8LSBvcmdhbml6ZV9sYWJlbHMoaW5kaXZpZHVhbCwgdHlwZSA9ICdpbmRpdmlkdWFsJykgJT4lIAogIHNlbGVjdChDT0RVU1UsIE5ST19IT0dBUiwgQUdMT01FUkFETywgQ09NUE9ORU5URSwgQ0gwNCwgRVNUQURPLCBDQVRfT0NVUCwgUDIxLCBQNDdULCBQT05ERVJBLCBQT05ESUksIFBPTkRJSU8pCiAgCmhvZ2FyIDwtIG9yZ2FuaXplX2xhYmVscyhob2dhciwgdHlwZSA9ICdob2dhcicpICU+JSAKICBzZWxlY3QoQ09EVVNVLCBOUk9fSE9HQVIsIElWMTJfMiwgSVYxMl8zKQoKIyMgSVYxMl8yOiB6b25hIGludW5kYWJsZQojIyBJVjEyXzM6IHZpbGxhIGRlIGVtZXJnZW5jaWEKYGBgCgotLS0KCiMjIyMgRWplcmNpY2lvIDEKCj4gQ3XDoW50YXMgcGVyc29uYXMgdml2ZW4gZW4gdml2aWVuZGFzIHViaWNhZGFzIGVuIHZpbGxhcyBkZSBlbWVyZ2VuY2lhcyB5IGVuIHpvbmFzIGludW5kYWJsZXM/CgpOb3RlbW9zIHF1ZSBsYSBwcmVndW50YSByZWZpZXJlIGEgbGFzIHBlcnNvbmFzLCBwZXJvIGxhIGluZm9ybWFjacOzbiBzb2JyZSBsYSB1YmljYWNpw7NuIGRlIGxhIHZpdmllbmRhIGZpZ3VyYSBlbiBsYSBiYXNlIGRlIGhvZ2FyZXMuCgoqIEpvaW4gZGUgYmFzZXMgaW5kaXZpZHVhbCB5IGhvZ2FyICh5IGFsIHJldsOpcz8pCiogTGFzIHZhcmlhYmxlcyBkZSBmaWx0cm8geSBhZ3J1cGFtaWVudG8KKiBFbCByb2wgZGUgbG9zIHBvbmRlcmFkb3JlcwoqIEZ1bmNpw7NuIHBhcmEgbW9zdHJhciBsb3MgcmVzdWx0YWRvcyBldGlxdWV0YWRvcwoKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KZWplcmNpY2lvMSA8LSBsZWZ0X2pvaW4oaW5kaXZpZHVhbCwgaG9nYXIsIGJ5ID0gYygiQ09EVVNVIiwgIk5ST19IT0dBUiIpKSAlPiUgCiAgZmlsdGVyKElWMTJfMiA9PSAxIHwgSVYxMl8zID09IDEpICU+JSAKICBncm91cF9ieShJVjEyXzIsIElWMTJfMykgJT4lIAogIHN1bW1hcmlzZShDYW50aWRhZCA9IHN1bShQT05ERVJBKSkgJT4lIAogIGV4cHNzOjp2YWx1ZXMybGFiZWxzKC4pCgplamVyY2ljaW8xCmBgYAoKLS0tCgojIyMjIEVqZXJjaWNpbyAyCgo+IENhbGN1bGFyIGVsIGluZ3Jlc28gZGUgbGEgb2N1cGFjacOzbiBwcmluY2lwYWwgcHJvbWVkaW8sIHBhcmEgbGFzL29zIG9jdXBhZGFzL29zIHBvciBhZ2xvbWVyYWRvcyB5IHNleG8KCiogTGEgdmFyaWFibGUgZGUgZmlsdHJvCiogTGFzIHZhcmlhYmxlcyBkZSBhZ3J1cGFtaWVudG8KKiBMYSBtZWRpYSBwb25kZXJhZGEgeSB1biBudWV2byBwb25kZXJhZG9yCiogQ8OhbGN1bG8gZGUgbGEgYnJlY2hhCiogRnVuY2nDs24gcGFyYSBwcmVzZW50YXIgZW4gZm9ybWF0byBwb3JjZW50dWFsCgpgYGB7cn0KZWplcmNpY2lvMiA8LSBpbmRpdmlkdWFsICU+JSAKICBmaWx0ZXIoRVNUQURPID09IDEpICU+JSAKICBncm91cF9ieShBR0xPTUVSQURPLCBDSDA0KSAlPiUgCiAgc3VtbWFyaXNlKHByb21lZGlvX2lvcCA9IHdlaWdodGVkLm1lYW4oUDIxLCBQT05ESUlPKSkgJT4lICMgcG9uZGVyYWRvcgogIHNwcmVhZCguLCBDSDA0LCBwcm9tZWRpb19pb3ApICU+JSAKICBleHBzczo6dmFsdWVzMmxhYmVscyguKSAlPiUgCiAgbXV0YXRlKEJyZWNoYSA9ICgoVmFyb24gLSBNdWplcikvVmFyb24pKSAlPiUgCiAgYXJyYW5nZSgtQnJlY2hhKSAlPiUgCiAgbXV0YXRlKEJyZWNoYSA9IHNjYWxlczo6cGVyY2VudChCcmVjaGEpKQoKZWplcmNpY2lvMgpgYGAKCi0tLQoKIyMjIyBFamVyY2ljaW8gMwoKPiBDYWxjdWxhciBlbCBpbmdyZXNvIHRvdGFsIGluZGl2aWR1YWwgcHJvbWVkaW8sIHBhcmEgcXVpZW5lcyBwZXJjaWJlbiBpbmdyZXNvcywgcG9yIGFnbG9tZXJhZG9zIHkgc2V4bwoKKiBMYSB2YXJpYWJsZSBkZSBmaWx0cm86IEluZ3Jlc28gdG90YWwgaW5kaXZpZHVhbCBwb3NpdGl2bwoqIExhcyB2YXJpYWJsZXMgZGUgYWdydXBhbWllbnRvOiBFbCBhZ2xvbWVyYWRvIHkgZWwgc2V4bwoqIFVuIG51ZXZvIHBvbmRlcmFkb3IKCmBgYHtyfQplamVyY2ljaW8zIDwtIGluZGl2aWR1YWwgJT4lIAogIGZpbHRlcihQNDdUID4gMCkgJT4lIAogIGdyb3VwX2J5KEFHTE9NRVJBRE8sIENIMDQpICU+JSAKICBzdW1tYXJpc2UocHJvbWVkaW9faXRpID0gd2VpZ2h0ZWQubWVhbihQNDdULCBQT05ESUkpKSAlPiUgIyBwb25kZXJhZG9yCiAgc3ByZWFkKC4sIENIMDQsIHByb21lZGlvX2l0aSkgJT4lIAogIGV4cHNzOjp2YWx1ZXMybGFiZWxzKC4pICU+JSAKICBtdXRhdGUoQnJlY2hhID0gKChWYXJvbiAtIE11amVyKS9WYXJvbikpICU+JSAKICBhcnJhbmdlKC1CcmVjaGEpICU+JSAKICBtdXRhdGUoQnJlY2hhID0gc2NhbGVzOjpwZXJjZW50KEJyZWNoYSkpCgplamVyY2ljaW8zCmBgYAoKLS0tCgojIyMgRWplbXBsbyBkZSB1dGlsaXphY2nDs24gZGUgbGEgZW5jdWVzdGEKCltMYSBkZXNpZ3VhbGRhZCBkZSBnw6luZXJvIHNlIHB1ZWRlIG1lZGlyXShodHRwOi8vd3d3LnJwdWJzLmNvbS9uYXRzdW1pX3Nob2tpZGEvKQo=