5.2 Práctica Guiada
5.2.1 Introducción
El objetivo de esta clase es comenzar a trabajar utilizando el formato RNotebook para realizar reportes compilados directamente en RStudio, de forma tal que nuestro trabajo pueda quedar documentado y ser fácilmente compartido con otras personas.
Para esto utilizaremos un dataframe del paquete datos. Deberemos instalarlo en caso de no contar con el mismo, y luego cargarlo con la función library()
. En particular, utilizaremos los datos de encuesta, que consiste en una muestra de variables categóricas de la Encuesta Social General de EE.UU.
El dataframe cuenta con 21.483 observaciones y 9 variables.
5.2.2 Explorando los datos
La muestra refiere a información obtenida entre 2000 y 2014. Se presentan datos sobre estado civil, raza, ingresos, partido político de pertenencia, religión, y cantidad de horas dedicadas a mirar televisión, para personas de entre 18 y 89 años.
5.2.2.1 Religión
En primer lugar, nos interesa ver la distribución en términos de la religión de las personas, haciendo énfasis en aquellas más populares.
## # A tibble: 15 x 2
## religion cantidad
## <fct> <int>
## 1 Protestante 10846
## 2 Católica 5124
## 3 Ninguna 3523
## 4 Cristiana 689
## 5 Judía 388
## 6 Otra 224
## 7 Budismo 147
## 8 Inter o no confesional 109
## 9 Musulmana/Islam 104
## 10 Cristiana ortodoxa 95
## 11 Sin respuesta 93
## 12 Hinduismo 71
## 13 Otra religión oriental 32
## 14 Nativa americana 23
## 15 No sabe 15
Puede verse que aquella que cuenta con más seguidores es la religión Protestante, con 10.846 fieles.
5.2.2.2 Estado Civil
También podemos visualizar la distribución del estado civil de las personas.
Vemos que la mayoría de las personas (10.117 en total) responde “Casado” cuando se indaga sobre su estado civil.
5.2.2.3 Partido político
La encuesta también nos permite conocer sobre las pertenencias partidarias de los individuos.
5.2.2.4 Horas de exposición a la televisión
A partir de los datos, sabemos que los individuos miran la televisión, en promedio, durante 3 horas por día. A continuación se presenta toda la distribución de la variable: