5.2 Práctica Guiada

5.2.1 Introducción

El objetivo de esta clase es comenzar a trabajar utilizando el formato RNotebook para realizar reportes compilados directamente en RStudio, de forma tal que nuestro trabajo pueda quedar documentado y ser fácilmente compartido con otras personas.

Para esto utilizaremos un dataframe del paquete datos. Deberemos instalarlo en caso de no contar con el mismo, y luego cargarlo con la función library(). En particular, utilizaremos los datos de encuesta, que consiste en una muestra de variables categóricas de la Encuesta Social General de EE.UU.

El dataframe cuenta con 21.483 observaciones y 9 variables.

5.2.2 Explorando los datos

La muestra refiere a información obtenida entre 2000 y 2014. Se presentan datos sobre estado civil, raza, ingresos, partido político de pertenencia, religión, y cantidad de horas dedicadas a mirar televisión, para personas de entre 18 y 89 años.

5.2.2.1 Religión

En primer lugar, nos interesa ver la distribución en términos de la religión de las personas, haciendo énfasis en aquellas más populares.

## # A tibble: 15 x 2
##    religion               cantidad
##    <fct>                     <int>
##  1 Protestante               10846
##  2 Católica                   5124
##  3 Ninguna                    3523
##  4 Cristiana                   689
##  5 Judía                       388
##  6 Otra                        224
##  7 Budismo                     147
##  8 Inter o no confesional      109
##  9 Musulmana/Islam             104
## 10 Cristiana ortodoxa           95
## 11 Sin respuesta                93
## 12 Hinduismo                    71
## 13 Otra religión oriental       32
## 14 Nativa americana             23
## 15 No sabe                      15

Puede verse que aquella que cuenta con más seguidores es la religión Protestante, con 10.846 fieles.

5.2.2.2 Estado Civil

También podemos visualizar la distribución del estado civil de las personas.

Vemos que la mayoría de las personas (10.117 en total) responde “Casado” cuando se indaga sobre su estado civil.

5.2.2.3 Partido político

La encuesta también nos permite conocer sobre las pertenencias partidarias de los individuos.

5.2.2.4 Horas de exposición a la televisión

A partir de los datos, sabemos que los individuos miran la televisión, en promedio, durante 3 horas por día. A continuación se presenta toda la distribución de la variable: