Introducción a Data Science
Introducción
Presentación
Objetivos del curso
Webpage
Temario:
Bibliografía de consulta
1
Introducción a R
1.1
Explicación
1.1.1
¿Qué es R?
1.1.2
Lógica sintáctica.
1.1.3
R base
1.1.4
Objetos:
1.1.5
Data Frames
1.1.6
Listas
1.1.7
Ambientes de trabajo
1.1.8
Tipos de archivos de R
1.2
Práctica Guiada
1.2.1
Instalación de paquetes complementarios al R Base
1.2.2
Lectura y escritura de archivos
2
Tidyverse
2.1
Explicación
2.1.1
Dplyr
2.1.2
Joins
2.1.3
Tidyr
2.1.4
Lubridate
2.2
Práctica Guiada
2.2.1
Ejemplo 1
2.2.2
Ejemplo 2
2.2.3
Ejemplo 3
2.2.4
Ejemplo 4
2.2.5
Ejemplo 5
2.2.6
Ejemplo 6
3
Programacion Funcional
3.1
Explicación
3.1.1
Loops
3.1.2
Estructuras Condicionales
3.1.3
Funciones
3.1.4
PURRR
3.1.5
Funciones implícitas
3.1.6
Funciones lambda
3.1.7
Walk
3.1.8
Cuando usar estas herramientas?
3.2
Práctica Guiada
3.2.1
Ejemplo 1: Iterando en la EPH
3.2.2
Ejemplo 2. Regresión lineal
3.2.3
Ejemplo 3: Gráficos en serie
4
Visualización de la información
4.1
Explicación
4.1.1
Gráficos Básicos en R
4.1.2
Ggplot2
4.1.3
Ejemplo con datos reales
4.2
Práctica Guiada
4.2.1
Caso práctico: Gráficos de ingresos - EPH
5
Documentación en R
5.1
Explicación
5.1.1
R Markdown: Introducción
5.1.2
Requisitos
5.1.3
Markdown básico
5.1.4
Formateo de texto
5.1.5
Bloques de código
5.1.6
Opciones en los bloques de código
5.1.7
Tablas
5.1.8
Opciones globales
5.1.9
Código en la línea
5.1.10
Formatos
5.1.11
Otros formatos
5.1.12
Notebooks
5.1.13
Publicar
5.1.14
FlexDashboard
5.2
Práctica Guiada
5.2.1
Introducción
5.2.2
Explorando los datos
6
Shiny apps
6.1
Explicación
6.1.1
¿Qué es un shiny app?
6.1.2
Galería de ejemplos
6.1.3
Componentes fundamentales de un Shiny app
6.2
Práctica Guiada
6.2.1
Ejemplo 2. Gapminder
7
Probabilidad y Estadística
7.1
Explicación
7.1.1
Probabilidad
7.1.2
Estadística
7.1.3
Algunos estimadores importantes
7.1.4
Gráficos estadísticos
7.1.5
Bibliografía de consulta
7.2
Práctica Guiada
7.2.1
Generación de datos aleatorios
7.2.2
Tests
7.2.3
Descripción estadística de los datos
7.2.4
Gráficos estadísticos
8
Modelo Lineal
8.1
Explicación
8.1.1
Covarianza y Correlación.
8.1.2
Modelo Lineal
8.1.3
Regresión lineal múltiple
8.1.4
Para profundizar
8.2
Práctica Guiada
8.2.1
Primer modelo
8.2.2
Feature engineering.
8.2.3
Transformaciones log.
8.2.4
Predicciones
8.2.5
Para seguir practicando
9
Análisis de encuestas
9.1
Explicación
9.1.1
Población y muestra
9.1.2
Tipos de muestra
9.1.3
El cuestionario
9.1.4
Sesgos
9.1.5
No respuesta
9.1.6
Ponderadores / Expansores
9.1.7
Ejemplos
9.1.8
Encuesta Uso del Tiempo 2016 Ciudad de Buenos Aires
9.2
Práctica Guiada
9.2.1
Encuesta Permanente de Hogares
9.2.2
Ejemplo de utilización de la encuesta
10
Minería de Textos
10.1
Explicación
10.1.1
Introducción
10.1.2
Bag of Words
10.1.3
Normalización
10.1.4
Expresiones regulares.
10.1.5
Distancia de palabras
10.1.6
Distancia de Documentos
10.1.7
Topic Modelling
10.1.8
Descargas de tweets con
rtweet
10.1.9
Armado del corpus con
tm
10.1.10
Limpieza del Corpus
10.1.11
Topic Modeling
11
Mapas
11.1
Explicación
11.1.1
Datos georreferenciados
11.1.2
Proyecciones y distorsiones
11.1.3
Tipos de datos espaciales
11.1.4
Paquete sf
11.1.5
Tipos de archivo
11.2
Práctica Guiada
11.2.1
Representación de la información en mapas
11.2.2
Mapeo de Palos borrachos rosados en Buenos Aires
12
Mapa de Data Science
12.1
Técnicas
12.1.1
Según tipo de aprendizaje:
12.1.2
Según el tipo de datos:
12.1.3
Desde el punto de vista del remuestreo:
12.1.4
Desde el punto de vista de la optimización:
12.1.5
Flujo de trabajo
12.1.6
Meta flujo de trabajo
12.1.7
Otros temas
12.2
Implementaciones:
References
Repositorio en github
Notas de clase del curso de introducción a Data Science
12.2
Implementaciones:
Caret
Tidymodels
Sci-kit learn
H20
Google Cloud
Watson IBM