• Introducción a Data Science
  • Introducción
    • Presentación
    • Objetivos del curso
    • Webpage
    • Temario:
    • Bibliografía de consulta
  • 1 Introducción a R
    • 1.1 Explicación
      • 1.1.1 ¿Qué es R?
      • 1.1.2 Lógica sintáctica.
      • 1.1.3 R base
      • 1.1.4 Objetos:
      • 1.1.5 Data Frames
      • 1.1.6 Listas
      • 1.1.7 Ambientes de trabajo
      • 1.1.8 Tipos de archivos de R
    • 1.2 Práctica Guiada
      • 1.2.1 Instalación de paquetes complementarios al R Base
      • 1.2.2 Lectura y escritura de archivos
  • 2 Tidyverse
    • 2.1 Explicación
      • 2.1.1 Dplyr
      • 2.1.2 Joins
      • 2.1.3 Tidyr
      • 2.1.4 Lubridate
    • 2.2 Práctica Guiada
      • 2.2.1 Ejemplo 1
      • 2.2.2 Ejemplo 2
      • 2.2.3 Ejemplo 3
      • 2.2.4 Ejemplo 4
      • 2.2.5 Ejemplo 5
      • 2.2.6 Ejemplo 6
  • 3 Programacion Funcional
    • 3.1 Explicación
      • 3.1.1 Loops
      • 3.1.2 Estructuras Condicionales
      • 3.1.3 Funciones
      • 3.1.4 PURRR
      • 3.1.5 Funciones implícitas
      • 3.1.6 Funciones lambda
      • 3.1.7 Walk
      • 3.1.8 Cuando usar estas herramientas?
    • 3.2 Práctica Guiada
      • 3.2.1 Ejemplo 1: Iterando en la EPH
      • 3.2.2 Ejemplo 2. Regresión lineal
      • 3.2.3 Ejemplo 3: Gráficos en serie
  • 4 Visualización de la información
    • 4.1 Explicación
      • 4.1.1 Gráficos Básicos en R
      • 4.1.2 Ggplot2
      • 4.1.3 Ejemplo con datos reales
    • 4.2 Práctica Guiada
      • 4.2.1 Caso práctico: Gráficos de ingresos - EPH
  • 5 Documentación en R
    • 5.1 Explicación
      • 5.1.1 R Markdown: Introducción
      • 5.1.2 Requisitos
      • 5.1.3 Markdown básico
      • 5.1.4 Formateo de texto
      • 5.1.5 Bloques de código
      • 5.1.6 Opciones en los bloques de código
      • 5.1.7 Tablas
      • 5.1.8 Opciones globales
      • 5.1.9 Código en la línea
      • 5.1.10 Formatos
      • 5.1.11 Otros formatos
      • 5.1.12 Notebooks
      • 5.1.13 Publicar
      • 5.1.14 FlexDashboard
    • 5.2 Práctica Guiada
      • 5.2.1 Introducción
      • 5.2.2 Explorando los datos
  • 6 Shiny apps
    • 6.1 Explicación
      • 6.1.1 ¿Qué es un shiny app?
      • 6.1.2 Galería de ejemplos
      • 6.1.3 Componentes fundamentales de un Shiny app
    • 6.2 Práctica Guiada
      • 6.2.1 Ejemplo 2. Gapminder
  • 7 Probabilidad y Estadística
    • 7.1 Explicación
      • 7.1.1 Probabilidad
      • 7.1.2 Estadística
      • 7.1.3 Algunos estimadores importantes
      • 7.1.4 Gráficos estadísticos
      • 7.1.5 Bibliografía de consulta
    • 7.2 Práctica Guiada
      • 7.2.1 Generación de datos aleatorios
      • 7.2.2 Tests
      • 7.2.3 Descripción estadística de los datos
      • 7.2.4 Gráficos estadísticos
  • 8 Modelo Lineal
    • 8.1 Explicación
      • 8.1.1 Covarianza y Correlación.
      • 8.1.2 Modelo Lineal
      • 8.1.3 Regresión lineal múltiple
      • 8.1.4 Para profundizar
    • 8.2 Práctica Guiada
      • 8.2.1 Primer modelo
      • 8.2.2 Feature engineering.
      • 8.2.3 Transformaciones log.
      • 8.2.4 Predicciones
      • 8.2.5 Para seguir practicando
  • 9 Análisis de encuestas
    • 9.1 Explicación
      • 9.1.1 Población y muestra
      • 9.1.2 Tipos de muestra
      • 9.1.3 El cuestionario
      • 9.1.4 Sesgos
      • 9.1.5 No respuesta
      • 9.1.6 Ponderadores / Expansores
      • 9.1.7 Ejemplos
      • 9.1.8 Encuesta Uso del Tiempo 2016 Ciudad de Buenos Aires
    • 9.2 Práctica Guiada
      • 9.2.1 Encuesta Permanente de Hogares
      • 9.2.2 Ejemplo de utilización de la encuesta
  • 10 Minería de Textos
    • 10.1 Explicación
      • 10.1.1 Introducción
      • 10.1.2 Bag of Words
      • 10.1.3 Normalización
      • 10.1.4 Expresiones regulares.
      • 10.1.5 Distancia de palabras
      • 10.1.6 Distancia de Documentos
      • 10.1.7 Topic Modelling
      • 10.1.8 Descargas de tweets con rtweet
      • 10.1.9 Armado del corpus con tm
      • 10.1.10 Limpieza del Corpus
      • 10.1.11 Topic Modeling
  • 11 Mapas
    • 11.1 Explicación
      • 11.1.1 Datos georreferenciados
      • 11.1.2 Proyecciones y distorsiones
      • 11.1.3 Tipos de datos espaciales
      • 11.1.4 Paquete sf
      • 11.1.5 Tipos de archivo
    • 11.2 Práctica Guiada
      • 11.2.1 Representación de la información en mapas
      • 11.2.2 Mapeo de Palos borrachos rosados en Buenos Aires
  • 12 Mapa de Data Science
    • 12.1 Técnicas
      • 12.1.1 Según tipo de aprendizaje:
      • 12.1.2 Según el tipo de datos:
      • 12.1.3 Desde el punto de vista del remuestreo:
      • 12.1.4 Desde el punto de vista de la optimización:
      • 12.1.5 Flujo de trabajo
      • 12.1.6 Meta flujo de trabajo
      • 12.1.7 Otros temas
    • 12.2 Implementaciones:
  • References
  • Repositorio en github

Notas de clase del curso de introducción a Data Science

12.2 Implementaciones:

  • Caret
  • Tidymodels
  • Sci-kit learn

  • H20

  • Google Cloud

  • Watson IBM