Workshop Para mineria de texto
pre requisitos.
- Instalar R y Rstudio. (recomendamos este tutorial de Rladies)
- Instalar los siguientes paquetes:
install.packages('tidyverse')
install.packages('tm')
install.packages('rtweet')
install.packages('wordcloud2')
install.packages('topicmodels')
install.packages('LDAvis')
install.packages('tsne')
install.packages('devtools')
install.packages('jsonlite')
devtools::install_github("VerbalExpressions/RVerbalExpressions")
-
Tener cuenta de twitter, y de twitter developer (se aplica desde acá). Como aplicar a una cuenta de developer de twitter no es trivial, y no siempre se conceden los permisos, se puede venir sin este requisito, aunque es necesario para replicar los procesamientos en otros proyectos.
-
Es aconsejable tener una base de R y R studio para poder seguir mejor el desarrollo del curso. En caso de no tener experiencia previa en R se recomienda estas notas introductorias de Laura Ación y Riva Quiroga
-
Descargar los materiales del curso:
usethis::use_course('https://github.com/DiegoKoz/workshop_text_mining/archive/master.zip')
Materiales:
Temario:
- Introducción
- Análisis de texto en Ciencias Sociales
- Bag of Words
- Normalización
- Caracteres especiales.
- Distancia de palabras
- Distancia de caracteres
- Distancia Conceptual
- Distancia de Documentos
- Similitud Coseno
- Topic Modelling
- Implementaciones en R:
- rtweet
- tm
- RVerbalExpressions
- wordcloud2
- LDAvis
- tsne