11.1 Explicación
Hay varios paquetes en R con funciones que permiten manipular información espacial con facilidad. El objetivo de esta clase es introducir algunos de ellos a fin de combinarlos con algunas de las herramientas que ya vimos, para hacer análisis geográfico y crear nuestros propios mapas.
Las presentes notas están basadas en:
11.1.1 Datos georreferenciados
Sería ideal contar con un cuerpo que consista en una representación de la tierra en escala a la hora de trabajar con datos geográficos. Sin embargo, esto no sería práctico, por lo que normalmente trabajamos con representaciones en 2 dimensiones, como son los mapas.
Para construir un mapa, primero necesitamos un modelo abstracto en 3 dimensiones del planeta:
- esfera
- elipsoide
- geoide (una forma teórica de la Tierra determinada por la geodesia en la cual se toma como superficie teórica el nivel medio de los mares)
11.1.2 Proyecciones y distorsiones
- Mercator: preserva ángulos
- Sinusoidal: preserva áreas, pero distorsiona formas y direcciones
- Equidistante cilíndrica: preserva distancias entre meridianos
11.1.3 Tipos de datos espaciales
- Vectoriales: puntos, líneas, polígonos
- Rasters: pixels, grillas
Palabras clave para consultas sobre datos espaciales:
- Distancia
- Largo
- Area
- Centroide
- Igual
- Disjunto
- Intersecta
- Toca
- Cruza
- Superpone
- Contiene
- Buffering
11.1.4 Paquete sf
El paquete sf permite combinar datos de tipo vectorial y atributos asociados a dicho espacio.
La implementación de los puntos, líneas y polígonos en este paquete se extienden para incorporar multipuntos, multilíneas, multipolígonos, etc.
Los datos geográficos siempre van a estar en el objeto llamado geometry
.
- bounding box:
- EPSG (SRID): el sistema de coordenadas
Sistemas de coordenadas de referencia y proyecciones cartográficas: Sistema de números que definen ubicaciones sobre la superficie de la Tierra; funcionan como direcciones. El tipo más conocido es el que usa latitud y longitud. Existen muchísimas proyecciones distintas, cada una pensada para minimizar alguno de los tipos de distorsión.
11.1.5 Tipos de archivo
shapefiles: guarda la información en varios archivos distintos, que suelen ser combinados en un archivo .zip. Los nombres de las variables en un shapefile deben tener 10 caracteres o menos. Fue inventado por la empresa ESRI (los creadores del software ArcGIS), y a pesar de las incomodidades mencionadas es muy común.
GeoJSON: Es una alternativa más moderna; un estándar abierto que corrige los dos inconvenientes mencionados antes. Para nuestros ejercicios usaremos datos geográficos en este último formato.
dataframes con columnas lat-long: Los datos también pueden ser presentados en un dataframe común, con una variable referida a la latitud y otra a la longitud. Podemos utilizar la función
st_as_sf
para realizar una conversión a tipo sf, yst_set_crs
para indicar el sistema de coordenadas de referencia. Por ejemplo: