5 Manipular

Muchas veces los datos que importamos ya están listos para ser explorados y analizados. Otras veces precisan ser manipulados previamente para ello. En estos casos se parte de un dataset “crudo” y se transforma hacia un dataset “analítico”.

# library(tidyverse)
library(readxl)
soja <- read_excel("data/soja.xls")
canola <- read_excel("data/canola_maculas.xlsx")
olivo <- read_excel("data/olivo_xylella.xls")

tidyr y dplyr integran parte de la colección de paquetes de tidyverse y facilitan la manipulación de los data frames (Wickham and Grolemund 2016)

Ambos paquetes utilizan el operador %>% (pipe, tubo en español) lo que proporciona una mejor interpretación lógica: utiliza el resultado de su lado izquierdo como primer argumento de la función del lado derecho (asemejándose a una receta de torta…)

Hasta el momento hemos visto que:

x <- c(1, 2, 3, 4)
sqrt(sum(x))

Como sería su equivalente bajo la sintaxis de tidyverse?

library(tidyverse)
x %>% sum %>% sqrt

Referencias

Wickham, Hadley, and Garrett Grolemund. 2016. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. " O’Reilly Media, Inc.". http://r4ds.had.co.nz/.