1 Configuraciones básicas

Instalación de programas

R

R Studio (bajar la versión Free)

RStudio es un entorno de desarrollo integrado (IDE) para el lenguaje de programación R, o sea es la interface por medio de la cual se ejecutan acciones en R.

Configuraciones iniciales (sugeridas). Dirigirse a la sección “Tools/Global options”

Paquetes de R

Un paquete es una colección de funciones, datos y código R que se almacenan en una carpeta conforme a una estructura bien definida, fácilmente accesible para R. Hay paquetes oficiales (disponibles en CRAN) y no oficiales (disponibles a través de plataformas como github).

Currently, the CRAN package repository features 14620 available packages. (Julio 2019)

La simple instalación de R trae consigo múltiples paquetes que permiten un funcionamiento básico de importación de datos, ajuste y evaluación de modelos estadísticos y representaciones gráficas. Sin embargo, la enorme potencia de R deriva de su capacidad de incorporar nuevas funciones generadas por su gran comunidad de usuarios (ver novedades en: r weekly; r-bloggers; revolution analytics; RStudio blog)

En la web de R se puede consultar la lista de paquetes disponibles, y en la sección Task Views se puede consultar los mismos ordenados por áreas de aplicación.

Existen varias vias de instalación de paquetes:



  • Via CRAN (Comprehensive R Archive Network): install.packages("nombre_del_paquete") O simplemente en el panel de paquetes.
  • Paquetes no oficiales via Github: devtools::install_github("rstudio/epiphy")

Una vez instalado, hay que cargar los paquetes que contienen las funciones que vayamos a usar en cada sesión

library(nombre-del-paquete)

instale el paquete gsheet, explique brevemente para que sirve y ejecute alguna de sus funciones

Workflow componentes

Varios tipos de archivos serán creados y usados durante una sesión de R:

  • datos crudos (hojas de cálculo) - datos manipulados
  • scripts
  • gráficos
  • reportes de resultados

Una sesión de análisis debe poder ser retomada en cualquier momento pudiendo darse por concluída cuando el trabajo es publicado. Hasta entonces debemos tener rápido acceso a todos los objetos creados en sesiones anteriores. Para ello debemos manejarnos siempre bajo buenas prácticas de trabajo. Esto nos permitirá entender qué quisimos hacer tiempo atrás, seremos intuitivos para encontrar archivos/objetos, y finalmente crearemos trabajos reproducibles
Una forma práctica de administrar todos los objetos que una sesión es crear un proyecto de R para cada sesión.

Una sugerencia es generar subcarpetas en nuestras máquinas, en preferencia dentro de dropbox / google drive. Esto no sólo mantendrá nuestro trabajo resguardado de posibles pérdidas (backup), retomarlo desde diferentes máquinas (trabajo/casa), sino que también le permitirá compartir en tiempo real sus avances con los colaboradores de su trabajo.

Crear una carpeta Intro_R en sus máquinas

Crear una nuevo proyecto “Intro_R.Rproj”

Crear un script “1_intro”

¿Dónde se guardaría el siguiente gráfico?

plot(pressure)

S.O.S.

  • En el mismo R: ?sd; ??sd; F1 sobre la función

  • Googlear: r generate a sequence of uppercase letters

  • Stack Overflow / RStudio: comunidades altamente activas por los usuarios de R y otros lenguajes de programación.

  • R Mailing Lists: especificas de cada área de la ciencia.

¿Cómo hacer una buena pregunta en las comunidades?

  • Ser conciso pero gentil…

  • Ser reproducible: su código debe correr en cualquier máquina. La comunidad no irá a ayudarle si no pueden reproducir su error (detallar paquetes y versión de R en caso necesario) library(reprex).