Trabajo ordenado

Tener organizados los archivos de datos, los scripts de R y los resultados es muy útil para hacer un seguimiento de lo que se está trabajando y para compartir datos o scripts. Tener archivos sueltos y mezclados se termina transformando en un caos. La forma de organizar tus archivos es tu elección, pero un poco de planificación y organización de los proyectos al principio es una buena estrategia a futuro. Acá van algunas sugerencias:

Crear una carpeta de proyectos organizada

Creá una carpeta para cada proyecto. Puede tratarse de un curso que estés haciendo, un capítulo de tu tesis o un proyecto de investigación de cualquier tipo. Dentro de esa carpeta, incluí lo siguiente

  • Una carpeta de datos (incluyendo los metadatos)
  • Una carpeta de resultados (con subcarpetas «Figuras» y «Tablas» y posiblemente «Material suplementario»)
  • Un script de R que procese los archivos de datos, haga los análisis y cree las figuras necesarias para el proyecto (intentar que este script de R sea corto y legible)
  • Una carpeta para las funciones personalizadas (si se utilizan, poco probable en esta instancia)
  • Una carpeta para los textos y las referencias

La carpeta de datos debe contener los datos brutos (Calc, Excel). Lo ideal es que esos archivos no se modifiquen; todo lo que se quiera hacer con los datos (ej. limpiarlos y filtrarlos, resumirlos en una tabla, ejecutar análisis estadísticos o crear figuras), puede hacerse a través de los scripts de R. Esto mantiene un registro de todo lo que se hace. Los resultados intermedios, si sirven, se pueden guardar en la carpeta de resultados.

Uno de los objetivos de esta organización del proyecto es que el procesamiento y el análisis de los datos sean totalmente reproducibles y, por lo tanto, tanto los datos como los métodos exactos puedan compartirse. Además, aunque en este momento conozcas todos los archivos y pasos, antes de que te des cuenta vas a estar trabajando en otros proyectos y no te vas a acordar de nada. La mayoría de los análisis, en algún momento, se complican demasiado para que sea factible acordarse de todo lo que se hizo, y por eso es fundamental tener un registro (ver Notas).

Usando los archivos de proyecto de R Studio

Una forma fácil de acceder a todos estos archivos es utilizar un archivo de proyecto. En RStudio, se puede crear un nuevo archivo de proyecto con File, New Project. A continuación, pregunta si la carpeta del proyecto ya está creada (segunda opción) o no (primera opción).

Una vez creado, el proyecto se puede abrir haciendo clic directamente en ese archivo o desde Archivo, Abrir si ya tenés el RStudio abierto. Una vez abierto, se ve la estructura de carpetas en el panel de archivos en la parte inferior derecha de RStudio, donde todos los scripts y datos son fácilmente accesibles.

Si se quiere cambiar de proyecto, crear uno nuevo, o cerrarlo para volver a la vista normal, arriba a la derecha hay un icono muy chiquito que despliega los últimos proyectos junto con otras opciones útiles.


La gran mayoría de este tutorial es una traducción de:

https://environmentalcomputing.net/getting-started-with-r/project-management/

que, por cierto, es muy útil para varios aspectos del uso de R.