Introducción al análisis de datos biológicos con R

Instituto Nacional de Medicina Tropical (INMeT) de Argentina

R
Code
Autores/as

Marília Melo Favalesso

Eliana Burgos

Fecha de publicación

12 de julio de 2021

Introducción al análisis de datos biológicos con R

Sobre el curso

¿De qué se trata el curso?

Este es un curso de un mes y medio en programación R para análisis de datos biológicos. Se realiza de forma virtual y contará con una combinación de clases sincrónicas y asincrónicas, con ejercicios que se entregarán semanalmente y una presentación final. Es un curso intensivo y desafiante que invita al estudiante a pensar y desarrollar algoritmos para el análisis de datos biológicos. Específicamente, el curso tiene como objetivo enseñar a los participantes a:

  1. desarrollar e interpretar scripts R

  2. importar y manipular datos

  3. describir y visualizar datos

  4. crear informes con RMarkdown

Subiremos los videos de las clases al canal de youtube @somaquadrados. Los videos se pueden ver de forma asincrónica. El material escrito, diapositivas, scripts y tareas estarán disponibles en el repositorio de “Soma dos Quadrados” (github.com/Soma-dos-Quadrados/introduccionalR). Las clases presenciales se llevan a cabo semanalmente los viernes, de 2:00 pm a 5:00 pm. Las clases presenciales se utilizarán para resolver dudas y ejercicios.

El curso se ofrece de forma gratuita y la preinscripción estará abierta entre los días 12 y 31 de julio. El curso comienza el día 16 de agosto hasta el dia 27 de septiembre de 2021.

Público

El curso está dirigido a estudiantes de pós-grado, técnicos y investigadores interesados en aprender a utilizar R para el análisis de datos biológicos. Es un curso introductorio que trabajará con la importación, manipulación y análisis descriptivo y visual de datos biológicos.

El cupo máximo es de 20 personas.

Dedicación

Los estudiantes deben ver las lecciones en video y resolver los ejercicios disponibles en el repositorio de Soma dos Quadrados. La duración estimada de las clases es de 3h a 4h. Los ejercicios semanales son obligatorios.

El viernes habrá clases virtuales obligatorias y sincrónicas, donde se hará un repaso de la clase teórica y resolución de dudas. Los ejercicios de tareas también se revisarán con los participantes. La duración media de estas clases es de 3h. También habrá un grupo de Telegram (mensajería on-line) para consultas y discusiones entre estudiantes en tiempo real.

El curso requiere de seis a ocho horas de dedicación a la semana.

Responsables

Eliana Burgos (efburgos@conicet.gov.ar)

Marília Melo Favalesso (mariliabioufpr@gmail.com)

Carga horaria

48 h

Enmienda

Clase 0

  • Introducción al curso

  • Programación

  • IDE

  • RStudio

Clase 1

  • Objetos y atribuciones

  • Estructuras de objetos: qué son y cómo construir en R

  • Funciones

  • Estructuras de Control

Clase 2

  • Datos biológicos

  • Importación de bases de datos para el R

  • Manipulación de la base de datos en R

Clase 3

  • Variables estadística

  • Distribución de probabilidad

  • Estadística descriptiva: medidas de posición

  • Estadística descriptiva: medidas de dispersión

Clase 4

  • Estadísticas descriptivas: las frecuencias

  • Gráficos

Clase 5

  • Informes dinámicos con RMarkdown

Clase 6

  • Presentación del proyecto desarrollado

Inscripción

La inscripción al curso comienza el lunes 12 de julio a las 9 am y se extiende hasta el día 31 a las 00 am. Para aquellos interesados en registrarse, solo complete el siguiente formulario: https://forms.gle/1Y6rR8VbfCE214nw8.

Referencias

(Todos los libros de referencia de este curso tienen copias para distribución gratuita).

Aragón TJ. (2017) Population Health Data Science with R: Transforming data into actionable knowledge.

Atlan (2019) Introduction to GIS: Manipulating and Mapping Geospatial Data in R.

Brunsdon C, Comber L. (2019) An Introduction to Spatial Analysis and Mapping. Sage.

Chang W. (2013) R Graphics Cookbook: Practical Recipes for Visualizing Data. O’Reilly Media.

DiMaggio C. (2014) Spatial Epidemiology Notes: Applications and Vignettes in R. Columbia University, NY

Engel CA. (2019) Using Spatial Data with R.

Gillespie C, Lovelace R. (2021) Efficient R Programming: A pratical guide to smarter programming. O’Reilly Media.

Grolemund G. (2014) Hands-On Programming with R. O’Reilly Media.

Healy K. (2018) Data visualization: A practical introduction. Princeton University Press.

Hijmans, R. 2019. Spatial Data Analysis and Modeling with R.

Holmes S, Huber W. (2018) Modern Statistics for Modern Biology. Cambridge.

Irizarry RA. (2021) Introducción a la ciencia de datos: Análisis de datos y algoritmos de predicción con R. CRC Press.

Irizarry RA, Love MI. (2015) Data analysis for the life sciences. Leanpub.

Lovelace R, Nowosad J, Muenchow J. (2021) Geocomputation with R. CRC Press.

Peng RD. (2016a) Exploratory Data Analysis with R. Leanpub.

Peng RD. (2016b) Report Writing for Data Science in R. Leanpub.

Venables WN, Smith DM. (2021) An introduction to R. R Core Team.

Xie Y, Allaire JJ, Grolemund G. (2021) R Markdown: The Definitive Guide. CRC Press.

Wickham H. (2016) ggplot2: Elegant Graphics for Data Analysis (Use R). Spring.

Wickham H, Grolemund G. (2014) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media.

Wilke CO. (2019) Fundamentals of Data Visualization.O’Reilly Media.

Wright C, Ellis SE, Hicks SC, Peng RD. (2021) Tidyverse Skills for Data Science in R. Johns Hopkins University.

Cómo citar

BibTeX
@online{melo_favalesso2021,
  author = {Melo Favalesso, Marília and Burgos, Eliana},
  title = {Introducción al análisis de datos biológicos con R},
  version = {1},
  date = {2021-07-12},
  url = {https://github.com/somaquadrados/introduccionalR},
  langid = {es}
}
Por favor, cita este trabajo como:
Melo Favalesso, Marília, and Eliana Burgos. 2021. “Introducción al análisis de datos biológicos con R.” July 12, 2021. https://github.com/somaquadrados/introduccionalR.