Introducción al análisis de datos biológicos con R
Instituto Nacional de Medicina Tropical (INMeT) de Argentina
Introducción al análisis de datos biológicos con R
Sobre el curso
¿De qué se trata el curso?
Este es un curso de un mes y medio en programación R para análisis de datos biológicos. Se realiza de forma virtual y contará con una combinación de clases sincrónicas y asincrónicas, con ejercicios que se entregarán semanalmente y una presentación final. Es un curso intensivo y desafiante que invita al estudiante a pensar y desarrollar algoritmos para el análisis de datos biológicos. Específicamente, el curso tiene como objetivo enseñar a los participantes a:
desarrollar e interpretar scripts R
importar y manipular datos
describir y visualizar datos
crear informes con RMarkdown
Subiremos los videos de las clases al canal de youtube @somaquadrados. Los videos se pueden ver de forma asincrónica. El material escrito, diapositivas, scripts y tareas estarán disponibles en el repositorio de “Soma dos Quadrados” (github.com/Soma-dos-Quadrados/introduccionalR). Las clases presenciales se llevan a cabo semanalmente los viernes, de 2:00 pm a 5:00 pm. Las clases presenciales se utilizarán para resolver dudas y ejercicios.
El curso se ofrece de forma gratuita y la preinscripción estará abierta entre los días 12 y 31 de julio. El curso comienza el día 16 de agosto hasta el dia 27 de septiembre de 2021.
Público
El curso está dirigido a estudiantes de pós-grado, técnicos y investigadores interesados en aprender a utilizar R para el análisis de datos biológicos. Es un curso introductorio que trabajará con la importación, manipulación y análisis descriptivo y visual de datos biológicos.
El cupo máximo es de 20 personas.
Dedicación
Los estudiantes deben ver las lecciones en video y resolver los ejercicios disponibles en el repositorio de Soma dos Quadrados. La duración estimada de las clases es de 3h a 4h. Los ejercicios semanales son obligatorios.
El viernes habrá clases virtuales obligatorias y sincrónicas, donde se hará un repaso de la clase teórica y resolución de dudas. Los ejercicios de tareas también se revisarán con los participantes. La duración media de estas clases es de 3h. También habrá un grupo de Telegram (mensajería on-line) para consultas y discusiones entre estudiantes en tiempo real.
El curso requiere de seis a ocho horas de dedicación a la semana.
Responsables
Eliana Burgos (efburgos@conicet.gov.ar)
Marília Melo Favalesso (mariliabioufpr@gmail.com)
Carga horaria
48 h
Enmienda
Clase 0
Introducción al curso
Programación
IDE
RStudio
Clase 1
Objetos y atribuciones
Estructuras de objetos: qué son y cómo construir en R
Funciones
Estructuras de Control
Clase 2
Datos biológicos
Importación de bases de datos para el R
Manipulación de la base de datos en R
Clase 3
Variables estadística
Distribución de probabilidad
Estadística descriptiva: medidas de posición
Estadística descriptiva: medidas de dispersión
Clase 4
Estadísticas descriptivas: las frecuencias
Gráficos
Clase 5
- Informes dinámicos con RMarkdown
Clase 6
- Presentación del proyecto desarrollado
Inscripción
La inscripción al curso comienza el lunes 12 de julio a las 9 am y se extiende hasta el día 31 a las 00 am. Para aquellos interesados en registrarse, solo complete el siguiente formulario: https://forms.gle/1Y6rR8VbfCE214nw8.
Referencias
(Todos los libros de referencia de este curso tienen copias para distribución gratuita).
Aragón TJ. (2017) Population Health Data Science with R: Transforming data into actionable knowledge.
Atlan (2019) Introduction to GIS: Manipulating and Mapping Geospatial Data in R.
Brunsdon C, Comber L. (2019) An Introduction to Spatial Analysis and Mapping. Sage.
Chang W. (2013) R Graphics Cookbook: Practical Recipes for Visualizing Data. O’Reilly Media.
DiMaggio C. (2014) Spatial Epidemiology Notes: Applications and Vignettes in R. Columbia University, NY
Engel CA. (2019) Using Spatial Data with R.
Gillespie C, Lovelace R. (2021) Efficient R Programming: A pratical guide to smarter programming. O’Reilly Media.
Grolemund G. (2014) Hands-On Programming with R. O’Reilly Media.
Healy K. (2018) Data visualization: A practical introduction. Princeton University Press.
Hijmans, R. 2019. Spatial Data Analysis and Modeling with R.
Holmes S, Huber W. (2018) Modern Statistics for Modern Biology. Cambridge.
Irizarry RA. (2021) Introducción a la ciencia de datos: Análisis de datos y algoritmos de predicción con R. CRC Press.
Irizarry RA, Love MI. (2015) Data analysis for the life sciences. Leanpub.
Lovelace R, Nowosad J, Muenchow J. (2021) Geocomputation with R. CRC Press.
Peng RD. (2016a) Exploratory Data Analysis with R. Leanpub.
Peng RD. (2016b) Report Writing for Data Science in R. Leanpub.
Venables WN, Smith DM. (2021) An introduction to R. R Core Team.
Xie Y, Allaire JJ, Grolemund G. (2021) R Markdown: The Definitive Guide. CRC Press.
Wickham H. (2016) ggplot2: Elegant Graphics for Data Analysis (Use R). Spring.
Wickham H, Grolemund G. (2014) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media.
Wilke CO. (2019) Fundamentals of Data Visualization.O’Reilly Media.
Wright C, Ellis SE, Hicks SC, Peng RD. (2021) Tidyverse Skills for Data Science in R. Johns Hopkins University.
Cómo citar
@online{melo_favalesso2021,
author = {Melo Favalesso, Marília and Burgos, Eliana},
title = {Introducción al análisis de datos biológicos con R},
version = {1},
date = {2021-07-12},
url = {https://github.com/somaquadrados/introduccionalR},
langid = {es}
}