Programari per a l'anàlisi de dades Codi:  M0.153    Crèdits:  5
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Metodologia   Informació sobre l'avaluació a la UOC   Consulta del model d'avaluació   Avaluació continuada  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.
 L'assignatura de Programari per a l'Anàlisi de Dades se centra en l'aprenentatge i maneig del paquet estadístic R.

- Paquet estadístic R: El paquet estadístic R és un dels més flexibles i potents per al tractament i anàlisi de les dades, des dels més elementals als més avançats. Aquest programari està desenvolupat i mantingut per la comunitat científica internacional. És, a més, un programa gratuït i es descarrega de forma fàcil i segura.

Amunt

L'assignatura introdueix a l'alumne al maneig i ús a nivell principiant/mitjà del paquet R.

Per a això s'introdueixen tasques senzilles per al maneig de dades estadístiques, la simulació de variables aleatòries en els casos univariables i multivariants, el maneig de bases de dades, la representació gràfica i la programació de tasques estadístiques amb el llenguatge de programació inclòs en R. Aquesta assignatura està inclosa en el pla d'estudis del Màster en Bioinformàtica i Bioestadística, per la qual cosa els exemples i exercicis s'emmarcaran en el camp de les ciències de la vida i la salut.

Amunt

 Al final de l'assignatura, l'alumne serà capaç de realitzar operacions de maneig de dades univariables i multivariants, incloent emmagatzematge, recuperació, creació d'estructures de dades i representació gràfica dels mateixos. A més, estarà capacitat per simular variables aleatòries, programar diferents rutines estadístiques i repassar algunes operacions algebraiques. Tot això servirà per programar i analitzar dades en qualsevol àmbit, en particular l'àmbit de la Bioinformàtica i la Bioestadística.

Amunt

No són necessaris coneixements previs més enllà dels generals del curs, com la comprensió lectora en anglès per entendre els materials del curs i coneixements bàsics d'àlgebra lineal

Amunt

Aquesta assignatura pretén donar a conèixer el programa R a nivell bàsic i intermedi. Com a resultat d'aquest aprenentatge, s'espera que l'estudiant adquireixi les següents capacitats:

  •  Aprendre a usar R com a programari estadístic avançat i lliure
  •  Aprendre a usar les principals interfícies i IDEs de R (i.g., R Commander, R Studio, etc.)
  •  Aprendre a usar R com a llenguatge de programació
  •  Aprendre a usar els principals paquets (llibreries) de R associats als continguts de bioinformàtica i bioestadística

En el context general del Màster en Bioinformática i Bioestadística, es concreta a continuació les diferents competències de l'assignatura:

Competències bàsiques i generals:
  • Totes les competències bàsiques del màster.
  • Totes les competències generals del màster.
Competències transversals:

  • CT1- Capacitat d'iniciativa, d'automotivació  i de treballar de forma independent.
  • CT3- Capacitat per proposar solucions innovadores i prendre de decisions.
  • CT5- Capacitat per a la comprensió, l'anàlisi i la síntesi.
 
Competències específiques:

  • CE2- Adquirir les habilitats tècniques apropiades per la bioinformàtica, com a programació, creació i gestió de bases de dades, creació de pàgines web, anàlisis i disseny d'algorismes, i conèixer el seu ús i aplicació en la bioinformàtica.
  •  CE3- Conèixer els principis bàsics d'inferència estadística i entendre el seu paper fonamental en la bioestadística.
  •  CE4- Conèixer els principals mètodes de regressió adequats a diferents tipus de dades, saber ajustar els models apropiats i saber com avaluar la bondat de l'ajust.
  • CE6- Adquirir la capacitat de manejar, gestionar, interpretar i analitzar grans volums de dades usant programari estadístic adequat com el llenguatge estadístic R.
  • CE8- Conèixer les eines de programari estadístic adequades per als diferents problemes de modelització i anàlisi de dades.
  •  CE13- Conèixer aspectes ètics i legals relacionats amb el desenvolupament de productes i l'àmbit empresarial de la bioinformàtica i la bioestadística.

Amunt

De forma genèrica, els continguts que es treballen en aquest curs són els següents:

  • Instal¿lació i configuració de R, R Studio, i R Commander
  • Ús de R com a eina per a l'anàlisi de dades en bioinformàtica i bioestadística
  • Ús de R com a llenguatge de programació en bioinformàtica i bioestadística
  • Principals paquets (llibreries) de R en bioinformàtica i bioestadística
Contingut detallats del curs:

1. Presentació de l'assignatura. Programa R. Instal¿lació.
1.1. Descàrrega, instal¿lació i entorn de treball de R.

2. El Llenguatge R

2.1. Conceptes bàsics en R.
2.2. Tipus de variables en R.
2.3. Funcions en R.
2.4 Vectors lògics i operadors relacionals
2.5. Data input & output.
2.6. Exercicis del tema

3. Gràfics bàsics amb R.
3.1 Tipus de gràfics.
3.2 Funcions dels gràfics.
3.3 Exercicis de repàs de gràfic

4. Programació amb R

4.1. Maneig de fitxers i bases de dades.
4.2 Programació Eficient
4.3 Les funcions amb R
4.4 Consells per a la programació.
4.5 Exercicis de Programació

5. Recerca reproduïble

5.1 Estructurar i organitzar les dades en recerca
5.2 Markdown and R Markdown
5.3 Knitr

6. Simulació amb R.

6.1 Simulació de Montecarlo
6.2 Generació de nombres aleatoris
6.3 Mostra i simulació de distribucions típiques.
6.5 Exercicis de simulació

7. Gràfics per a publicacions.

7.1 Canvi de "look" dels gràfics J.
7.2 Símbols Matemàtics en els gràfics
7.3 Lattice()
7.4 Panell de Gràfics

Amunt

Material Suport
Introducción al lenguaje R, Rstudio y R Markdown PDF
Introducció al llenguatge R, RStudio y R Markdown PDF
Estadística descriptiva y gráficos con R PDF
Estadística descriptiva i gràfics amb R PDF
Fundamentos de programación y acceso a base de datos en R PDF
Fonaments de programació i accés a base de dades en R PDF
Probabilidad y simulación con R PDF
Probabilitat i simulació amb R PDF
Introducción al machine learning con R PDF
Introducció al machine learning amb R PDF
Paquetes de R para la bioinformática PDF
Paquets de R per a la bioinformàtica PDF

Amunt

Materiales básicos:

A First Course in Statistical Programming with R (e-book).


Materiales complementarios:

Crawley, M (2009). The R Book.

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010): Biostatistical Design and Analysis Using R: A Practical Guide.

Amunt

Para cada tema se suministrará una guía de estudio (GES) donde se señalarán los materiales de lectura correspondientes a la unidad en curso, con indicaciones sobre qué puntos del material se corresponden con cada punto del tema y con qué detalle deben tratarse. Los materiales de lectura pueden consistir en capítulos o apartados del material docente de Bioinformática o Bioestadística de la UOC o bien en tutoriales, manuales o artículos que se proporcionaran en formato PDF o bien en forma de hiperenlaces.  La lectura del material didáctico siguiendo las orientaciones de la guía conforma la primera actividad de cada bloque y que deberá realizar el estudiante de forma individual. Con ello se pretende que el estudiante se familiarice con el contenido de la materia así como con el material en sí mismo, el cual se transformará en material de consulta para el estudiante durante el desarrollo del módulo. Lógicamente esta actividad se debe desarrollar en los primeros días del bloque, para poder abordar posteriormente el debate y la PEC.

DEBATE: El debate debe ser el foro donde se ponga de manifiesto la comprensión de los aspectos centrales del tema o las dificultades que éste conlleva. Para ello se trataran tanto aspectos conceptuales como prácticos a fin de trabajar conceptos y habilidades fundamentales como es la resolución de problemas o el análisis de datos utilizando las herramientas aprendidas en la parte de software estadístico.

PEC: A lo largo de la asignatura deberán resolverse una serie de PECs. Las PECs pueden combinar ambos objetivos, es decir, desarrollar conceptos y habilidades, y serán equivalentes a escala a pequeños proyectos de análisis de datos.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material o dispositius no autoritzats durant l'avaluació, entre d'altres, són conductes irregulars que poden tenir conseqüències acadèmiques i disciplinàries greus.

D'una banda, si es detecta alguna d'aquestes conductes irregulars, pot comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent –incloses les proves finals– o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha practicat qualsevol altra conducta irregular.

De l'altra, i d'acord amb les normatives acadèmiques, les conductes irregulars en l'avaluació, a més de comportar el suspens de l'assignatura, poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.


Ponderació de les qualificacions

Opció per superar l'assignatura: AC

Nota final d'assignatura: AC

Amunt

Para superar esta asignatura el estudiante debe:

- Realizar y entregar en el plazo fijado las pruebas de evaluación continuada (PEC) propuestas.
- Participar en los debates asociados a dichas PEC, siguiendo las orientaciones del consultor, y que servirán para complementar la nota de cada PEC.

En la calificación final cada una de las PEC tendrá el mismo peso. Se valorará especialmente:

- Comprensión y relación de los conceptos trabajados.
- Capacidad de presentación y redacción de los conceptos y análisis contenidos en las pruebas de
evaluación continuada.
- Dominio de la argumentación on-line como mecanismo de confrontación y creación de conocimiento,
demostrada a través de la participación en el foro de debates

Soluciones de las PEC:


- Las soluciones a las PEC se harán públicas al mismo tiempo que las notas obtenidas. De este modo podréis contrastar vuestras respuestas con las soluciones correctas y así modificar ideas erróneas o incidir en el estudio de los puntos más flojos.

- La idea es presentaros, como solución, una PEC mosaico con las respuestas más completas o con un mejor enfoque de vuestras propias PEC.

Amunt