Bases de Datos NoSQL Código:  B0.478    Créditos:  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Información adicional sobre la bibliografía y fuentes de información   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Esta asignatura constituye una introducción a las bases de datos NoSQL. En concreto, la asignatura proporciona al estudiante una visión de los múltiples conceptos, modelos y herramientas que se pueden agrupar bajo esta denominación.

Bajo el paraguas NoSQL se incluye todo un conjunto de bases de datos, basadas en diferentes modelos de datos, que constituyen una alternativa a las bases de datos relacionales, y que son especialmente idóneas para ciertos dominios de aplicación. Entre estos dominios destacan aquéllos que trabajan con grandes volúmenes de datos que se encuentran dispersos en diferentes repositorios, aquellos dominios que trabajan con datos poco estructurados y dominios en los que se establecen múltiples y complejas interrelaciones entre los datos.

Amunt

Esta asignatura, en el contexto del Programa de Business Intelligence, forma parte de la especialidad de Gestión de datos. Esta especialidad se dirige a proporcionar al profesional de perfil tecnológico capacidades prácticas para gestionar y almacenar datos relacionales y no relacionales, así como gestionar los datos como un activo de valor por medio del gobierno de datos. Esta especialidad incluye, además de la asignatura objeto de este plan docente, las siguientes asignaturas:

  • Gobierno de datos (data governance): en esta asignatura, el estudiante se familiariza con el gobierno de datos, una práctica que une personas, procesos y tecnología para cambiar la forma en que los datos son adquiridos, gestionados, mantenidos, transformados en información, compartidos en el contexto de la organización como conocimiento común y sistemáticamente obtenidos por la empresa para mejorar la rentabilidad. El estudiante trabaja con herramientas ofimáticas (DOC, XLS, PPT) y con herramientas especializadas para el desarrollo de un programa de gobierno de datos (Trifacta o Talend).
  • Bases de datos analíticos: en esta asignatura se aprende a crear un almacén de datos adecuado que ofrezca apoyo en la toma de decisiones de la organización. Se presenta de manera conceptual la arquitectura de almacenamiento (data warehousing) y se dan pautas para construir este tipo de sistemas. La puesta en práctica se lleva a cabo mediante la resolución de un caso práctico extenso para el que se usan varias herramientas especializadas (Pentaho, Microsoft, Oracle y PostgreSQL).

Amunt

La asignatura os proporcionará conocimientos que serán de utilidad en diferentes ámbitos profesionales, como son la dirección de proyectos BI, la consultoría en proyectos/productos BI, la programación de sistemas de BI, el diseño de bases de datos o la ciencia de datos, entre otros.

Amunt

El curso requiere que los estudiantes tengan la capacidad de leer y comprender el idioma inglés puesto que una parte importante de los materiales de referencia, así como de otros recursos, están en dicho idioma. Asimismo también es deseable que los estudiantes tengan conocimientos de bases de datos relacionales.

Amunt

  • Ser capaz de situar, en el contexto del área de bases de datos, los términos más habituales del área de NoSQL (agregado, clave-valor, documento, columna, grafo, sharding, réplica, ACID, BASE, teorema CAP, MapReduce, base de datos distribuida, modelos de sistemas distribuidos etc.).
  • Conocer los distintos modelos NoSQL (clave-valor, documental, columnas y de grafo), saber cómo organiza los datos cada uno de ellos y conocer sus principios básicos de diseño.
  • Ser consciente de las implicaciones de la distribución de datos para las bases de datos y entender el impacto que tiene dicha distribución en las bases de datos NoSQL.
  • Ser capaz de escoger el mejor modelo de datos para cada problema concreto, o la combinación de ellos en un proyecto informático.
  • Conocer las características principales y el funcionamiento de algunos de los productos NoSQL más relevantes.
  • Ser capaz de consultar y actualizar los datos de una base de datos en grafo (Neo4J) y de una base de datos de documentos (MongoDB).

Amunt

La asignatura consta de 5 bloques temáticos, que a su vez incluyen diferentes temas. En el documento "Contenidos, planificación y actividades evaluables" que el equipo docente hará llegar a través del Tablón de la asignatura tenéis la relación de temas incluidos en cada bloque temático.

El contenido asociado a cada bloque temático es el que se detalla a continuación:

Bloque 1: Preliminares

En este bloque se realizará una introducción a las características fundamentales asociadas a las bases de datos NoSQL, haciendo hincapié en su definición, motivación, características e inconvenientes, así como su contextualización en el área de las bases de datos.

Bloque 2. Modelos de datos

En este bloque se presentaran los modelos de datos más relevantes que subyacen en las bases de datos NoSQL, así como algunas consideraciones de diseño a tener en cuenta cuando trabajamos con ellos. Los modelos de datos que estudiaremos son los modelos de agregación (que incluyen, a su vez, los modelos clave-valor, documental y orientado a columnas) y los modelos orientados a grafos.

Bloque 3. Distribución de datos

Buena parte de las bases de datos NoSQL se utilizan en entornos altamente distribuidos que gestionan grandes volúmenes de datos. Por ello es necesario presentar los principales conceptos relacionados con bases de datos distribuidas. Entre estos conceptos, por una parte, se incluyen la definición de base de datos distribuida, así como aspectos relativos a su diseño. Por otra parte, se tratarán características como la consistencia y disponibilidad de los datos en entornos altamente distribuidos, y cómo éstas quedan expresadas en el teorema CAP. Para ello será necesario estudiar el modelo de transacciones ACID en el que se basan las bases de datos relacionales y el modelo BASE que subyace en algunas bases de datos NoSQL.

Bloque 4. Bases de datos NoSQL

En este bloque se examinará, para cada uno de los modelos de datos presentado en el bloque 2, un ejemplo de base de datos NoSQL, es decir, un producto comercial concreto. Los productos que se presentarán son Riak, MongoDB y Neo4J que constituyen ejemplos de bases de datos NoSQL clave-valor, documental y orientada a grafos, respectivamente. Asimismo se discutirán aspectos relativos a distribución de datos para alguno de los productos estudiados.

Bloque 5. Uso de bases de datos NoSQL

En el último bloque está dedicado a la consulta y actualización de datos almacenados en BD NoSQL. En concreto trabajaremos con Neo4J (una BD orientada a grafos) y MongoDB (una BD de documentos). Contaremos con el soporte de dos casos prácticos.

Amunt

Material Soporte
Caso. SGBD orientados a la toma de decisiones PDF
BD Twiter Web
Distributed Databases PDF
Transaction Models and Concurrency Control PDF
MV Linux Mint Software en línea
Máquina virtual Linux Mint (Manual) PDF
Espacio de recursos de ciencia de datos Web

Amunt

La asignatura incluye los tipos de material siguientes:

  • Vídeos y apuntes
  • Libros de texto (más información en el apartado de "Bibliografía y fuentes de información")
  • Materiales didácticos UOC, de dos tipos:
    • Material didáctico propio de la asignatura
    • Materiales didácticos de apoyo
  • Máquinas virtuales e indicaciones instalación de software

El material principal de la asignatura son un conjunto de vídeos. Estos vídeos se asocian a los temas de la asignatura que, a su vez, se encuadran en los cinco bloques temáticos descritos en el apartado "Contenidos" de este plan docente. Para cada vídeo, a su vez, se entrega (en formato pdf) su transcripción detallada. Estas transcripciones constituyen los apuntes de la asignatura.

Aparte de los vídeos, ciertos temas tienen asociada la lectura de ciertos capítulos de un libro de texto. Este libro de texto (reseñado en el apartado "Bibliografía y fuentes de información" de este plan docente) estará disponible en línea en el aula (en el apartado "Fuentes de información").

Finalmente, también os proporcionamos diversos materiales didácticos UOC en formato pdf. En primer lugar, éste es el caso del material asociado al último bloque temático de la asignatura (Bloque 5. Uso de bases de datos NoSQL) donde se presentan dos casos prácticos, uno sobre el diseño de una BD NoSQL en grafo y otro sobre el diseño de una BD NoSQL de documentos. Estos casos prácticos se orientan, respectivamente, a facilitar el aprendizaje de Neo4J y MongoDB.

En segundo lugar, el resto de materiales didácticos UOC que se suministran (de nuevo estos materiales se describen en el apartado "Bibliografía y fuentes de información" de este plan docente), son materiales de soporte que, o bien cubren conocimientos que se presuponen en el contexto de la asignatura, o bien amplían ciertos temas tratados en la asignatura (en concreto, en los vídeos y apuntes de la asignatura y el libro de texto). La lectura de estos materiales es optativa, y dependerá de vuestros conocimientos previos o de vuestro interés en profundizar en la materia de estudio.

En tercer lugar, para el aprendizaje del bloque 5 (Uso de bases de datos NoSQL), tendréis acceso a dos máquinas virtuales, una para MongoDB y la otra para trabajar con Neo4J. En ambos casos recibiréis instrucciones precisas sobre cómo usarlas.

Para acabar, es posible que sea necesario la lectura de artículos de revista (que serán suministrados desde el aula) para ampliar o complementar los contenidos de la asignatura

En el documento "Contenidos, planificación y actividades evaluables" que el equipo docente hará llegar a través del Tablón de la asignatura tenéis la relación completa de qué material debéis usar en cada momento. En ese mismo documento se proporciona una planificación semanal del estudio de la asignatura.

Amunt

Bibliografía básica:

El siguiente libro de texto conforma la bibliografía básica de la asignatura:

  • P.J. Sadalage & M. Fowler. (2013). NoSQL Distilled. A brief Guide to the Emerging World of Polyglot Persistence, Pearson Education. Este libro está disponible en línea en el aula, apartado "Materiales y Fuentes", sección "Fuentes de Información".

Bibliografía complementaria:

Los siguientes libros (accesibles en formato electrónico a través de la biblioteca virtual) constituyen la bibliografía complementaria de la asignatura:

  • J. Celko (2013). Joe Celko's complete guide to NoSQL : what every SQL professional needs to know about non-relational databases. Elsevier Science.
  • G. Harrison (2015). Next Generation Databases: NoSQL, NewSQL and Big Data: what every professional needs to know about the future of databases in a world of NoSQL and Big Data. Apress.
  • L. Liu & M.T. Özsu (Eds.) (2009). Encyclopedia of Database Systems. Springer.
  • M.T. Özsu & P. Valduriez (2011). Principles of Distributed Systems. 3rd edition. Springer.

Además de los libros previos, los materiales didácticos UOC de soporte a la asignatura son los siguientes:

  • Abelló (2012). Transaction Models and Concurrency Control. Material docente UOC, asignatura Arquitectura de bases de datos.
  • J. Casas (2013). Diseño conceptual de bases de datos. Material docente UOC, asignatura Diseño de bases de datos.
  • M. E. Rodríguez (2011). Gestión de transacciones. Material docente UOC, asignatura Uso de bases de datos.
  • Romero y M. Oliva (2012). Distributed Databases. Material docente UOC, asignatura Arquitectura de bases de datos.

Aparte de toda la bibliografía incluida en este apartado, cada tema puede incluir otras referencias bibliográficas (artículos de revista, congreso o entradas de blogs). Esta bibliografía está incluida al final de cada vídeo y en los apuntes de la asignatura.

Amunt

Para entender el enfoque metodológico general se recomienda la lectura del apartado "Materiales y herramientas de apoyo", y el de "Evaluación". Además es necesario que leáis atentamente el documento "Contenidos, planificación y actividades evaluables" que el equipo docente de la asignatura os hará llegar a través del tablón.

Recomendamos el siguiente ciclo de estudio para cada tema (y en consecuencia para cada bloque temático):

  • Escuchar los vídeos asociados a cada tema y en el orden indicado. Estudiar cuidadosamente los apuntes asociados a cada vídeo. A continuación, si es el caso, leer el capítulo o capítulos recomendados del libro de texto que conforma la bibliografía básica de la asignatura. En ciertos temas, dependiendo de vuestros conocimientos previos, puede ser necesario leer algunos de los materiales UOC de soporte. En el caso del bloque 5 (Uso de bases de datos NoSQL) tendréis módulos didácticos UOC en formato pdf.
  • Participar en el seguimiento activo de los espacios de comunicación del aula. Allí se plantearán dudas, se darán respuestas y se tratarán temas y aspectos relacionados con la materia de estudio.
  • Comenzar a preparar las pruebas de evaluación continua con antelación. Se requerirá la consulta de los diferentes materiales de la asignatura y, por lo general, no tienen una solución única. Justificar y argumentar la solución o las soluciones propuestas es de vital importancia, igual que respetar las fechas de entrega.

Finalmente, todos los estudiantes de esta asignatura tenéis acceso a un aula de Laboratorio. El objetivo de esta aula, dirigida por un consultor diferente del aula de la asignatura, es asistiros en la instalación y problemas técnicos derivados de la instalación del software de las asignaturas que estéis cursando. Entendedlo, pues, como un espacio de apoyo al trabajo con el software de la asignatura. En ningún caso tenéis que dirigir cuestiones de teoría a esta aula, ni usarla como foro de discusión para la resolución de problemas relacionados con los ejercicios planteados en las PEC.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente - incluidas las pruebas finales - o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

La UOC se reserva la potestad de solicitar al estudiante que se identifique o que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación por los medios que establezca la universidad (síncronos o asíncronos). A estos efectos, la UOC puede exigir al estudiante el uso de un micrófono, una cámara u otras herramientas durante la evaluación y que este se asegure de que funcionan correctamente.

La verificación de los conocimientos para garantizar la autoría de la prueba no implicará en ningún caso una segunda evaluación.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

La evaluación continua, en el contexto de la asignatura, incluye 3 Pruebas de Evaluación Continuada (PEC) de realización individual. Es obligatorio realizar un mínimo 2 PEC para poder aprobar la asignatura.

A continuación se detallan los bloques temáticos que se evalúan en cada PEC:

  • PEC 1: bloques temáticos 1 y 2
  • PEC 2: bloque temáticos 1, 2 y 3
  • PEC 3: bloques temáticos 1, 2, 3, 4 y 5

El seguimiento correcto de la asignatura os compromete a realizar las PEC propuestas según las indicaciones que se indican en su enunciado y este Plan Docente. En caso de que no sea así, las actividades se evaluarán con una calificación de suspenso (D). Por otro lado, y a criterio de la Universidad, el incumplimiento de esta obligación será comunicada a la gestión de los estudios, con el fin de evaluar si el estudiante está autorizado para aprobar cualquier otra materia mediante una evaluación continua en el semestre en curso o el siguiente.

Las PEC se deben entregar dentro de los plazos establecidos en este plan docente (véase el apartado de "Fechas clave"). En caso de situaciones excepcionales que no permitan cumplir los plazos, por favor poneros en contacto con vuestro profesor antes de la finalización de la PEC para evaluar alternativas. Si la PEC se entrega después de la Fecha clave, su puntuación final será un 70% de la nota obtenida. No se podrá entregar ninguna PEC después de la publicación de las soluciones de la misma PEC.

Sistema de calificación

Cada actividad (PEC) tendrá una nota individual cualitativa: A, B, C+, C- o D.

La nota de la evaluación continua, que es un promedio de cada una de las actividades por módulo, será cualitativa y cuantitativa (sin decimales): A = 9/10 o B = 7/8 o C + = 5/6 o C- = 3/4 o D = 0/1/2 o no presentado (NP) = 0.

La calificación final será cuantitativa con un decimal.

Criterio de evaluación general basado en evidencia

APROBADO

Ha estudiado, entendido el caso y resuelto los problemas.

Ha leído la teoría y la ha aplicado correctamente. Proporciona evidencia de dicho conocimiento y actividad.

Se presentan correctamente las actividades y las participaciones sin faltas de ortografía y/o escritura.

NOTABLE

Todas las anteriores.

Conoce el tema, es capaz de vincularlo con otras materias y sacar conclusiones.

Aplica la teoría y la experiencia práctica en el contexto de su trabajo y/o de la vida real.

Buena presentación y calidad en la escritura.

EXCELENTE

Todas las anteriores.

Realiza aportaciones y proporciona nuevas soluciones creativas e innovadoras.

Muestra evidencia rigurosa y crítica.

Además de estos criterios generales usados a lo largo del semestre, pueden añadirse otros criterios específicos para evaluar algunas de las habilidades generales o particulares. Éstos serán informados, si procede, en el enunciado de las actividades.

No existe una PEC de recuperación final o ningún mecanismo para recuperar una PEC. El sistema de evaluación se basa en el trabajo continuado.

Amunt

 

Esta asignatura únicamente se puede superar a través de la realización y entrega de un mínimo de 2 de las PEC propuestas a lo largo del semestre. La nota final de evaluación continua (EC) será la media de las 3 PEC. Es importante destacar:

  • Aquellos estudiantes que únicamente hayan entregado 1 PEC tendrán como nota final de EC suspenso.
  • Las PEC entregadas que no incluyan al menos un 25% de los ejercicios propuestos resueltos serán consideradas como no presentadas.
  • Las PEC no presentadas computan como 0 en el cálculo de la nota final de EC.

Amunt

En el contexto de la asignatura, el equipo docente podrá hacer tres tipos de retorno acerca de las actividades evaluables realizadas por los estudiantes:

Retorno general: consiste en la publicación de una posible solución oficial (con explicaciones, en caso de que éstas sean necesarias) de las actividades evaluables propuestas (PEC). Este tipo de retorno siempre se realizará. La publicación de las soluciones oficiales se realizará tras la fecha límite de entrega fijada para los estudiantes (en general, un par de días después).

Retorno a nivel de grupo: consiste en la publicación (vía tablón o conjuntamente con la solución oficial de las actividades evaluables) de los errores más frecuentemente realizados por los estudiantes. Este tipo de retorno sólo se realizará en caso de ser pertinente, y una vez que el equipo docente haya finalizado el proceso de corrección.

Retorno individualizado: consiste en la realización de comentarios individuales sobre las entregas realizadas por los estudiantes de las actividades evaluables. Se realizará siempre en el caso de aquellos estudiantes para los cuales, en función de su evolución, incurran en riesgo de no superar la asignatura. Se puede realizar mediante el buzón personal o el registro de evaluación continua, una vez el equipo docente haya finalizado el proceso de corrección. En relación al retorno individualizado, es importante destacar que cualquier estudiante lo puede solicitar, tanto a nivel de evolución del semestre como tras cada PEC. Se recomienda hacer esta petición después de cada PEC sobre la que tengáis dudas o necesidades de aclaración, y no esperar a las calificaciones finales. En el proceso de revisión puede participar el equipo docente al completo (consultor y profesor responsable de la asignatura).

Amunt