SQL para Análisis de Datos Código:  B0.472    Créditos:  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Información adicional sobre la bibliografía y fuentes de información   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  

Las bases de datos son el mecanismo más habitual que las organizaciones utilizan para almacenar y procesar de manera no volátil los datos necesarios para su actividad diaria. A su vez, las bases de datos son gestionadas y manipuladas mediante un software altamente especializado y complejo denominado sistema gestor de bases de datos. Desde un punto de vista de uso, las bases de datos nos permiten gestionar el día a día de las organizaciones y por ello también se las conoce bajo la denominación de bases de datos operacionales. Por otro lado, tenemos los almacenes de datos (data warehouse) que integran datos de diferentes fuentes, entre las que se encuentran las bases de datos operacionales, y que tienen como objetivo principal dar apoyo a la toma de decisiones.

Para poder guardar los datos de interés de una organización, hay que disponer de algún modelo de datos que permita su representación en un ordenador en forma de bases de datos. Este modelo de datos tiene que permitir, por un lado, definir la estructura de la base de datos y las reglas de integridad que garantizan que la base de datos sea consistente. Por otro lado, el modelo de datos también tiene que proporcionar operaciones que permitan la consulta y actualización de la base de datos. A pesar de que existen diferentes modelos de datos, nosotros nos centraremos en el modelo de datos relacional, dado que es el más utilizado.

Esta  asignatura tiene por objetivo adquirir conceptos, procedimientos y buenas prácticas para la creación y manipulación de las bases de datos que dan soporte a la construcción de almacenes de datos. Para ello se introduce el lenguaje SQL, extendiéndolo mediante el estudio del lenguaje procedimental PL/pgSQL, y en el diseño físico de bases de datos, así como en bases de datos orientadas a columnas. Estas bases de datos también se basan en el modelo relacional y se caracterizan por el almacenamiento de los datos en forma de columnas. Esta característica las hace especialmente idóneas para entornos OLAP.

Amunt

Actualmente la gran mayoría de las organizaciones intentan basarse en datos y evidencias para tomar mejores decisiones y mirar de conseguir ventajas frente sus competidores. Es por este motivo que cada vez es más necesario para cualquier profesional poder adquirir algunas habilidades básicas en el ámbito del análisis de datos (data literacy).

Este curso presenta los aspectos básicos del análisis de datos y sirve de apoyo para aquellos profesionales interesados en adentrarse en el análisis de datos utilizando bases de datos relacionales. Durante la formación se profundiza en el aprendizaje del lenguaje SQL, en el diseño físico de bases de datos e introduce algunas alternativas al clásico modelo relacional para el análisis de datos. 

Amunt

El objetivo de la especialidad de Sistemas de información de inteligencia de negocio (data warehouse) es formar aquellos perfiles tecnológicos (diseñadores, analistas, programadores, configuradores y responsables de los servicios técnicos) que componen las soluciones de Inteligencia de negocio: bases de datos, almacenamiento, extracción, tratamiento y carga de datos, construcción de aplicaciones de usuario, etc.

En concreto, en el caso de esta asignatura, los campos profesionales en los que se proyecta son "Programador SQL", "Programador de Sistemas de BI", "Consultor de Proyectos BI" y "Desarrollador ETL".

Amunt

Esta especialidad se dirige a perfiles técnicos e ingenieros informáticos o de telecomunicación, analistas de datos en departamentos de control de gestión u otros, matemáticos o candidatos con una experiencia profesional equivalente.

Amunt

Las principales competencias que el estudiante tiene que adquirir en el contexto de la asignatura son las que se indican a continuación:

  • Ser capaz de consultar y actualizar de manera eficiente una base de datos mediante SQL estándar.
  • Ser capaz de codificar procedimientos almacenados utilizando lenguajes procedimentales.
  • Ser capaz de implementar diferentes técnicas de disparadores en una base de datos.
  • Ser capaz de entender y aplicar conceptos avanzados de SQL como funciones analíticas, transacciones o Common Table Expression.
  • Ser capaz de realizar el diseño físico de bases de datos relacionales.
  • Conocer las características de las bases de datos orientadas a columnas, y saberlas situar en el contexto del área de bases de datos.
  • Entender las principales técnicas que implementa un sistema gestor de bases de datos orientado a columnas.
  • Ser capaz de aplicar los conocimientos anteriores dentro del contexto del data warehouse/OLAP.

Amunt

La asignatura consta de 5 bloques didácticos, cuyo contenido se detalla a continuación:

Bloque 1. Las bases de datos relacionales: una historia de éxito sin precedentes

El modelo relacional es lo que nos permite representar una base de datos en un ordenador. Debemos conocer qué estructuras nos proporciona, e identificar sus ventajas. Finalmente, el modelo relacional también nos da mecanismos para definir reglas de integridad. Aprenderemos a especificar reglas de integridad que nos permitirán definir las condiciones que nuestra base de datos debe cumplir si queremos que los datos en ella contenidos sean consistentes.

Bloque 2. De la creación a la manipulación de una base de datos relacional

En este bloque didáctico se presentan los conceptos más básicos asociados al SQL estándar. En primer lugar se presentan las principales sentencias de definición de datos (cómo seria, por ejemplo, tablas y vistas). A continuación se presentan las sentencias básicas de manipulación de datos (SELECT, INSERT, DELETE y UPDATE de tablas y vistas). Finalmente, se introducen las sentencias de concesión y revocación de privilegios sobre los datos, primitivas de gestión de transacciones, y otras modalidades de trabajo con el lenguaje SQL.

Bloque 3. Procedimientos almacenados y disparadores, ¿para qué son necesarios?

En este bloque didáctico se presentan los conceptos más avanzados asociados al SQL estándar. En primer lugar, se presenta la estructura básica de componentes de un entorno SQL, revisando los conceptos de servidores, catálogos y esquemas, para continuar una introducción a los conceptos de conexión, sesión y transacción. A continuación, se completará el estudio de los componentes lógicos vistos mediante la introducción de procedimientos almacenados y disparadores. Finalmente, se introducen el lenguaje procedimental PL/pgSQL y las sentencias que ofrece PostgreSQL para definir estos componentes.

Bloque 4. Ampliando la caja de herramientas: common table expressions y funciones analíticas

En este bloque didáctico se presentan conceptos avanzados de SQL de aplicación en entornos Data Warehouse. En primer lugar, se presenta el concepto de clave subrogada y las diferentes posibilidades de implementar esta técnica mediante SQL. A continuación, se introducirán dos conceptos avanzados para la creación de consultas SQL, las Common Table Expression y las funciones analíticas, cómo aplicar estas funcionalidades y los beneficios asociados. Por último, se verán técnicas de tratamiento de valores nulos en bases de datos operacionales y Data Warehouse, y se concluirá con una introducción a las transacciones, sus propiedades, la problemática asociada a éstas, mecanismos de implementación de transacciones en PostgreSQL y la importancia de éstas en entornos de bases de datos operacionales y Data Warehouse.

Bloque 5. El diablo está en los detalles: optimización de la base de datos en función de su uso

Este bloque didáctico analizará los principales métodos y construcciones que se utilizan en el diseño físico de bases de datos. Conceptualmente, podemos definir el diseño físico de una base de datos como el proceso que, a partir del diseño lógico de la base de datos y de información sobre su uso esperado, creará una configuración física de la base de datos adaptada al entorno donde se alojará y que permita el almacenamiento y la explotación de los datos con un rendimiento adecuado.

Bloque 6. Esto es sólo el principio: hay numerosas soluciones alternativas, como las Bases de datos orientadas a columnas

Este bloque didáctico presentará las principales características y utilidad de las bases de datos orientadas a columnas (más habitualmente conocidas como column stores), así como las diferencias que presentan con las bases de datos relacionales más tradicionales (denominadas row stores). Asimismo se explicarán las principales técnicas que permiten implementar dichas características. Finalmente se proporcionará una visión de los principales productos disponibles en el mercado.

Los materiales de interés están indicados en cada uno de los bloques temáticos del aula.

Amunt

Material Soporte
Convención de nombres: Componentes Audiovisual
Convención de nombres: Convenciones en SQL Audiovisual
Convención de nombres: restricciones PDF
Buenas prácticas: codificación de transacciones PDF
Convención de nombres: componentes PDF
Complementos de SQL para procedimientos almacenados PDF
Convención de nombres: convenciones en SQL PDF
Buenas prácticas: codificación de procedimientos y funciones PDF
Almacenes de columnas: contextualización PDF
Buenas prácticas: codificación de consultas PDF
Almacenes de columnas: procesamiento de consultas PDF
Almacenes de columnas: características PDF
Contextualización de disparadores PDF
Buenas prácticas: codificación SQL PDF
Contextualización de procedimientos PDF
Almacenes de columnas: compresión de datos PDF
Almacenes de columnas: Procesamiento de consultas (Parte I) Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte II) Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte III) Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte IV) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VIII) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VII) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VI) Audiovisual
Almacenes de columnas: Compresión de datos (Parte V) Audiovisual
Almacenes de columnas: Compresión de datos (Parte IV) Audiovisual
Almacenes de columnas: Compresión de datos (Parte III) Audiovisual
Almacenes de columnas: Compresión de datos (Parte II) Audiovisual
Almacenes de columnas: Compresión de datos (Parte I) Audiovisual
Almacenes de columnas: Características III Audiovisual
Almacenes de columnas: Características II Audiovisual
Almacenes de columnas: Características I Audiovisual
Almacenes de columnas: Contextualización Audiovisual
Contextualización de procedimientos Audiovisual
Buenas prácticas: codificación de procedimientos y funciones Audiovisual
Buenas prácticas: codificación de consultas Audiovisual
Buenas prácticas: codificación SQL Audiovisual
Convención de nombres: Restricciones Audiovisual
Buenas prácticas: codificación de transacciones Audiovisual
Contextualización de disparadores Audiovisual
Espacio de recursos de ciencia de datos Web

Amunt

El material principal de apoyo de la asignatura son los módulos didácticos previamente descritos.

Para lograr las competencias relativas al aprendizaje del lenguaje SQL usaremos el sistema gestor de bases de datos PostgreSQL. Para poder instalarlo, debéis de realizar la descarga desde: https://www.postgresql.org/download/. Si tenéis instalado en vuestro equipo versiones superiores podéis trabajar con ellas.

Finalmente, también se proporcionará material complementario, a través de los diferentes espacios del aula. Entre este material se destacan las guías de instalación de software, colecciones de ejercicios y cursos de Datacamp.

Amunt

Cómo ya se ha comentado el material de referencia de la asignatura son los módulos didácticos que tenéis disponibles dentro del aula. Allí podéis consultar la bibliografía básica de la asignatura. Adicionalmente, en cada módulo didáctico podéis encontrar bibliografía más específica relacionada con los contenidos de cada uno de estos módulos didácticos.

Amunt

El estudio de la asignatura gira fundamentalmente entorno a los siguientes conceptos:

  • Estudio del material de la asignatura (módulos didácticos, vídeos y apuntes).
  • Otros materiales complementarios que se pueden suministrar a través de los diferentes espacios del aula.
  • Realización de ejercicios de autoevaluación. Se incluyen tanto los ejercicios propuestos en los diferentes módulos didácticos, como otros que se puedan suministrar a través de los diferentes espacios del aula.
  • Pruebas de evaluación continuada (PEC)

Además, se recomienda consultar la sección Planificación en el espacio Contenidos del aula. Tener presente en todo momento la temporización del curso os permitirá asegurar que lleváis el ritmo de aprendizaje adecuado. El conjunto de fechas clave también se encuentra disponible al final de este Plan Docente.

El seguimiento activo de los espacios de Comunicación del aula, los foros de discusión por tema, es de primordial interés. Ene ellos se plantearán dudas, se darán respuestas y se tratarán temas y aspectos relacionados con la materia de estudio.

En relación a los ejercicios de autoevaluación, es importante destacar que están destinados a que el estudiantado evalúe su nivel de comprensión, no deben ser utilizados para ver más ejemplos. 

Se recomienda para cada ejercicio de autoevaluación: 1) leerlo con detenimiento y resolverlo de manera individual. 2) Comparar la solución con que aparece en el solucionario (puede pasar perfectamente que sean diferentes). 3) En caso de dudas respecto a la corrección de vuestra solución, plantearlas en los espacios de comunicación del aula (en concreto, en el Foro).

Uno de los recursos proporcionados por el curso y orientado a fomentar el aprendizaje práctico de distintas facetas de SQL son los cursos de Datacamp. Dichos cursos son opcionales pero recomendados, ya permiten el aprendizaje interactivo de SQL en los aspectos que abordaremos posteriormente en las actividades prácticas.

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

La evaluación continua, en el contexto de la asignatura, incluye 3 Pruebas de Evaluación Continuada (PEC) de realización individual. Es obligatorio realizar las 3 PEC para poder aprobar la asignatura.

A continuación se detallan los módulos didácticos que se evalúan en cada PEC:

  • PEC 1: bloques didácticos 1 y 2. 
  • PEC 2: bloque didáctico 3. 
  • PEC 3: bloques didácticos 4 y 5. 

Las PEC se deben entregar dentro de los plazos establecidos en este plan docente (véase el apartado de fechas clave). En caso de situaciones excepcionales que no permitan cumplir los plazos, por favor poneros en contacto con vuestro profesor colaborador antes de la finalización de la PEC para evaluar alternativas.

IMPORTANTE:

  • No se aceptarán actividades de evaluación entregadas más tarde de las 23:59h de la fecha límite de entrega.
  • Dado el modelo de evaluación de la asignatura, evaluación por EC, se recomienda entregar la actividad evaluable antes de la fecha-hora límite de entrega, por si en el último momento pudieran surgir problemas. Es mejor entregar una actividad inacabada a no entregarla y siempre se puede repetir el envío antes de la fecha-hora límite. Se evaluará la última entrega dentro de plazo.
  • El seguimiento correcto de la asignatura compromete a realizar las PEC propuestas según las indicaciones que se indican en su enunciado y este Plan Docente. En caso de que no sea así, las actividades se evaluarán con una calificación de suspenso (D). Por otro lado, y a criterio de la Universidad, el incumplimiento de esta obligación será comunicada a la gestión de los estudios, con el fin de evaluar si el estudiante está autorizado para aprobar cualquier otra materia mediante una evaluación continua en el semestre en curso o el siguiente.
  • Es responsabilidad del estudiante asegurarse que envía a corregir la actividad de evaluación que pretende y en el lugar indicado. 

 

Amunt

Esta asignatura únicamente se puede superar a través de la realización y entrega de las 3 PEC propuestas a lo largo del semestre. La nota final de EC será la media de las notas de entre las PEC entregadas. Es importante destacar:

  • Aquellos estudiantes que únicamente hayan entregado 1 PEC tendrán como nota final de EC N (no presentado).
  • Aquellos estudiantes que hayan entregado sólo 2 PEC tendrán una calificación final de EC de suspenso.
  • Las PEC entregadas que no incluyan al menos un 25% de los ejercicios propuestos resueltos serán consideradas como no presentadas.
  • Las PEC no presentadas computan como 0 en el cálculo de la nota final de EC.
  • Los cursos de Datacamp son optativos, pero habrá una pequeña bonificación en la nota para quienes los completen. 
  • Se  puede solicitar revisión de la evaluación de las PEC, hasta diez días después de la publicación de la solución oficial. En el proceso de revisión puede participar el equipo docente al completo (consultor y profesor responsable de la asignatura). Revisar, implica corregir de nuevo y por tanto, si se detectara un error en la corrección la calificación podría ser modificada al alza o baja. No habrá revisiones fuera del plazo indicado y menos a final de curso.
  • Obtener Sobresaliente en todas las PEC, no implica obtener MH para ello es necesario haber participado activamente en el aula durante el curso y haber realizado aportaciones al grupo. 

Amunt

En el contexto de la asignatura, el equipo docente podrá hacer tres tipos de retorno para las PEC entregadas:

Retorno general: consiste en la publicación de una posible solución oficial (con explicaciones, en caso de que éstas sean necesarias) de las actividades evaluables propuestas (PEC). La publicación de las soluciones oficiales se realizará tras la fecha límite de entrega fijada para los estudiantes (en general, un par de días después).

Retorno a nivel de grupo: consiste en la publicación (vía Anuncios o conjuntamente con la solución oficial de las actividades evaluables) de los errores más frecuentemente realizados por el grupo. 

Retorno individualizado: consiste en la realización de comentarios individuales para cada una de las entregas realizadas. Es una herramienta importante para la mejora del aprendizaje.

Amunt