Bases de datos Analíticas Código:  B0.480    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Cada vez más el área de bases de datos está evolucionando por la aparición de nuevos retos en la gestión de la información. Así aparecen las bases de datos analíticas y, específicamente, los almacenes de datos o data warehouse (DW) como elemento troncal de la Factoría de Información Corporativa (FIC).

La FIC/DW es hoy en día el centro de atención de las grandes instituciones, porque proporciona un mejor conocimiento de dicha organización y de sus clientes.

La creación de la FIC y la correcta implementación de todos sus elementos tales como los diferentes almacenes de datos, los datos maestros, las estructuras multidimensionales y los procesos de transformación y carga son cuestiones críticas en la gestión del conocimiento y la madurez analítica de las organizaciones. En la creación de la FIC es también fundamental prestar especial atención a las cuestiones relativas a la calidad del dato, gestión de los metadatos y la gestión de los datos maestros. De igual modo y dada la envergadura de los proyectos relacionados con la creación de la FIC, conviene conocer las distintas estrategias y enfoques existentes de cara a abordar estos proyectos.

Amunt

Esta asignatura "Bases de datos analíticas" pertenece a la especialidad en Gestión de datos del Máster en Inteligencia de negocio y Big Data Analytics, así como al Posgrado en Inteligencia de negocio y análisis de datos.  Está dirigido a estudiantes con perfil de formación empresarial, ingenierías de todo tipo, matemáticas, sociología, medicina, ciencias para la información o candidatos con una experiencia profesional equivalente.

El programa provee fundamentos teóricos para la explotación de datos (business intelligencebig datadata science) y también formación aplicada en el ámbito de negocio (customer analyticsoperations analytics y people analytics), tanto para profesionales de perfil funcional como técnico.

La pieza central de las bases de datos analíticas será el almacén de datos, que es en realidad una base de datos diseñada y construida para ofrecer apoyo en la toma de decisiones de las organizaciones.

Un almacén de datos se crea al extraer datos de una o varias fuentes externas de datos. Los datos extraídos, antes de cargarse en el almacén de datos, son transformados para eliminar inconsistencias, y si es necesario, resumirlos. Este proceso de transformación, de creación del detalle de los datos (incluyendo el factor tiempo), el resumen y combinación de los datos extraídos, ayudan a crear un contexto adecuado para que cualquier persona pueda tomar las decisiones que le correspondan de la manera más responsable posible. Por lo tanto, influye directamente en la mayor eficacia del negocio.

Las líneas comerciales actuales y futuras obligan a las empresas a ser cada vez más competitivas. Para ser competitivas es necesario que las compañías tengan optimizados e integrados sus flujos internos de información y sus relaciones comerciales externas, y así conseguir objetivos básicos como son las mejoras de la productividad, la calidad, el servicio al cliente y la reducción de costes.

Para llevar a cabo todos estos propósitos hacen falta profesionales que tengan conocimientos profundos en estas áreas. En consecuencia, y dada la emergencia de todos los temas relacionados con Internet, se puede afirmar que el área de interés presentada forma un bloque innovador dentro del mundo de los sistemas de información.

Amunt

Inteligencia de negocio, gestión de bases de datos, analítica de negocio, social-intelligence y Big Data.

Amunt

El Analista o Científico de Datos debe estar familiarizado con los conceptos básicos de Business Intelligence y análisis de datos.  Es necesario disponer de conocimientos de programación, estadística y principios de visualización. En caso de no tener estos conocimientos, se pueden adquirir mediante la Competencias de Análisis (Data Literacy) o cursando de forma independiente alguno de los cursos.

Amunt

Esta asignatura pretende que, al final de la misma, el estudiante haya adquirido las siguientes competencias:

  • Saber diseñar un almacén de datos, elegir la mejor arquitectura que lo soporte y saberlo administrar.
  • Conocer los diferentes tipos de aplicaciones y herramientas para una óptima explotación del almacén de datos (EIS, OLAP).
  • Conocer y saber construir y utilizar sistemas de bases de datos relacionales para el análisis de datos.
  • Saber cómo deben implementarse procesos de negocio de alto nivel en las empresas para que proporcionen un rendimiento competitivo.
  • Conocer y estar en condiciones de desarrollar e implementar un proyecto de inteligencia de negocio dentro de la empresa, las etapas del ciclo de gestión de proyectos y los métodos específicos de producción de proyectos de business intelligence.
  • Ser capaz de proponer soluciones integradas y hacer entender a los clientes que la implantación de un DW es un proyecto complejo debido a su profundo impacto en los procesos de la empresa (cambio cultural de la empresa, cambio en los procesos de negocio, cambio en la organización y cambio en la disciplina de trabajo).
  • Comprender y saber aplicar los métodos y herramientas de análisis de datos en las principales funciones y procesos empresariales: marketing y ventas, operaciones y logística y recursos humanos.
  • Adquirir y estar en condiciones de implantar una mentalidad crítica y analítica dentro de la empresa, mediante el conocimiento de los diferentes sistemas de información de empresa, los métodos y las técnicas de análisis de datos, la formulación de preguntas e hipótesis y la obtención de conclusiones útiles para el negocio.

 

Con esta asignatura el estudiante adquirirá también las siguientes competencias de la especialización Bases de datos, data minning y Data Warehouse:

  • Conocer y estar en condiciones de aplicar las técnicas y las herramientas de análisis datos, los métodos y los algoritmos más habituales y sus usos aplicados en diferentes empresas y organizaciones.
  • Conocer las diferentes estructuras de datos que ofrecen soporte a los procesos de BI.
  • Conocer las principales herramientas relacionadas con los procesos de BI y saber utilizar alguna.
  • Ser capaz de diseñar e implementar esquemas de almacenes de datos orientados a procesos analíticos.
  • Ser capaz de poblar los almacenes de datos a partir de distintas fuentes de información mediante la creación y ejecución de procesos ETL.
  • Ser capaz de crear y explotar almacenes de datos para buscar información utilizando técnicas específicas de bases de datos analíticas.
  • Estar capacitado para realizar prácticas de uso y construcción de sistemas de inteligencia de negocio, dentro de un marco conceptual propio basado en las buenas prácticas y el conocimiento científico.

Amunt

Los contenidos principales de la parte teórica de la asignatura se recogen en los módulos didácticos que se detallan a continuación:

  • Introducción a las bases de datos analíticas. Introduce los almacenes de datos o data warehouse (DW) en comparación con las bases de datos relacionales. Los sitúa en el centro de la factoría de la información corporativa (FIC), junto a los demás componentes que la forman (almacén de datos departamental, corporativo, operacional, el componente de integración y transformación de datos, las estructuras multidimensionales y los metadatos), de forma que se pueda tener una primera vista de la arquitectura lógica de las bases de datos analíticas. También resalta, en este contexto, la importancia de los datos, de su gestión y de su correcta explotación, así como la administración del sistema de data warehouse. Presenta también las tendencias actuales.
  • La construcción de la  factoría de la información corporativa. Se definen las distintas estrategias de construcción de un sistema de data warehouse, los pasos a seguir para la construcción de los almacenes de datos y el componente de transformación e integración de la FIC. Así mismo se presentan los perfiles que intervienen en el desarrollo y gestión de la FIC.
  • Diseño multidimensional y explotación de datos. Tras una introducción a las necesidades de los analistas de datos y las herramientas OLAP, se presenta el modelo multidimensional. Se explica cómo construir un modelo multidimensional, cada una de las etapas del proceso de diseño (conceptual, lógico y físico) para conseguir una implementación del cubo en un sistema relacional. También se describen algunas operaciones propias del modelo multidimensional que pueden ser ejecutadas en SQL estándar. Finalmente, se aborda la explotación de los datos, desde la necesidad de una adecuada presentación de los mismos, pasando por los distintos formatos de presentación y las herramientas de apoyo.

Los contenidos complementarios de la parte teórica de la asignatura se recogen en los siguientes módulos didácticos:

  • Los datos en la factoría de la información corporativa. En este módulo se abordan cuestiones como la calidad de los datos, la gestión de los datos maestros, gestión de los metadatos y el gobierno del dato. También se tratan los aspectos relacionados con la legalidad y la ética en el tratamiento de dato.
  • Administración de la FIC. Una vez construido el data warehouse y la FIC, hay que explotarlo y mantenerlo, de aquí la importancia de la administración de sistemas de datawarehousing. Se presenta el ciclo de vida del data warehouse, desde las primeras etapas de planificación y diseño; pasando por su puesta en marcha y crecimiento; llegando hasta las fases de monitorización, mantenimiento y optimización. También se presentan las figuras concretas encargadas de llevar a cabo conjuntos de tareas especializadas, que las organizaciones deben contemplar para asegurar el buen funcionamiento del sistema.
Para reforzar los contenidos estudiados en los módulos didácticos y conseguir que sean más fácilmente aplicables a la práctica, se ofrece al estudiantado un material teórico-práctico basado en un caso concreto. Su objetivo es acercar la teoría a la práctica y por eso se plantean una serie de retos que, a medida que se van logrando, permiten destacar la aplicación de los conceptos teóricos más importantes estudiados en el caso de estudio en cuestión; hecho que facilita la comprensión del proceso de creación del modelo multidimensional y su posterior explotación de datos.

Amunt

Espacio de recursos de ciencia de datos Web
Procesar una dimensión con Visual Studio Audiovisual
Reto 2. La arquitectura de la FIC, importa y mucho PDF
Reto 4. Los ETL son procesos clave en los sistemas analíticos PDF
Reto 3. Dimensión vs. hecho: ¿cuál es la diferencia? PDF
Reto 5. ¡Y por fin llega la magia! Cubos multidimensionales PDF
Reto 1. Las bases de datos analíticas: de los datos al conocimiento PDF
Material teórico-práctico: Caso de uso. Actividad volcánica mundial PDF

Amunt

A parte de los módulos didácticos previamente mencionados, la asignatura dispone de material teórico-práctico que facilita el estudio de los módulos didácticos y la puesta en práctica de los conocimientos mediante la resolución de una serie de retos relativos a caso práctico dado.

También se dispone de materiales de muestra de cursos anteriores (caso práctico completo de muestra ) recursos de soporte (documentos y vídeos) que se publican junto a las actividades de evaluación del curso o en su defecto en el espacio Contenidos del aula. El caso práctico de ejemplo no se debe interpretar como un tutorial o guía paso a paso para realizar la PR,se facilita únicamente a modo de ejemplo.

Destacamos por su importancia 2 documentos que hay que leer con atención para el correcto desarrollo de las prácticas:

  • Entorno_Virtual_VDI.pdf: como guía de configuración y conexión.
  • Importar_base_de_datos_como_crear_vistas_y_cubos.pdf:  con indicaciones sobre cómo proceder en la creación de cubos.

Estos materiales se pueden encontrar junto a las actividades de evaluación que requieren de ellos (PEC1 y PRA3) para su realización. 

Así mismo, dado el carácter práctico de la asignatura se proporciona un entorno de prácticas previamente configurado para la realización de las actividades prácticas del curso.

En la parte servidor:

  • Sistema operativo: Windows Server 2016
  • Base de datos: Windows SQL  Server 2016 (SGBD  +  SQL Server Analysis Services   + SQL Server Reporting Services)

Y en la parte cliente:

  • SQL Server Management Studio 2017
  • Visual Studio 2017
  • SQL Server Data Tools
  • Report Designer Pentaho
  • Power BI Desktop
  • Pentaho Data Integration v.9.2

Y para ofrecer soporte técnico en este entorno y resolver las incidencias que puedan suceder con el uso del entorno VDI o del software instalado, dispondréis de un profesor/a en el aula de laboratorio, M2.885.- Laboratorio de soporte al entorno VDI. Dado que esta aula será diferente del aula de teoría, deberéis consultar frecuentemente las dos aulas.

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt