Fundamentos de Big Data Código:  B0.476    Créditos:  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Desde el inicio mismo de la digitalización masiva de todo tipo de contenidos y servicios, las empresas y administraciones han sido conscientes del potencial de todos esos datos almacenados. Ha sido solo recientemente, no obstante, que existe la posibilidad de gestionar y analizar dichas cantidades ingentes de datos, especialmente teniendo en cuenta el volumen generado por la interacción con los usuarios finales de dichos contenidos y servicios. La capacidad de cálculo de los ordenadores actuales, unida a la posibilidad de disponer de datos almacenados en la nube (incluyendo tambien su análsis posterior) permiten hacer frente a las necesidades de una inteligencia de negocio basada en Big Data.

Lo que se conoce como Big Data es, básicamente, el resultado de disponer de muchos datos (en forma de variables o indicadores) de muchas muestras (individuos, sensores, etc.) a lo largo de mucho tiempo (con mayor o menor frecuencia). Esta tripleta de factores puede generar volúmenes de datos tan fuera de escala como los casi 30 petabytes diarios que procesa Google, por ejemplo.

Sin tener que llegar a semejante escala, las empresas y administraciones, pero tambien los usuarios finales, han empezado a plantearse la necesidad de extraer información y conocimiento de los datos recogidos y almacenados durante años, con el objetivo de comprender mejor una realidad que, por primera vez, puede tratarse a una escala cercana al 1:1, superando los límites del muestreo y accediendo a (casi) toda la población relacionada con un escenario. Por ejemplo, vendedores de contenidos audiovisuales pueden hacer recomendaciones basándose en el historial de miles de clientes con perfiles e intereses similares. O las administraciones pueden hacer un mejor uso del espacio público ajustando las tarifas del párquing en función de la oferta y la demanda en cada momento. 

Desde la generación de los datos (o de su captura si se trata de una fuente externa) y su procesado hasta su utilización en forma de conocimiento válido, es necesario gestionar todo su ciclo de vida, teniendo en cuenta aspectos tecnológicos pero tambien legales y éticos que surgen del hecho de trabajar con datos que, principalmente, provienen de los usuarios de los servicios siendo analizados. Es necesario plantearse (y responder) preguntas relativas a:

  • ¿Cómo se generan y almacenan los datos provenientes de diferentes fuentes, internas o externas a la organización?
  • ¿Qué herramientas existen para su gestión, incluyendo también su posterior análisis y visualización?
  • ¿Qué sectores productivos están usando o pueden beneficiarse del uso de estrategias basadas en el análisis de los datos recogidos?
  • ¿Qué aspectos relacionados con la privacidad, seguridad, calidad y otros es necesario tener en cuenta para realizar una gestión adecuada de los datos?

A través de material teórico y casos prácticos, el contenido de esta asignatura se centra en plantear y responder estas preguntas y otras relacionadas con el uso de Big Data en un entorno de inteligencia de negocio.

Amunt

Esta asignatura, en el contexto del Programa de Business Intelligence, forma parte de la especialidad de Fundamentos de inteligencia de negocio y big data. En dicha especialidad se trabaja lo que algunos analistas han llamado "la gestión extrema de la información", o sea la transformación del enorme volumen de datos oculto en la propia organización o presente a su alrededor en información y conocimiento útil para el negocio. Esta especialidad incluye, además de la asignatura objeto de este plan docente, las siguientes asignaturas:

  • Fundamentos de inteligencia de negocio

    En esta asignatura el estudiante se familiariza con un sistema completo de inteligencia de negocio (la "fábrica de información") y con sus diferentes componentes: el almacén de datos, los procesos de extracción y transformación, el análisis multidimensional y la realización de informes y cuadros de mando.

    La asignatura proporciona también una información y formación práctica sobre el mercado, las tendencias y los fabricantes de sistemas de información de BI.

    El estudiante trabaja con herramientas Pentaho (Enterprise Edition) y MySQL en una plataforma virtual en la nube y con las bases de conocimiento de la consultora Gartner y otras empresas de prospectiva.

  • Gestión de proyectos de BI 

    En esta asignatura el estudiante se familiariza a través de un caso práctico y de contenidos teóricos con el modelo internacional de referencia en gestión de proyectos (PMBoK) y con los métodos específicos de producción de proyectos de inteligencia de negocio.

    El estudiante trabaja con herramientas de gestión de proyectos (MSProject y equivalentes) y con herramientas de ofimática (tipo XLS y PPT).

  • Pensamiento analítico en la empresa

    El pensamiento analítico representa un cambio en la manera de tomar decisiones y en la cultura de la empresa. En esta asignatura se trabajan las herramientas, el vocabulario y las metodologías básicas para analizar una situación de negocio y de forma sistemática traducirlo en un proyecto de datos.

    Actúa también como asignatura niveladora para estudiantes que no han recibido anteriormente una formación sobre la arquitectura y componentes de los sistemas de información de empresa (ERP, CRM, SCM, etc.)

Amunt

Todos los sectores profesionales basan la toma de decisiones en datos, información, conocimiento. Esta información existe en múltiples formas aunque esta información no esté almacenada en una base de datos.

Por ejemplo, un trabajador del campo utiliza el conocimiento adquirido para saber cuándo debe plantar, regar y sembrar. Este conocimiento no es más que el resultado de las observaciones a lo largo de siglos y de su transmisión a través de generaciones. Es decir, es el resultado de un análisis de datos masivos.

Basándonos en este ejemplo, vemos que esta asignatura tiene una gran utilidad en todos los sectores profesionales, ya que Big Data trabaja a partir de datos masivos y éstos pueden estar presentes en todos los niveles de decisión (operacional, táctico y estratégico) de las organizaciones de todos los sectores productivos.

Otro ejemplo es la F1: La telemetría durante una carrera permite dar indicaciones al piloto sobre cómo pilotar para obtener los mejores resultados en carrera (operacional), durante los entrenamientos permite elegir la mejor configuración del coche para la situación concreta de carrera (táctico), y todos los datos recopilados durante la pretemporada y la temporada permiten modificar componentes del coche (chasis, escapes de aire, suspensiones, etc.) para obtener una máquina mejor (estratégico).

El análisis de datos masivos es uno de los campos que más están potenciando las empresas y tiene un largo recorrido por delante. Así, después de cursar esta asignatura, el estudiante será capaz de ver oportunidades de uso del análisis de datos masivos donde inicialmente no los veía.

Amunt

El curso requiere que los estudiantes tengan la capacidad de leer y comprender el idioma inglés puesto que una parte importante de los recursos utilizados están en dicho idioma.

Para realizar algunos de los ejercicios prácticos optativos relacionados con la manipulación de grandes conjuntos de datos, es necesario un cierto conocimiento  de algún lenguaje de programación de alto nivel, como puede ser R o Python. Se proporcionarán materiales para poder alcanzar un nivel mínimo para aquellos estudiantes que desconozcan dicho entorno.

Amunt

Los objetivos que se desea que el estudiante alcance mediante esta asignatura son los siguientes:

  • Entender los conceptos básicos y las definiciones formales asociadas a los conceptos de Big Data y afines.
  • Identificar los elementos necesarios en cualquier escenario de BI basado en el uso de Big Data.
  • Acotar los riesgos (tecnológicos, legales y éticos) asociados al uso de Big Data por parte de una organización.
  • Describir, desde una perspectiva general, las oportunidades del uso de Big Data en una organización.
  • Conocer las metodologias y herramientas más adecuadas para la implementación de sistemas de Big Data.
  • Comprender y analizar algunas de las múltiples opciones disponibles para resolver problemas asociados a la gestión de Big Data dentro de una organización.
  • Construir modelos que expliquen y describan el conocimiento generado como resultado de una implementación basada en Big Data.

Amunt

El contenido que se trabaja en esta asignatura se estructura de la siguiente manera, siguiendo aproximadamente un orden cronológico para su utilización prevista:

Módulo 1: Introducción al Big Data

Módulo 2: Tecnologías de Big Data

Módulo 3: Herramientas de Big Data

Módulo 4: Ética en el contexto de Big Data y nuevas tendencias

Amunt

Material Soporte
Wiki Web
Espacio de recursos de ciencia de datos Web
Perspectiva histórica del procesamiento por lotes XML
Perspectiva histórica del procesamiento por lotes DAISY
Perspectiva histórica del procesamiento por lotes EPUB 2.0
Perspectiva histórica del procesamiento por lotes MOBIPOCKET
Perspectiva histórica del procesamiento por lotes HTML5
Perspectiva histórica del procesamiento por lotes PDF
Introducción al entorno de trabajo, introducción a Hadoop y Spark (HDFS_PEC1) Audiovisual
Introducción al entorno de trabajo, introducción a Hadoop y Spark (SPARK_OPS_PEC1) Audiovisual

Amunt

Para entender el enfoque metodológico general se recomienda la lectura del apartado anterior sobre materiales y herramientas de soporte, y el siguiente respecto el modelo de evaluación.

Además de lo que se ha explicado anteriormente, el consultor recordará al comienzo de cada semana los objetivos y competencias a desarrollar, así como los modelos de aprendizaje y de evaluación para cada parte cuando proceda. Del mismo modo, propondrá algunos debates, estando integrados dentro de algunas de las actividades de evaluaciones o de forma independiente. La participación en la discusión generada en dichos debates es obligatoria. También se recomienda el seguimiento y participación en todas las discusiones y preguntas publicadas en el foro del aula.

Más concretamente, recomendamos el siguiente ciclo de estudios:

  • Leer y estudiar cuidadosamente cada módulo de aprendizaje y/o lectura recomendada.
  • Participar en el foro, iniciar debates formales o publicar informalmente mensajes y opiniones. El método de enseñanza promueve la colaboración entre los miembros del grupo. El consultor y el profesor responsable pueden participar excepcionalmente o para cerrar el debate en partes o en su totalidad.
  • Comenzar a preparar las pruebas y/o actividades con antelación. Se requerirá la consulta de diferentes materiales y, por lo general, no tienen una solución única. Justificar y argumentar la solución o las soluciones propuestas es más importante para la evaluación que tener una respuesta correcta.

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

Este curso se evalúa únicamente a través de la evaluación continua porque no hay examen final presencial. Todas las actividades tanto teóricas como prácticas, los casos prácticos y la participación en las discusiones en el foro virtual son obligatorios.

La evaluación continua consta de diversas actividades que tienen como objetivo combinar el aprendizaje y la reflexión, desde un punto de vista tecnológico, sobre los fundamentos de la gestión de grandes datos, su ciclo de vida en la empresa (desde el reconocimiento de problemas hasta el análisis de la información producida) y las diferentes modalidades para su implantación, sea ésta integrada con los sistemas corporativos o por separado.

En estas actividades, las habilidades anteriormente descritas entran en juego. La evaluación continua presenta:

  • Un (1) debate con tres temas al inicio de curso. La participación en calidad y cantidad en dichos debates influye en la calificación final del semestre.
  • Tres (3) test auto-corregidos en la plataforma Moodle referente a los materiales teóricos de la asignatura.
  • Cinco (5) pruebas de evaluación continua (PEC), con el objetivo de evaluar los conocimientos y la reflexión sobre las experiencias profesionales.
NOTA: La nota de las actividades que se entreguen con fecha posterior al límite será como máximo del 70% de la nota correspondiente cada una de las actividades. Descontando un 10% de la nota por día de retraso, hasta llegar al mínimo del 70% citado anteriormente.

Advertencia: Es importante mencionar que la resolución de las pruebas, casos y prácticas propuestas se debe realizar de forma individual excepto cuando se indique lo contrario. El equipo docente tendrá en cuenta la lógica de las respuestas, el pensamiento individual y la capacidad de expresarse por escrito. Cualquier fuente externa usada para resolver las cuestiones y casos deberá indicarse claramente y ser referenciada adecuadamente. Si no fuera el caso, las actividades se evaluarán con una D. Por otro lado, siempre a criterio de la Universidad, el incumplimiento de esta obligación será comunicada a la gestión de los estudios, con el fin de evaluar si el estudiante está autorizado para aprobar cualquier otra materia o mediante una evaluación continua en el semestre o el siguiente.

Sistema de calificación

Cada actividad (PEC) tendrá una nota individual cualitativa: A, B, C+, C- o D.

La nota de la evaluación continua, que es un promedio de cada una de las actividades por módulo, será cualitativa y cuantitativa (sin decimales): A = 9/10 o B = 7/8 o C + = 5/6 o C- = 3/4 o D = 0/1/2 o no presentado (NP) = 0.

La calificación final será cuantitativa con un decimal.

Criterio de evaluación general basado en evidencia

APROBADO

  • Ha estudiado, entendido el caso y resuelto los problemas.
  • Ha leído la teoría y la ha aplicado correctamente. Proporciona evidencia de dicho conocimiento y actividad.
  • Se presentan correctamente las actividades y las participaciones sin faltas de ortografía y/o escritura.

NOTABLE

  • Todas las anteriores.
  • Conoce el tema, es capaz de vincularlo con otras materias y sacar conclusiones.
  • Aplica la teoría y la experiencia práctica en el contexto de su trabajo y/o de la vida real.
  • Buena presentación y calidad en la escritura.

EXCELENTE

  • Todas las anteriores.
  • Realiza aportaciones y proporciona nuevas soluciones creativas e innovadoras.
  • Muestra evidencia rigurosa y crítica.

Además de estos criterios generales usados a lo largo del semestre, pueden añadirse otros criterios específicos para evaluar algunas de las habilidades generales o particulares. Éstos serán informados, si procede, en el enunciado de las actividades.

Recuperación de las Pruebas de Evaluación Continua (PEC) 

  • No existe una PEC de recuperación final. Las actividades se recuperan de forma individual.
  • La nota de las actividades que se entreguen con fecha posterior al límite será como máximo del 70% de la nota correspondiente cada una de las actividades. Descontando un 10% de la nota por día de retraso, hasta llegar al mínimo del 70% citado anteriormente. 
  • Cualquier actividad entregada fuera de plazo (más allá de las 23:59 de la fecha límite propuesta) se considerará una entrega de recuperación.
  • La recuperación de las actividades no entregadas dentro de su fecha podrá entregarse a lo largo del semestre con las limitaciones sobre la nota citadas en los puntos anteriores. 
  • Puede optar a la recuperación cualquier estudiante que: (1) no haya presentado la actividad dentro del plazo de entrega definido o (2) tenga una nota inferior a 5. Es decir, cualquier estudiante que tenga una nota de C-, D o NP en esta actividad.
  • Sólo es posible realizar una única entrega de recuperación, como máximo, de cada una de las actividades propuestas durante el curso y se corregirá dentro de las dos últimas semanas del semestre en curso. Consecuentemente la nota también se dará dentro de estas fechas.  

NOTA: Los profesores se guardan el derecho de realizar entrevistas personales a los estudiantes para ajustar la nota fina de cada actividad a los conocimientos aprendidos. 



Amunt

Esta asignatura únicamente se puede superar a través de la realización y entrega de un mínimo de 3 de las PEC propuestas a lo largo del semestre.

La ponderación de la nota final de evaluación continua (EC) se obtiene de la siguiente forma:

  • 6% debate (2% por tema) + 9% test de teoría (3% por test) + 15% PEC1 + 30% PEC2 + 20% PEC3 + 10% PEC4 + 10% PEC5

Además, es importante destacar:

  • Aquellos estudiantes que únicamente hayan entregado una PEC tendrán como nota final de evaluación continuada un suspenso.
  • Las PEC entregadas que no incluyan al menos un 25% de los ejercicios propuestos resueltos serán consideradas como no presentadas.
  • Las PEC no presentadas computan como 0 en el cálculo ponderado de la nota final de EC.

Por otra parte, a lo largo del semestre, el consultor puede proponer discusiones o debates formales. La participación en calidad y cantidad en dichos debates tambien puede influir en la calificación final del semestre.

Amunt

A lo largo del semestre, el consultor os proporcionará retorno de vuestro progreso a través de diferentes medios:

  • Publicación de las soluciones de las actividades teóricas y prácticas al final del semestre. Cuando una prueba no tenga una solución única, se publicarán aquellas indicaciones que puedan ayudar a entender como evaluar una solución.
  • Publicación de las actividades destacadas de algunos estudiantes, en parte o en su totalidad.
  • Comunicación individual a aquellos estudiantes en riesgo de no superar el curso, según su evolución.

En todo caso, podéis solicitar al consultor un retorno individual, tanto de vuestra evolución dentro del semestre, como de cada prueba individual. Por el hecho de ser una evaluación mayoritariamente individual y continuada, se recomienda hacer esta petición después de cada prueba sobre la que tengáis dudas o necesidades de aclaración y no esperar a las calificaciones medias o finales.

También es posible ponerse en contacto con el profesor responsable del curso académico, si los comentarios y sugerencias recibidos por parte del consultor no son satisfactorios o no se está de acuerdo con ellos.

Amunt