El ciclo de la vida del dato
© de esta edición, Fundació Universitat Oberta de Catalunya (FUOC)
Av. Tibidabo, 39-43, 08035 Barcelona
Autoría: Marcos Pérez González
Producción: FUOC
Todos los derechos reservados

Índice
- Introducción
- Objetivos
- 1.El dato como activo de valor para la organización
- 2.El ciclo de vida de los datos
- 3.Gobierno del dato
- 4.Componentes y madurez de data governance
- 4.1.Componentes
- 4.1.1.Normas, estándares y estrategia
- 4.1.2.Calidad del dato
- 4.1.3.Gestión de datos maestros
- 4.1.4.Gestión de la seguridad del dato
- 4.1.5.Madurez
- 4.2.Modelo de madurez data governance
- 4.3.¿Qué modelo de madurez usar?
- 4.1.Componentes
- Resumen
- Glosario
- Bibliografía
Introducción
Objetivos
-
Desarrolladores y consultores que quieren conocer qué significa gobierno del dato o data governance.
-
Desarrolladores y consultores que quieren ayudar al diseño e implementación de estrategias de negocio que incluyan gobierno del dato.
-
Gestores que están interesados en la transformación digital de su organización y en la inclusión de gobierno del dato como uno de sus pilares fundamentales.
-
Entender el concepto de data governance, las situaciones en las que es necesario desplegar una solución de este tipo y las ventajas que proporciona.
-
Conocer el ciclo de vida del dato y las necesidades en cada una de las fases del ciclo.
-
Enumerar y dar a conocer las diferentes componentes del gobierno del dato.
-
Conocer qué significan las diferentes etapas de madurez en el gobierno del dato y cómo analizar la madurez de la propia organización.
-
Conocimientos básicos sobre business intelligence y big data.
-
Conocimientos sobre estrategia y gestión de las tecnologías de la información (TI).
1.El dato como activo de valor para la organización
1.1.Estrategias competitivas basadas en activos
-
Liderazgo en coste: La organización es capaz de producir un producto o proporcionar un servicio a menor coste que sus competidores.
-
Diferenciación: La organización es capaz de ofrecer un servicio o producto superior a los clientes. La diferenciación, frecuentemente, es el resultado de optimizar la cadena de valor del mercado en el que se opera o de realizar cambios en el alcance competitivo.

-
Duración, es decir, a la velocidad de que un recurso se deprecia o se convierte en obsoleto.
-
Transparencia, es decir, a menor transparencia en el recurso, menor capacidad que sea imitado por un competidor.
-
Transferencia, es decir, a menor capacidad de transferencia de recursos –por ejemplo, no se pueden adquirir–, menor capacidad de que se sea imitado por un competidor.
-
Replicación, es decir, a mayor complejidad de procesos y capacidades organizacionales, mayor será la dificultad de replicación.
1.2.El dato como activo de valor
-
Los datos frecuentemente tienen una naturaleza transitoria, es decir, están ligados a un tiempo y un momento. Por ejemplo, los valores bursátiles como activo solo tienen sentido si son capturados y analizados de forma continua. Esto es muy diverso: por ejemplo, un edificio cuyo valor presenta una duración más amplia.
-
El dato requiere un mantenimiento continuo, es decir, es necesario manipular para mantener o incluso incrementar su valor.
-
El dato puede reusarse, es decir, a diferencia de otros activos que con el uso se desgastan (por ejemplo, una pelota), el dato tiene la posibilidad de ser usado en diferentes escenarios a un coste marginal.
-
El dato tiene un gran potencial como activo, puesto que tiene una baja o nula transparencia, transferencia y replicación, y una larga duración.
-
Asegurar un cuidado y una administración apropiados de los activos de datos.
-
Incentivar el uso de estos activos de forma eficiente.
-
Potenciar la búsqueda de rentabilidad sobre estos activos, y clasificarlos en función de su rentabilidad.
2.El ciclo de vida de los datos
2.1.¿Qué es el ciclo de vida de un activo?
-
Idea inicial y estudios preliminares (del proyecto).
-
Evaluación del proyecto respecto de diferentes perspectivas, como viabilidad técnica o económica.
-
Definición y planeamiento de las etapas del proyecto y en cuáles de ellas el activo es relevante.
-
Detalle del proyecto y diseño de los procesos.
-
Ejecución del proyecto de acuerdo a la planificación.
-
Puesta en marcha, prueba de todas las instalaciones y aceptación de las mismas.
-
Operación de las instalaciones, uso o consumo de los bienes o servicios.
-
Evaluación del proyecto para identificar siguientes mejoras o cambios.
-
Descarte, reciclaje o venta de la instalación.
2.2.¿Cómo medir el valor del dato?
-
Uso del activo, en cuyo caso hablamos de valor en uso.
-
Venta del activo, en cuyo caso hablamos de valor de intercambio.
-
Fundamentado en el coste: el valor del activo está basado en el precio pagado para adquirir el activo. Por ejemplo, el coste que tiene capturar, procesar, almacenar y analizar los datos del cliente para su segmentación.
-
Fundamentado en el mercado: el valor del activo se fundamenta en el precio que está dispuesto a pagar un tercero por adquirirlo. Por ejemplo, cuando se compra una base de datos de empresas a Crunchbase (3) .
-
Fundamentado en la utilidad: el valor del activo está basado en el valor actual de los beneficios esperados futuros. Por ejemplo, cuando hemos medido que la segmentación de clientes a partir de sus comportamientos nos permitirá aumentar las ventas en un tres por ciento.
-
Valor intrínseco (Intrinsic Value Indicator): evalúa el grado de corrección del dato y si es completo. Se calcula mediante:
donde:
-
Validez es el porcentaje de registros considerados correctos.
-
Completitud es el porcentaje del total de registros respecto del universo de potencial o supuesto de registros.
-
Escasez es el porcentaje de su mercado o competidores que también, probablemente, tienen estos mismos datos.
-
Ciclo de vida es la utilidad razonable utilizable de cualquier unidad (registro) del activo de información (por ejemplo, en meses).
-
-
Valor de negocio (Business Value Indicator): evalúa si el dato es relevante para un propósito específico. Se calcula mediante:
donde:
-
Relevancia es cuán útil puede ser la información (o es) para uno o más procesos de negocio (0 a 1).
-
Validez es el porcentaje de registros considerados correctos.
-
Completitud es el porcentaje del total de registros respecto del universo de potencial o supuesto de registros.
-
Oportunidad es con qué rapidez se capturan las instancias nuevas o actualizadas de los datos y se pueden acceder a ellas.
-
-
Valor de rendimiento (Performance Value Indicator): evalúa cómo afecta el dato a los factores clave del negocio. Se calcula mediante:
donde:
-
i es el número de instancias de proceso de negocio que utilizan el recurso de información (grupo informado).
-
c es instancias de proceso empresarial que no utilizan la información (grupo de control).
-
T es el promedio de vida útil de cualquier instancia de datos.
-
t es la duración durante la cual se midió el KPI.
-
-
Valor del coste (Cost Value Indicator): evalúa el coste asociado a la pérdida del dato. Se calcula mediante:
donde:
-
Coste proceso es el coste anual de los procesos que permiten capturar el dato.
-
% Atribuible es el porcentaje atribuible a la captura del dato.
-
T es el promedio de vida útil de cualquier instancia de datos.
-
t es la duración del periodo sobre la que se mide el coste del proceso.
-
n es el número de periodos de tiempo hasta que es necesario volver a adquirir o la continuidad de negocio ya no está afectada por la pérdida de información.
-
-
Valor del mercado (Market Value Indicator): evalúa el beneficio que se podría obtener al vender o intercambiar el dato. Se calcula mediante:
-
Valor económico (Economic Value Indicator): evalúa cómo el dato contribuye al resultado final. Se calcula mediante:
donde:
-
Ingresos i son los ingresos generados con el data como activo.
-
Ingresos c son los ingresos generados sin el data como activo.
-
T es el promedio de vida útil de cualquier instancia de datos.
-
t es la duración del experimento.
-
2.3.Fases del ciclo de vida del dato

-
Fase 1. Captura del dato Esta fase puede considerarse como el acto de crear datos que no existen aún en la organización y que nunca han existido en ella. Existen diversos métodos para la captura de datos, entre los que destacan:
-
Adquisición de datos: la ingesta de datos que han sido creados y existen fuera de la organización.
-
Introducción de datos: la creación de nuevos datos en la organización por personal humano o generados mediante dispositivos dentro de la propia organización.
-
Recepción de señales: la captura de datos creados por dispositivos, normalmente en sistemas de control, pero cada vez más importantes para los sistemas de información, como el internet de las cosas.
Los tres métodos identificados conllevan importantes retos asociados. Por ejemplo, la adquisición de datos suele implicar la creación de contratos o normas que definen el modo en que la organización puede usar los datos que obtenga del exterior. La introducción de datos implica una detallada gestión de la seguridad del dato dentro de la organización, esto es, quién tiene permisos para crear o modificar datos en la organización. Por último, un reto asociado a la recepción de señales es cómo captar y procesar esos datos, los cuales pueden ser de cualquier naturaleza y tamaño, como por ejemplo, los datos generados en tiempo real por los sensores de control en los yacimientos petrolíferos.
-
-
Fase 2. Mantenimiento del dato. El objetivo de esta fase es procesar el dato, pero sin que se genere aún un valor claro para la organización. Este procesamiento incluye tareas de integración, limpieza y enriquecimiento, así como procesos de extracción, transformación y carga del dato (conocidos en inglés como ETL: Extract, Transform, and Load). Debido a la diversidad de actividades en esta fase, existen numerosos retos asociados, como por ejemplo cómo mejorar el proceso de envío del dato al destino final para su síntesis y uso, previniendo que se genere un elevado número de movimientos de datos durante todo el procesamiento de inicio a fin.
-
Fase 3. Síntesis del dato. Esta fase consiste en la creación de datos de valor aplicando un procesamiento o lógica inductiva determinada, usando otros datos como fuente. Esta es el área del procesamiento analítico donde se usa el modelado de datos, como por ejemplo el modelo de riesgos de una organización. La lógica inductiva requiere de algún tipo de experiencia o conocimiento como parte de la lógica de negocio, como por ejemplo la forma en la que se crean los informes de créditos bancarios. Sin embargo, la lógica deductiva no formaría parte de esta fase, quedando relegada a la fase anterior, como por ejemplo, crear un nuevo valor aplicando una ecuación simple:
-
Fase 4. Uso del dato. Una vez que el dato ha sido capturado y transformado dentro de la organización y se ha usado como fuente en la fase anterior, el dato se usa para beneficio de la propia organización en tareas que la organización utiliza y gestiona. Aunque normalmente se trata de tareas que no pertenecen al ciclo de la vida del dato, el dato cada vez más es considerado con un activo fundamental en los modelos de negocios de muchas organizaciones. En esta fase también existen retos importantes, como por ejemplo el uso permitido del dato, o lo que es lo mismo, si es legal o no el uso del dato de la manera en la que los usuarios de negocio pretenden usarlo.
-
Fase 5. Publicación del dato. Esta fase puede ser definida como el envío del dato. Este envío puede ser interno (a una intranet) o externo (a un lugar fuera de la organización gestionado por terceros). Un ejemplo es una agencia de inversión que envía informes mensuales a sus clientes. Una vez que el dato ha sido enviado fuera de la organización, es imposible recuperarlo para una posterior modificación. El gobierno del dato ayuda a decidir cómo actuar con los datos incorrectos o incompletos que han sido enviados fuera de la organización. Los accesos no autorizados a los datos también estarían recogidos en esta fase.
-
Fase 6. Archivado de datos. Esta fase consiste en copiar los datos en un entorno donde son almacenados, en caso de que se vuelvan a necesitar en el futuro en un entorno activo de producción, y la completa eliminación de esos datos en todos los entornos activos. Un archivo de datos es simplemente un almacenamiento de datos, pero no de mantenimiento, uso o publicación de datos. En caso necesario, los datos pueden ser recuperados en un entorno donde se pueden realizar cualquiera de estas actividades.
-
Fase 7. Eliminación del dato. Esta es la fase final del ciclo de vida del dato y consiste en la destrucción de cualquier copia del dato que exista dentro de la organización. Idealmente este proceso será llevado a cabo mediante un archivado de datos. Un reto en esta fase sería verificar que la eliminación se ha llevado a cabo de manera satisfactoria.
2.4.¿Cómo es posible detectar los cambios en un dato?
-
Resolución de errores o conflictos: en la creación de informes la trazabilidad del dato habilita conocer cómo se han construido las métricas que se incluyen, qué transformaciones se han hecho y de dónde provienen.
-
Análisis del impacto: en el desarrollo y evolución de sistemas de información, el linaje del dato habilita comprender de antemano qué sucederá con el dato y qué medidas se deben tener en cuenta.
-
Informes de conformidad: en ciertos sectores, se han impuesto regulaciones y normas para una mayor transparencia. Data lineage habilita reducir los errores humanos y reducir las brechas en la conformidad para con la normativa vigente.
3.Gobierno del dato
3.1.Orígenes de data governance
3.2.Definición de data governance
-
Según The MDM Institute (7) , es la coordinación formal de personas, procesos y tecnología que permite a una organización utilizar los datos como un activo de empresa.
-
Según The Data Governance Institute (8) , es un sistema de decisiones y responsabili dades sobre procesos de información, ejecutados de acuerdo a modelos preestablecidos que describen quién puede tomar qué decisiones, usando qué información y cuándo, bajo qué circunstancias, usando qué métodos.
-
Según KiK Consulting (9) , es la ejecución y aplicación de autoridad sobre la gestión de activos del dato y el rendimiento de las funciones del dato.
-
Según IBM Data Governance Council (10) , es una disciplina de control de calidad para asesorar, gestionar, utilizar, mejorar, monitorizar y proteger información de la organización.
-
Según Sunil Soares, experto en data governance, es la elaboración de normas para optimizar, proteger y hacer uso de la información como un activo de empresa mediante el alineamiento de objetivos de múltiples funciones.
3.3.Objetivos de data governance
-
Accesible, lo que significa que:
-
El usuario puede acceder a los datos que necesita y estos están disponibles.
-
El formato del dato coincide con el que el usuario demanda.
-
-
Seguro, lo que significa que:
-
Solo pueden acceder al dato los usuarios autorizados.
-
Se impide el acceso al dato a los usuarios no autorizados.
-
-
Consistente, lo que significa que:
-
La información es la misma cuando diversos usuarios acceden al mismo dato.
-
-
Alta calidad, lo que significa que:
-
El dato es riguroso y certero.
-
Cumple con los estándares preestablecidos.
-
-
Auditable, lo que significa que:
-
La trazabilidad del dato es clara.
-
El departamento de IT sabe quién usa el dato y para qué propósitos.
-
-
Definir, validar y comunicar las estrategias del dato, normas, estándares, arquitectura, procedimientos y métricas.
-
Monitorizar las políticas del dato, estándares, arquitectura y procedimientos.
-
Patrocinar y supervisar la entrega de proyectos de gestión de dato y servicios.
-
Gestionar y resolver conflictos relacionados.
-
Entender y promocionar el valor del activo del dato.
-
Estrategia. Desarrollar una estrategia, es decir, decidir qué datos se van a gestionar, identificar los datos maestros. Determinar el valor del dato basado en el coste de la captura, mantenimiento, valor de negocio, riesgo de pérdida o certeza del dato.
-
Comisión. Establecer una comisión de las líneas de negocio que están en la posición de entender el dato, entender el negocio y ser capaces de tomar una decisión.
-
Normas. Establecer un conjunto de normas para definir la integridad de datos, calidad, seguridad y utilización del dato.
-
Estándares. Establecer un conjunto de estándares para controlar la implementación de las normas, modelado de datos, herramientas, tecnologías y metodologías.
-
Procedimientos. Definir procedimientos para tratar conflictos de calidad del dato y de seguridad.
-
Conflictos. Gestionar los conflictos y su resolución.
-
Supervisión. Ofrecer una supervisión continuada de la gestión del proyecto.
-
Incumplimiento. Establecer un conjunto de penalizaciones por incumplimiento de los estándares y procedimientos.
-
Documentación. Proporcionar documentación relativa al dato y requisitos de metadatos.
Dimensión |
Gobierno del dato |
Gestión del dato |
---|---|---|
Alcance |
Toma de decisiones, monitorizado y ejecución que tiene autoridad en la gestión del dato de una organización |
Control de la arquitectura de datos, calidad, seguridad, normas, prácticas y procedimientos |
Función |
Decidir qué hacer con el dato y asegurar que se haga lo decidido |
Implementar las arquitecturas, procesos, herramientas y normas para alcanzar los objetivos del gobierno del dato |
3.4.Fases de data governance
2) Preparación y hoja de ruta
3) Planificación y financiación
4) Diseño
5) Implementación
6) Gobierno
7) Monitorización, medición, creación de informes

-
El mensaje del valor del programa debe ser claro.
-
Debe existir una hoja de ruta que será compartida con las personas involucradas y que detalle los diversos aspectos, en particular, dar respuesta a las preguntas quién, qué, cuándo, dónde y por qué.
-
Integración del gobierno del dato con otras áreas. Dado que el gobierno del dato está relacionado con multitud de áreas dentro de la organización, será necesario contemplar las posibles relaciones en la hoja de ruta. Por ejemplo, integración del gobierno del dato con la gestión de datos maestros dentro de una organización.
-
Diseño de métricas y requisitos de informes. Necesario para validar lo que se está gestionando y recibir información para asegurar la continuidad del plan.
-
Definición de los requisitos de mantenimiento o gestión del cambio. Es necesario planificar los posibles cambios que puedan ocurrir para poder gestionarlos. Así, se identifican los posibles elementos que tienen lugar, durante una futura puesta en ejecución o lanzamiento del programa, y se determina cómo están coordinados entre sí.
-
Definición del lanzamiento del gobierno del dato. Se especifican los detalles relativos a la puesta en marcha del programa, incluyendo información sobre el personal relacionado que lo gestionará.
-
Determinación de los procedimientos o principios centrales. Esta actividad es imprescindible para el éxito del programa y consiste en identificar, documentar y aprobar los procedimientos clave que serán utilizados dentro de la organización para considerar el dato como un activo.
-
Determinación de los procesos estándar para el negocio. Durante esta etapa se dan los procesos genéricos que definen los objetivos del programa del gobierno del dato. Por ejemplo, cómo el negocio reacciona ante un proceso de identificación o detección de incidencias y las acciones que se llevan a cabo en el proceso para su resolución.
-
Determinación de las responsabilidades y el modelo de propiedad. Así pues, todos los procesos definidos previamente carecen de utilidad hasta que se ha definido quién hace qué, y los diferentes niveles de responsabilidad presentes.
-
Exposición del modelo de gobierno del dato al equipo ejecutivo del negocio. De esta manera se informa y educa al equipo de gestión de la organización sobre las diferentes responsabilidades y procesos.
-
Lanzamiento (en inglés, rollout) del gobierno del dato. Como su propio nombre indica, a partir de este momento la organización comienza a gobernar los datos. Al mismo tiempo, diferentes equipos dentro de la organización son educados y formados según lo acordado en la hoja de ruta y se publican diversos materiales creados durante el diseño del programa, tales como guías y normas.
-
Ejecución de cambios en el plan. En esta etapa se recoge toda la actividad relativa al soporte del gobierno del dato. Por ejemplo, se puede afirmar que, durante la ejecución del programa, diversos materiales, como las guías o materiales de formación, necesitarán una actualización. Asimismo, el nuevo personal necesitará de una nueva orientación sobre el programa implementado.
-
Diseño del marco organizativo. Esto es, determinar dónde y qué niveles del marco son los encargados de ejecutar, gestionar y ser responsables de manejar los activos de datos.
-
Identificación de roles y responsabilidades. Esta tarea, aunque parezca trivial, puede conllevar obstáculos dentro de la organización, como por ejemplo una percepción de dar poder sobre los datos a determinados usuarios que puede llevar a problemas internos dentro del marco organizativo, o el temor de perjudicar la productividad actual al añadir responsabilidades adicionales.
4.Componentes y madurez de data governance
4.1.Componentes

-
Arquitectura de datos (data architecture): Que consiste en las estructuras de almacenamiento y procesamiento del dato como parte de la arquitectura empresarial.
-
Diseño y modelos de datos (data modeling and design): Que consiste en la gestión, análisis, diseño, construcción, testeo y mantenimiento de los modelos de datos.
-
Almacenamiento de datos (database storage): Que consiste en la gestión de las infraestructuras físicas de almacenamiento de datos.
-
Seguridad de datos (data security): Que consiste en asegurar la privacidad, la confidencialidad y el acceso en los casos apropiados.
-
Datos maestros y de referencia (reference and master data): Que consiste en la identificación, mantenimiento, gestión, acceso y propagación de datos maestros y de referencia.
-
Inteligencia de negocio y almacenes de datos (data warehousing and business intelligence): Que consiste en la gestión de los procesos analíticos de la organización y del acceso de la forma correcta a la información para la toma de decisiones.
-
Integración e interoperabilidad de datos (data integration and interoperability): Que consiste en la gestión de la adquisición, extracción, transformación, movimiento, propagación, replicación, federación y virtualización de datos.
-
Contenido y documentos (documents and content): Que consiste en el almacenamiento, protección, indexación y habilitación de acceso de datos en documentos, permitiendo su integración e interoperabilidad con datos estructurados.
-
Metadatos (metadata): Que consiste en la recopilación, categorización, mantenimien to, integración, control, gestión y distribución de metadatos.
-
Calidad de dato (data quality): Que consiste en definir, monitorear, mantener y mejorar la calidad y la integridad del dato.
4.1.1.Normas, estándares y estrategia
-
Identificación del personal involucrado, establecimiento de decisiones y clarificación de responsabilidades.
-
Establecer, revisar, aprobar y monitorizar normas.
-
Establecer, revisar, aprobar y monitorizar estándares.
-
Establecer estrategias de datos corporativos.
4.1.2.Calidad del dato
-
Identificar al personal involucrado, el establecimiento de decisiones y la clarificación de responsabilidades.
-
Definir la estrategia de la calidad del dato.
-
Monitorizar la calidad del dato.
-
Informar sobre el estado de las iniciativas de calidad.
4.1.3.Gestión de datos maestros
-
Identificar los datos maestros y los de referencia tanto internos como externos.
-
Consolidar y propagar el uso de los datos maestros y los de referencia.
-
Asegurar la calidad de los datos maestros y de referencia.
4.1.4.Gestión de la seguridad del dato
-
Ayudar a proteger los datos sensibles mediante la gestión de acceso y requisitos de seguridad.
-
Alineamiento entre la arquitectura de seguridad de datos e iniciativas de negocio.
-
Ayudar a asesorar y gestionar el riesgo.
-
Ayudar a hacer cumplir los requisitos reguladores y contractuales.
-
Identificar al personal involucrado, el establecimiento de decisiones y la clarificación de responsabilidades.
4.1.5.Madurez
-
Falta de soporte ejecutivo, es decir, falta de un claro liderazgo en la organización
-
Falta de fundamentos de gestión del dato en la organización, es decir, falta de personas con conocimientos en la organización
-
Falta de métricas de seguimiento del programa, es decir, falta de indicadores y objetivos para comprender el avance del programa
-
Baja planificación en el programa y proyectos, así como no disponibilidad de presupuesto y/o tiempo adecuados, es decir, falta de organización respecto de estas iniciativas
-
Falta de perfiles adecuados tanto técnicamente como desde el punto de vista del liderazgo y de la propiedad del dato
4.2.Modelo de madurez data governance
-
MIKE2.0, que es un marco de referencia de buenas prácticas relativas a la gestión de la información y cuyo modelo es el Information Maturity Model (12)
-
IBM Data Governance Council, formado por más de cincuenta instituciones que colaboran en el área y cuyo modelo es el Data Governance Council Maturity Model (13)
-
EDM Council, que es una asociación para el desarrollo e implementación de estándares relativos al dato y publicación de buenas prácticas, y cuyo modelo es Data Management Maturity Model (DCAM) (14)
-
DAMA, una asociación internacional de profesionales focalizados en los conceptos y prácticas relativos a la gestión del dato y de la información, y cuyo modelo es DM- BoK (Data Management Body of Knowledge) (15)
-
Gartner, consultora de prospección tecnológica, cuyo modelo es Enterprise Information Management Maturity Model (16)
-
Fase 0. Ninguno. No existe un proceso de gobierno del dato definido.
-
Fase 1. Inicial. Existe una autoridad del dato en el departamento de TI, pero tiene poca influencia en los procesos de negocio. La colaboración entre áreas de TI y negocio no es consistente y existe una total dependencia de determinados expertos del dato en cada área de negocio. Como resultado, los procesos no están integrados dentro de la organización.
-
Fase 2. Gestionado. Dueño y administrador suelen estar presentes en líneas de negocio particulares. Existen procesos poco definidos en las aplicaciones clave en las líneas de negocio, y los problemas del dato son gestionados de una manera reactiva sin identificar el origen del problema. Es una etapa temprana a la hora de estandarizar los procesos en las diferentes líneas de negocio.
-
Fase 3. Estandarizado. El negocio está involucrado, existe un equipo de diferentes funciones, así como administradores de datos con responsabilidades claras. Hay establecidos procesos estandarizados y consistencia en las líneas de negocio. Existe un repositorio central de políticas de datos de fácil acceso y la calidad del dato es regularmente monitorizada y medida.
-
Fase 4. Avanzado. La estructura organizativa del gobierno del dato se considera como crítica para todas las funciones del negocio. El negocio es el dueño del contenido del dato y de la creación de las políticas del dato. Se crean y se documentan modelos de datos corporativos.
-
Fase 5. Optimizado. El gobierno del dato es un proceso de negocio central y las decisiones de negocio se toman evaluando el beneficio, coste y riesgo. Se crean objetivos de mejora de procesos para la organización, los cuales se revisan continuamente para reflejar posibles cambios en los objetivos del negocio. Los costes se reducen debido a la automatización de procesos.

4.2.1.Modelos de data governance
-
Personal
-
El éxito depende de la competencia de unos pocos empleados.
-
Los analistas de negocio no están implicados en la definición de normas de calidad del dato.
-
-
Normas
-
No existe calidad de dato.
-
Datos y procesos aislados.
-
Recursos no optimizados debido a la redundancia de datos y su antigüedad.
-
-
Tecnología
-
Estandarización y limpieza de datos en fuentes de datos aislados
-
La mejora de datos se centra en determinadas aplicaciones.
-
-
Riesgos y recompensas
-
El riesgo es muy alto. Los problemas del dato conllevan la pérdida de clientes o procedimientos erróneos.
-
Las recompensas son bajas. La organización recibe pocos beneficios de la calidad del dato.
-
-
Personal
-
El éxito depende de un grupo específico de empleados de IT.
-
No existen procedimientos estándar que cubran diversas áreas funcionales, pero sí existen iniciativas de calidad del dato.
-
-
Normas
-
El foco es corregir errores cuando ocurren.
-
Los procesos de gestión se centran en problemas existentes.
-
Se estandarizan roles y tareas en grupos individuales y departamentos.
-
-
Tecnología
-
Se disponen de herramientas de control de calidad.
-
No existe integración de datos en las unidades de negocio.
-
-
Riesgos y recompensas
-
El riesgo es alto, debido a la falta de integración y consistencia de datos en la organización.
-
Las recompensas son limitadas y anecdóticas, a través de procesos individuales.
-
-
Personal
-
El equipo de gestión entiende el rol del gobierno del dato. Se asigna personal y recursos.
-
Se considera el dato como un activo estratégico para la toma de decisiones.
-
Surge la figura del administrador del dato para implementar la estrategia y trabajar con los diversos equipos funcionales.
-
-
Normas
-
Surgen actividades en tiempo real y normas preventivas de calidad del dato.
-
Se comparan las métricas del dato con los estándares de la industria para obtener información para mejorar el modelo.
-
Los objetivos cambian de la corrección de errores a la prevención.
-
-
Tecnología
-
Un grupo de administradores del dato mantienen las normas de negocio y las descripciones de los datos de la organización.
-
Un continuo monitorizado de los datos ayuda a mantener la integridad de la organización.
-
Se dispone de procesos en tiempo real y la calidad del dato es compartida por diferentes modos de operación.
-
-
Riesgos y recompensas
-
El riesgo es medio o bajo. Los riesgos se reducen al disponer de una mayor información que incrementa la fiabilidad en la toma de decisiones.
-
Las recompensas son medias o altas. Cada vez más empleados adoptan el modelo.
-
-
Personal
-
El gobierno del dato es soportado a nivel ejecutivo en la organización.
-
Los usuarios de negocio tienen un rol activo en la estrategia del dato.
-
Existe un grupo de gobierno o calidad del dato que trabaja directamente con los administradores del dato y otros usuarios.
-
-
Normas
-
Las nuevas iniciativas se aprueban después de considerar cómo van a afectar a la infraestructura del dato existente.
-
Existen normas automatizadas para asegurar la consistencia y fiabilidad del dato en toda la organización.
-
-
Tecnología
-
Se estandarizan las herramientas de calidad e integración del dato en la organización.
-
El dato es monitorizado continuamente, se soluciona inmediatamente cualquier desviación del estándar.
-
Los modelos de datos capturan la lógica del negocio y los detalles técnicos de todos los datos organizativos.
-
-
Riesgos y recompensas
-
El riesgo es bajo. Los datos maestros están controlados en la organización, permitiendo disponer de una alta calidad de información.
-
Las recompensas son altas. Existe una mejor comprensión sobre el negocio que permite al equipo de gestión una plena confianza en las decisiones basadas en el dato.
-
4.3.¿Qué modelo de madurez usar?
Resumen
Glosario
- big data
- Hace referencia al conjunto de estrategias, tecnologías y sistemas para el almacenamiento, procesamiento, análisis y visualización de conjuntos de datos complejos.
- business intelligence
- Hace referencia al conjunto de metodologías, aplicaciones, prácticas y capacidades enfocadas a la creación y administración de información que permite tomar mejores decisiones a los usuarios de una organización.
- ciclo de vida de un activo m
- Hace referencia a las diferentes etapas por las que pasa un activo desde su nacimiento hasta el fin.
- gestión del ciclo de vida de un activo f
- Hace referencia al enfoque basado en políticas para gestionar el flujo del dato a través de uno o varios sistemas de información a lo largo de su ciclo de vida.
- gobierno del dato m
- Hace referencia al ejercicio de autoridad, control y toma de decisiones compartida (planificación, vigilancia y aplicación) sobre la gestión de los activos de datos.
- hoja de ruta f
- Hace referencia al plan detallado que refleja los objetivos a corto y largo plazo y guía el progreso para alcanzar esos objetivos, usando a menudo una solución tecnológica específica.
- internet de las cosas m
- Hace referencia a la interconexión digital de objetos cotidianos con internet.
- minería de procesos f
- Hace referencia a la disciplina que tiene como objetivo descubrir, monitorear y mejorar procesos a través de la extracción de conocimiento del registro de eventos de los sistemas de información.
- Ley Sabarnes Oxley f
- Hace referencia a una ley busca monitorizar a las empresas que cotizan en bolsa de valores, evitando que la valorización de las acciones de las mismas sea alteradas de manera dudosa, mientras que su valor es menor.
- linaje del dato m
- Hace referencia a la capacidad de conocer todo el ciclo de vida de un dato, desde la fecha y hora exacta en que fue extraído y el momento en que se produjo su transformación, hasta el instante en que tuvo lugar su carga desde un entorno fuente a otro de destino.