Arquitectura BI (Parte II): El enfoque de William H. Inmon

BI Geek / Arquitecturas  / Arquitectura BI (Parte II): El enfoque de William H. Inmon
El enfoque de William H. Inmon

Arquitectura BI (Parte II): El enfoque de William H. Inmon

En la anterior entrada del blog, Arquitectura BI (Parte I), tuvimos un primer acercamiento a los conceptos de Datawarehouse y Datamart donde, a modo de introducción, expuse una definición básica de estos dos componentes fundamentales en la arquitectura de todo proyecto BI. Como recordaréis, terminé explicando que a la hora de implantarlos existen diferentes enfoques sobre las características y funciones de éstos, siendo los más extendidos los de Bill Inmon y Ralph Kimball.

Para ir adentrándonos poco a poco en sus principales diferencias y poder llegar a determinar qué opción es la más adecuada en nuestros proyectos, en esta entrada expondré las características más destacadas del enfoque de Inmon.

Para él, un datawarehouse ha de entenderse como un almacén de datos único y global para toda la empresa. Un repositorio que centralice los datos de los diferentes sistemas operacionales de las organizaciones para que éstos queden validados e integrados en una única base de datos.
En este modelo, la premisa es que la información se almacene al máximo nivel de detalle (garantizando la futura exploración de los datos), permaneciendo invariable y no volátil, de manera que los cambios que sufran los datos a lo largo del tiempo queden registrados sin que puedan modificarse o eliminarse.

Estas son las claves fundamentales de la arquitectura defendida por Inmon, conocida como “Corporate Information Factory (CIF), donde el datawarehouse centraliza todos los datos de la compañía para alimentar, a continuación, pequeños datamarts temáticos, que serán los puntos de acceso para las herramientas de reporting. En este sentido, cada departamento tendrá su propio datamart, abastecido con la información del datawarehouse, listo para su análisis y explotación.

Arquitectura Inmon

Este enfoque de Inmon suele denominarse como una metodología de trabajo “Top-Down”, ya que se centra primero en una visión global de la compañía, para ir desmembrándola en pequeños sets de datos departamentales. Así, con esta arquitectura, todos los datamarts de la organización están conectados al datawarehouse, evitándose la aparición de incongruencias y anomalías al comparar los datos entre distintos departamentos.

En cuanto a la estructura interna del datawarehouse, para Inmon la prioridad es que el modelo de datos esté construido en tercera forma normal. Por dar una breve explicación de lo que esto significa, el proceso de normalización consiste en aplicar una serie de reglas o normas a la hora de establecer las relaciones entre los diferentes objetos dentro de la base de datos. Con este proceso de normalización se consiguen muchos beneficios, como evitar la redundancia de los datos, mantener su integridad referencial, facilitar el mantenimiento de las tablas y disminuir el tamaño de la base de datos. Sin embargo, a diferencia de los datawarehouse desnormalizados, las consultas exigen el empleo de queries mucho más complejas, lo que dificulta el análisis directo de la información y el uso de las herramientas de reporting. De ahí, la necesidad de construir los datamarts que, como ya comenté, están basados en modelos dimensionales de estrella o copo de nieve, diseños fácilmente explotables por estas herramientas de análisis de datos.

Arquitectura Inmon - 3FN

En la próxima entrada expondré el enfoque de Ralph Kimball para, a continuación, poder hacer una comparativa de los aspectos más destacados de ambas visiones y establecer las bases para determinar que esquema se adapta más a nuestras necesidades a la hora de implantar un proyecto de Business Intelligence.

Share
El objetivo de nuestra empresa es retomar los valores originales de la consultoría y poder ofrecer un valor añadido real a nuestros clientes.