Arquitectura BI (Parte I): Introducción al Data Warehouse & Datamart

BI Geek / Arquitecturas  / Arquitectura BI (Parte I): Introducción al Data Warehouse & Datamart
Data warehouse y data mart

Arquitectura BI (Parte I): Introducción al Data Warehouse & Datamart

Conocer qué son un Data Warehouse y un Data Mart y, sobretodo, entender su finalidad y la creciente necesidad de las organizaciones de implantarlos es realmente importante para llegar a comprender, desde un punto de vista global, qué es Business Intelligence y poder emprender un proyecto de sus características.

Si volvemos la vista atrás en nuestro blog, veremos que son dos términos ya comentados cuando hablábamos de los componentes que intervienen en la arquitectura de un proyecto Business Intelligence. Y como iremos viendo, aquí hay mucho que hablar, ya que existen diferentes tipos de arquitecturas BI según la finalidad y alcance que se le dé al datawarehouse y, en consecuencia, al datamart, llegando a haber sólidas diferencias en la definición e implantación de éstos.

El concepto de datawarehouse, palabra inglesa cuyo significado no es otro que almacén de datos, nació en la década de los 80 ante la necesidad de desarrollar un sistema de almacenamiento de datos que garantizase la fluidez, el orden y el fácil manejo de los mismos y que, a la vez, supusiera un ahorro en tiempo y presupuesto para las empresas frente a los sistemas utilizados hasta el momento.

Un datawarehouse es, por tanto, un contenedor en el que se almacenan los datos procedentes de las distintas fuentes que puedan existir en una organización, quedando éstos integrados, depurados y ordenados en una única base de datos centralizada. En este almacén se guardarán los datos durante el período de tiempo requerido para cumplir con las necesidades de consulta de cada organización.
Con este sistema, las compañías consiguen tener integrados en un único contenedor todos los datos de sus diferentes procesos de negocio, listos para ser analizados mediante las herramientas de explotación y reporting.

Pero no nos olvidemos del Datamat, cuya definición es bastante similar a la del datawarehouse, siendo su alcance la principal diferencia entre estos dos tipos de bases de datos. Así, mientras un datawarehouse contiene todos los datos de una organización, un datamart solamente recoge un subconjunto de éstos, centrándose en un área específica dentro del negocio. Su objetivo es cubrir las necesidades de un determinado departamento dentro de la organización, por lo que podría definirse como un almacén de datos departamental.

El datamart es un sistema orientado a la consulta, cuya distribución interna de los datos es clara y no hay dudas al respecto, estando éstos estructurados en modelos dimensionales de estrella o copo de nieve. Sin embargo, no sé puede decir lo mismo del datawarehouse, para el que hay diferentes enfoques en cuanto a sus características y funciones. En este sentido, y haciendo alusión al principio de esta entrada donde comentaba que existen diferentes tipos de arquitecturas, es aquí donde tiene lugar un debate abierto desde la década de los 90 sobre las bases del datawarehouse.

Existen otros enfoques en cuanto a la estructura interna y construcción del datawarehouse, pero los más importantes son los de Bill Inmon y Ralph Kimball.

En la próxima entrada del blog hablaré sobre sus puntos de vista a la hora de desarrollar un datawarehouse y el tipo de arquitectura que defiende cada uno, de manera que podamos elegir el enfoque más apropiado en cada caso cuando tengamos que abordar diferentes proyectos BI.

Share
El objetivo de nuestra empresa es retomar los valores originales de la consultoría y poder ofrecer un valor añadido real a nuestros clientes.