Arquitectura BI (Parte III): El enfoque de Ralph Kimball

BI Geek / Arquitecturas  / Arquitectura BI (Parte III): El enfoque de Ralph Kimball
El enfoque de Ralph Kimball a la hora de construir un datawarehouse

Arquitectura BI (Parte III): El enfoque de Ralph Kimball

Después de haber expuesto el punto de vista de Bill Inmon sobre cuáles han de ser las premisas y fundamentos a la hora de construir un datawarehouse, llega el momento de estudiar el enfoque de Ralph Kimball, una visión un tanto diferente de comienzo a fin.

Al contrario que Inmon, Kimball defiende una metodología de trabajo “Bottom-up”. Con esto quiere decir que el procedimiento a seguir para construir un datawarehouse es empezar en un principio por pequeños componentes para ir evolucionando a estructuras y modelos superiores. Y esto es así porque para Kimball un datawarehouse no es más que la unión de los diferentes datamarts de una organización.

Su filosofía se centra en que, en la mayoría de las organizaciones, la construcción de un datawarehouse se origina por el interés y esfuerzo de un departamento. Es por esto por lo que en su primera versión este datawarehouse no es más que un datamart departamental.
A medida que otros departamentos necesiten sus propios datamarts, éstos se irán combinando con el primero manteniendo una metodología de estandarización mediante lo que Kimball denomina “dimensiones conformadas”, que serán las dimensiones comunes entre los diferentes departamentos. La clave radica en que estas dimensiones han de ser compartidas por los distintos datamarts que existan en la organización, garantizándose así la integridad de los mismos y dando lugar al conglomerado de estructuras que para Kimball conforman el datawarehouse.
Para lograr este resultado es importante que estas dimensiones conformadas tengan un diseño consistente y apto para todos los datamarts, de forma que al crearse uno nuevo reutilice las dimensiones ya definidas, pudiendo incluir o no otras dimensiones nuevas.

La principal ventaja de este enfoque de almacén de datos es que, al estar formado por pequeños datamarts estructurados en modelos de datos dimensionales (esquemas de estrella o copo de nieve), especialmente diseñados para la consulta y generación de informes, el datawarehouse al completo puede ser explotado directamente por las herramientas de reporting y análisis de datos sin la necesidad de estructuras intermedias.

Arquitectura Kimball - modelo dimensional

En cuanto a las cuestiones sobre la granularidad, a pesar de que este tipo de datawarehouse suele presentar los datos agregados en base a las consultas e informes que haya que generar, Kimball insiste en la necesidad de que estas agregaciones estén complementadas con datos a mayor nivel de detalle. El argumento es que las preguntas de negocio que puedan llegar a hacer los usuarios son impredecibles, de manera que el datawahouse tiene que estar preparado para dar respuesta a todas ellas, garantizando la exploración de los datos y la navegación a través de jerarquías desde datos agregados hasta información desagregada.

A este tipo de arquitectura Kimball lo denomina como “Data Warehouse Bus Architecture” y los cuatro pasos fundamentales que se han de seguir para construir este tipo de base de datos son, en primer lugar, la identificación del proceso de negocio que se pretenda estudiar, la definición de la granularidad de los datos, la selección de las dimensiones y atributos y, por último, la identificación de los hechos o métricas.

El esquema de arquitectura en base a los fundamentos de Ralph Kimball sería el de la siguiente imagen:Arquitectura Kimball

Como podéis observar, tanto Kimball como Inmon comparten la necesidad de establecer un sistema de almacenamiento de datos integrado y estable que garantice la explotación de la información, dando respuesta a todas las preguntas de negocio que surjan. Sin embargo, sus filosofías a la hora de construir un datawarehouse difieren mucho la una de la otra, sin que sea sencillo argumentar cuál de ellas es la más válida. A pesar de ello, en la próxima entrada haré, a modo de resumen, una comparativa de ambas visiones tratando de justificar en qué situaciones nos podemos apoyar más en un modelo o en otro.

Share
El objetivo de nuestra empresa es retomar los valores originales de la consultoría y poder ofrecer un valor añadido real a nuestros clientes.