Modelo Dimensional

El modelo de datos dimensional, como ya se comentó en artículos anteriores, conlleva una técnica de modelado que facilita la compresión de la base de datos, haciéndola intuitiva para usuarios no expertos, y es comúnmente utilizada para implementar los DWH o DM.
Esta técnica goza de una gran aceptación y, a menudo, es elegida como la preferida para representar datos analíticos por cumplir simultáneamente con los siguientes requerimientos:

  • Dispone y estructura los datos de manera comprensibles para el usuario de negocio
  • Genera un alto rendimiento en las búsquedas desde la capa de reporting

Dentro del modelado de datos dimensional destacan 2 conceptos clave: hechos y dimensiones.

  • Hechos: Son las métricas, normalmente valores cuantitativos (numéricos) susceptibles de ser agregados
    • Ejemplo: La cantidad de ventas de coches de un concesionario, el rendimiento en euros de una empresa, el número de estudiantes de un colegio, etc.
  • Dimensiones: Son los valores cualitativos. Proporcionan descripciones a los hechos, aportando un contexto a los mismos.
    • Ejemplo: Marca de coche, fecha, nombre concesionario, dirección de la empresa, nombre del colegio, etc.

Existen 2 técnicas para llevar acabo el modelado dimensional: el esquema de estrella y el esquema de copo de nieve.

Esquema de estrella

Un esquema de estrella es un modelo de datos formado por una tabla de hechos, que contiene los datos para el análisis, rodeada de las tablas de dimensiones.

md-img1Imagen 1

Como podemos observar en la imagen 1 la tabla de hechos es TH-Ventas y está rodeada de las dimensiones TD-Almacén, TD-Producto y TD-Cliente, almacenando el ID de cada dimensión en la tabla de Hechos para, así, poder relacionar los atributos descriptivos de cada dimensión con la fila de la tabla de hechos.

El modelo estrella separa los datos del proceso de negocio en: hechos y dimensiones. Los hechos contienen datos medibles, cuantitativos, y las dimensiones los atributos que describen los datos indicados en los hechos.

Tabla de hechos

  •  Clave principal compuesta por los claves principales de las tablas de dimensiones
  • Registra medidas o métricas de un evento específico. Ejemplo: cliente compra un geranio de maceta de 25cm en floristería mineral vegetal Lola a las 12:3 0am del 10 de Octubre de 2027
  • Evita repetir de manera completa los atributos dimensionales. En la TH sólo irá un ID de la dimensión
  • Se diseñan según el nivel de granularidad deseado, pudiendo registrar eventos a un gran nivel de atomicidad

Tabla de dimensiones

Tienen una clave primaria simple.

  • Generalmente tienen un número bajo de registros
  • Cada registro puede contener un gran número de atributos
  • Suelen contener una surrogate primary key, generalmente una columna de tipo entero

Las principales ventajas del esquema de estrella son:

  • Queries simples. Las uniones y cruces son más sencillos, debido a su lógica, que los de un esquema normalizado
  • Lógica de reporting simplificada
  • Mejoras en el rendimiento de las consultas
  • Agregaciones más rápidas. Gracias a las queries simplificadas

Las principales desventajas del esquema de estrella son:

  • Poco flexible. Los esquemas en estrella son construidos para una vista de los datos en particular

Esquema en copo de nieve

Un esquema de copo de nieve es una estructura más compleja que el esquema de estrella. Se da cuando alguna de las dimensiones se implementa con más de una tabla de datos.
El objetivo es normalizar estas tablas y reducir el espacio de almacenamiento al eliminar la redundancia.
Se representa como una tabla de hechos conectada con dimensiones anidadas. Al normalizar por completo las dimensiones el resultado parece un copo de nieve.

Imagen 2

Observamos en la imagen 2 como se dividen las dimensiones de TD-Almacén, TD-Producto y TD-Cliente en sub-dimensiones normalizadas.

Las principales ventajas del esquema de copo de nieve son:

  • Algunas herramientas de modelado de bases de datos multidimensional OLAP se optimizan
  • La normalización de los atributos reduce el almacenamiento de datos

Las principales desventajas del esquema de copo de nieve son:

  • Queries complejas debido a la normalización (implica un mayor número de cruces)
  • Bajo rendimiento debido a la normalización

Después de haber descrito los esquemas de estrella y copo de nieve vamos a dejar una tabla con la comparativa entre los dos esquemas:

Imagen 3

Si tenéis alguna duda, por favor, no dudéis en comentarnos. En próximas entregas hablaremos de otros modelados de bases de datos.

2 comentarios

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*
*

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.