Transformaciones PowerCenter, Introducción

BI Geek / Business Intelligence  / Transformaciones PowerCenter, Introducción
blog_02

Transformaciones PowerCenter, Introducción

Una vez presentados los principales elementos disponibles en PowerCenter (si todavía no lo habéis hecho, os recomiendo leer Introducción a PowerCenter I), atender a su clasificación de las transformaciones en base a diferentes criterios y utilidades resulta imprescindible para comprender mejor el funcionamiento de las mismas y diseñar así procesos óptimos y consistentes.

Los objetivos que persigue este conjunto de artículos son la clasificación de las transformaciones según su variación de flujo, la descripción de las principales características de cada una de ellas desde este punto de vista y la recomendación de buenas prácticas ante las limitaciones y restricciones más importantes y frecuentes que implica cada una de ellas.

Encontraremos esta información estructurada en tres artículos:

  • Transformaciones PowerCenter, Introducción

        Se trata de este primer artículo de carácter general e introductorio

  • Transformaciones PowerCenter, Activas

        Descripción de los principales elementos activos que encontramos en un desarrollo

  • Transformaciones PowerCenter, Pasivas

        Descripción de los principales elementos pasivos que encontramos en un desarrollo


Partiendo de la premisa de que PowerCenter procesa la información como filas (registros) y columnas (campos o atributos del registro), entendemos por variación de flujo cualquier aumento o disminución de registros que produce una transformación.

Según este criterio, podemos enmarcar las transformaciones en dos grandes grupos:

  • Activas – PUEDEN modificar el flujo.

        La volumetría o (número de registros) en su entrada y salida puede ser diferente.

        Encontraremos en este grupo transformaciones como aggregator, filter, joiner, rank o router.

  • Pasivas – NO modifican el flujo.

        La volumetría en la entrada y la salida es exactamente la misma.

        Se encuentran en este grupo algunas como expression, lookup, sequence generator, unión o update strategy.

Mención aparte requieren otras transformaciones como sorter y source qualifier. Estas pueden tener una funcionalidad activa o pasiva en función de determinados aspectos, como su configuración o utilidad. Estas excepciones son detalladas en sus correspondientes apartados en los siguientes artículos.

Llegados a este punto y como regla general, podemos aceptar que las transformaciones activas se utilizan para cruzar, agregar, filtrar, separar o unir flujos, mientras que la principal funcionalidad de las pasivas es el cálculo, consulta u ordenación de los mismos.

Una última cuestión importante a tener en cuenta antes de profundizar en cada transformación, es la limitación que las activas (y también alguna pasiva) suponen a la hora de realizar los mapeos (relación entre los componentes del desarrollo o mapping representada gráficamente mediante flechas). Debido a que las activas pueden eliminar o incrementar el número de registros, todos los campos de un flujo de datos deben pasar por estas transformaciones, incluso aunque no sean necesarios en ellas. Posteriormente podrán mapearse a la siguiente “caja” del desarrollo, produciéndose el mismo efecto si se trata esta última de otro elemento activo.

Este es el caso de joiner, router, aggregator, rank, filter, sorter y también de alguna transformación pasiva como unión y update strategy. Por el contrario, cuando se trata de una expression, lookup o sequence generator, podemos mapear a estas transformaciones solo los campos que necesitemos, llevando directamente los demás a la siguiente transformación (siempre y cuando esta no sea un joiner) sin tener en cuenta su funcionalidad.


En los próximos artículos analizaremos el funcionamiento y los principales casos prácticos a la hora de trabajar con las transformaciones Activas y Pasivas que ofrece la herramienta.