User Defined Functions (UDFs)
Ver Publicación

¿Qué son las User Defined Functions (UDFs)?

La reusabilidad es un concepto altamente utilizado en el mundo de la programación. Se trata de una técnica que permite agilizar, encapsular y facilitar el mantenimiento de desarrollos. Informatica Powercenter brinda la posibilidad de aplicar estas técnicas mediante el uso de algo llamado User Defined Functions (UDFs).
Ver Publicación
Compartir
Ver Publicación

Optimizaciones PowerCenter: Particionamiento de datos

En entradas anteriores, hemos hablado sobre la importancia que tiene el uso de técnicas de optimización de procesos ETL (véase la entrada Workflows Concurrentes). En esta ocasión hablaremos de la configuración de Particionamiento de Datos a nivel session, lo cual es configurado dentro del Workflow Manager.
Ver Publicación
Compartir
Ver Publicación

Principales categorías de herramientas ETL – Parte II

En la anterior entrada del blog, Principales categorías de herramientas ETL, se introdujeron dos tipos de herramientas de ETL, las Enterprise Software y las Open Source. En esta entrada se presentarán los otros dos tipos de herramientas ETL: los personalizadas y los servicios en la nube.
Ver Publicación
Compartir
Ver Publicación

Optimizaciones PowerCenter: Workflows concurrentes

Si bien es cierto que los procesos ETL trabajan en conjunto y de manera integral con otras tecnologías, cada una de las plataformas para el desarrollo de ETL, cuenta con bondades que permiten aplicar mejoras de desempeño al momento de ejecución y es algo que debe ser aprovechado. Por lo anterior, para esta primera entrada de Optimizaciones PowerCenter, hablaremos de Workflows Concurrentes.
Ver Publicación
Compartir
deduplicación
Ver Publicación

Deduplicación: Informática PowerCenter

Al desarrollar un proyecto de Integración de Datos, en las etapas de Extracción y de Data Quality, se suelen detectar problemas en la calidad de la información, la Duplicidad de la misma es uno de ellos.
Es decir, en las diferentes fuentes que tomamos como origen de datos (archivos planos, objetos relacionales, xml, etc.) pueden presentarse registros repetidos.
Ver Publicación
Compartir
Ver Publicación

Principales categorías de herramientas ETL

Las herramientas de ETL han existido durante más de 30 años y a lo largo de este tiempo han ido surgiendo diferentes tipos de herramientas a medida que la tecnología ha ido evolucionando. Estas pueden ser catalogadas en cuatro grandes categorías, abordando en esta entrada dos de ellas, las herramientas ‘Enterprise’ y las ‘Open Source’.
Ver Publicación
Compartir