Ver Publicación

Optimizaciones PowerCenter: Particionamiento de datos

En entradas anteriores, hemos hablado sobre la importancia que tiene el uso de técnicas de optimización de procesos ETL (véase la entrada Workflows Concurrentes). En esta ocasión hablaremos de la configuración de Particionamiento de Datos a nivel session, lo cual es configurado dentro del Workflow Manager.
Ver Publicación
Compartir
Tableau Server
Ver Publicación

¿Cómo organizar Tableau Server?

¿Cómo organizar Tableau Server? Hemos venido hablando del rendimiento de nuestros portales de acceso a los informes en Tableau, pero otro pilar importante para cualquier organización, es una buena gestión y definición del contenido. Tienen que existir diferentes roles de usuario, con distintas capacidades sobre el contenido.
Ver Publicación
Compartir
Ver Publicación

QlikView para principiantes

QlikView es un software de Business Intelligence de visualización y análisis de datos. Como una visión futura, podemos realizar investigaciones más exactas que nos permitan elegir la mejor decisión posible. Tiene la capacidad de generar distintas vistas de la información de manera instantánea, gracias a que toda la información es mantenida en memoria para disposición inmediata de múltiples usuarios a la vez.
Ver Publicación
Compartir
Ver Publicación

Principales categorías de herramientas ETL – Parte II

En la anterior entrada del blog, Principales categorías de herramientas ETL, se introdujeron dos tipos de herramientas de ETL, las Enterprise Software y las Open Source. En esta entrada se presentarán los otros dos tipos de herramientas ETL: los personalizadas y los servicios en la nube.
Ver Publicación
Compartir
Ver Publicación

Optimizaciones PowerCenter: Workflows concurrentes

Si bien es cierto que los procesos ETL trabajan en conjunto y de manera integral con otras tecnologías, cada una de las plataformas para el desarrollo de ETL, cuenta con bondades que permiten aplicar mejoras de desempeño al momento de ejecución y es algo que debe ser aprovechado. Por lo anterior, para esta primera entrada de Optimizaciones PowerCenter, hablaremos de Workflows Concurrentes.
Ver Publicación
Compartir
deduplicación
Ver Publicación

Deduplicación: Informática PowerCenter

Al desarrollar un proyecto de Integración de Datos, en las etapas de Extracción y de Data Quality, se suelen detectar problemas en la calidad de la información, la Duplicidad de la misma es uno de ellos.
Es decir, en las diferentes fuentes que tomamos como origen de datos (archivos planos, objetos relacionales, xml, etc.) pueden presentarse registros repetidos. En esta entrada, analizaremos qué es la deduplicación y que técnicas existen para llevarla a cabo.
Ver Publicación
Compartir
Ver Publicación

Principales categorías de herramientas ETL

Las herramientas de ETL han existido durante más de 30 años y a lo largo de este tiempo han ido surgiendo diferentes tipos de herramientas a medida que la tecnología ha ido evolucionando. Estas pueden ser catalogadas en cuatro grandes categorías, abordando en esta entrada dos de ellas, las herramientas ‘Enterprise’ y las ‘Open Source’.
Ver Publicación
Compartir