Curso Procesamiento de datos con Pentaho Data Integration

Procesamiento de datos con Pentaho Data Integration

Objetivos

Que el alumno pueda utilizar una solución gratuita y portable como PDI en el procesamiento de datos.

Requisitos

Manejo de Windows y Office

Modalidad

Curso a desarrollarse en Auditorio con proyector

Plan de Estudio

Módulo I:
Breve introducción al ciclo de vida de Procesamiento de Datos: de que se trata el concepto de ETL?
Transformaciones: campos calculados, filtros, selección de datos y de variables
Validaciones
Formateo de datos
Carga de datos
Tipos de procesamiento: Reportes, campañas, enriquecimiento de bases, validaciones
Arquitectura de Pentaho Data Integration (PDI): Kettle, Spoon, Pan y Kitchen.

Módulo II: Acceso y Exportación de los Datos
Consulta en bases de datos: Ejemplos con MySQL
Archivos de Texto
Excel
Access
Binarios propios de PDI
Consultas parametrizadas
Módulo III: Transformaciones I - Operaciones con Registros y Joins de Datos
Filtros
Ordenar registros
Quitar duplicados
Agregaciones
Añadir registros (appends)
Joins: Inner, left/rigth
Lookups
Módulo IV: Transformaciones II - Operaciones con Campos
Tipos de datos: Cadena, Numérico, Fecha
Flujos condicionales
Formatos de datos
Campos calculados
Manejo de cadenas
Alterar tipos y cambiar nombres de campos


Módulo V: Utilidades PDI
Data Validation
Normalización y denormalización de datos
Índices y secuencias
Manejo de errores
Reutilización de transformaciones: mappings

Programado por Angel J. Lopez y el Club de Programadores | HTML + CSS por FedericoMP