Curso Datastage Essential Dev/Admin 11.5

Aprende a dominar DataStage 11.5: Curso completo de desarrollo y administración de jobs

Descripción

Este curso de ETL con Datastage Essential Dev/Admin 11.5 prepara a los administradores de proyectos y desarrolladores ETL para adquirir las habilidades necesarias para desarrollar Parallel Jobs en DataStage, enfocándose principalmente en desarrolladores. Solo se discuten en profundidad las funciones administrativas relevantes para los desarrolladores de DataStage. Los estudiantes aprenderán a crear jobs paralelos que acceden a datos secuenciales y relacionales, combinándolos y transformándolos mediante funciones y otros componentes de job.
Este curso de 32 horas de FTI es esencialmente práctico, el alumno recibirá una máquina virtual en la que hará los laboratorios correspondientes

Objetivos

  • Describir los usos de DataStage y el flujo de trabajo de DataStage.
  • Explicar la arquitectura del Information Server y cómo DataStage encaja dentro de ella.
  • Describir las opciones de despliegue de Information Server y DataStage.
  • Usar la Information Server Web Console y el cliente DataStage Administrator para crear usuarios de DataStage y configurar el entorno de DataStage.
  • Importar y exportar objetos de DataStage a un archivo.
  • Importar definiciones de tabla para archivos secuenciales y tablas relacionales.
  • Diseñar, compilar, ejecutar y monitorear parallel jobs de DataStage.
  • Diseñar jobs que leen y escriben a archivos secuenciales.
  • Describir la arquitectura de procesamiento paralelo de DataStage.
  • Diseñar jobs que combinan datos usando joins y lookups.
  • Diseñar jobs que ordenan y agregan datos.
  • Implementar lógica de negocio compleja usando la etapa Transformer de DataStage.
  • Depurar jobs de DataStage usando el DataStage PX Debugger.

Audiencia Administradores de proyectos y desarrolladores ETL responsables de la extracción y transformación de datos utilizando DataStage.

Prerrequisitos

  • Conocimiento básico del sistema operativo Windows y Linux.
  • Familiaridad con técnicas de acceso a bases de datos.

Requisitos del equipo: PC o Notebook con al menos 16 GB de RAM y un SSD con al menos 40 GB de espacio libre, y VMware Workstation instalado.

Temario

  1. Introducción a DataStage
    • Exploración de los fundamentos y componentes clave de DataStage.
  2. Despliegue
    • Revisión de opciones y estrategias de despliegue para DataStage.
  3. Administración de DataStage
    • Cómo gestionar el entorno de DataStage, incluida la configuración y la administración de usuarios.
  4. Trabajar con Metadatos
    • Manejo y gestión de metadatos dentro de DataStage.
  5. Crear Jobs Paralelos
    • Diseño y desarrollo de jobs paralelos para el procesamiento de datos.
  6. Acceso a Datos Secuenciales
    • Estrategias para la lectura y escritura de datos en formatos secuenciales.
  7. Algoritmos de Particionamiento y Recolección
    • Técnicas para el manejo eficiente de datos en entornos paralelos.
  8. Combinar Datos
    • Uso de joins y lookups para integrar datos de múltiples fuentes.
  9. Etapas de Procesamiento de Grupo
    • Implementación de etapas de procesamiento para agrupar y resumir datos.
  10. Etapa Transformer
    • Desarrollo de transformaciones complejas y lógica de negocio.
  11. Funciones del Repositorio
    • Uso eficaz de objetos almacenados en el repositorio de DataStage.
  12. Trabajar con Datos Relacionales
    • Técnicas para acceder y manipular datos en sistemas de bases de datos relacionales.
  13. Control de Jobs
    • Estrategias para la supervisión y gestión de la ejecución de jobs en DataStage.