Cursos de Hadoop para Analistas de Negocios

Algunos de nuestros clientes

Código del Curso

hadoopba

Duración

21 horas (usualmente 3 días, incluidas las pausas)

Requerimientos

  • programming background with databases / SQL
  • basic knowledge of Linux (be able to navigate Linux command line, editing files with vi / nano)

Entorno de laboratorio

Zero Install: ¡No hay necesidad de instalar el software hadoop en las máquinas de los estudiantes! Se proporcionará un grupo de trabajo Hadoop para los estudiantes.

Los estudiantes necesitarán lo siguiente

  • un cliente SSH (Linux y Mac ya tienen clientes ssh, para Windows Putty se recomienda)
  • un navegador para acceder al clúster. Recomendamos el navegador Firefox con la extensión FoxyProxy instalada

Descripción General

Apache Hadoop es el marco más popular para el procesamiento de Big Data. Hadoop proporciona una capacidad analítica rica y profunda, y está haciendo in-roads en el mundo analítico de BI tradicional. Este curso presentará a un analista a los componentes principales del sistema Hadoop eco y sus análisis

Audiencia

Analistas de Negocios

Duración

tres días

Formato

Conferencias y manos sobre laboratorios.

Programa del Curso

  • Sección 1: Introducción a Hadoop
    • Hadoop historia, conceptos
    • Sistema ecológico
    • Distribuciones
    • Arquitectura de alto nivel
    • Mitos hadoop
    • Desafíos de hadoop
    • Hardware software
    • Labs: primer vistazo a Hadoop
  • Sección 2: Descripción de HDFS
    • Conceptos (escala horizontal, replicación, localidad de datos, conocimiento de rack)
    • Arquitectura (Namenode, Namenode secundario, nodo de datos)
    • Integridad de los datos
    • Futuro de HDFS: Namenode HA, Federación
    • De laboratorio: interacción con HDFS
  • Sección 3: Mapa Reducir Resumen
    • Mapreduce conceptos
    • Daemons: jobtracker / tasktracker
    • Fases: driver, mapper, shuffle / sort, reductor
    • Pensar en mapa reduce
    • Futuro del mapreduce (hilo)
    • Laboratorios: Ejecución de un programa de reducción de mapa
  • Sección 4: Cerdo
    • Cerdo vs java mapa reducir
    • Lengua latina del cerdo
    • Funciones definidas por el usuario
    • Entender el flujo de trabajo de los cerdos
    • Análisis de datos básicos con Pig
    • Análisis de datos complejos con Pig
    • Multi conjuntos de datos con cerdo
    • Conceptos avanzados
    • Laboratorio: escribir scripts de cerdo para analizar / transformar datos
  • Sección 5: Colmena
    • Conceptos de la colmena
    • Arquitectura
    • Soporte de SQL en Hive
    • Tipos de datos
    • Creación de tablas y consultas
    • Gestión de datos de colmena
    • Particiones y uniones
    • Análisis de texto
    • Labs (multiple): creación de tablas Hive y ejecución de consultas, uniones, uso de particiones, uso de funciones de análisis de texto
  • Sección 6: Herramientas de BI para Hadoop
    • Herramientas de BI y Hadoop
    • Vista general de las herramientas de BI actuales
    • Elegir la mejor herramienta para el trabajo

Testimonios

★★★★★
★★★★★

Categorías Relacionadas

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Guatemala!

As a Business Development Manager you will:

  • expand business in Guatemala
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!