Plataformas clustering y Hadoop

Plataformas para procesaminto de big data. Scala, Cloudera, Hadoop y otras tecnologías.

Tecnologías

Hadoop HDFS

Sistema de archivos distribuidos de Hadoop (HDFS ™): sistema de archivos que proporciona acceso de alto rendimiento a los datos de las aplicaciones.
Hadoop YARN

Marco para la programación de tareas y la administración de recursos de clúster.
Hadoop MapReduce

Sistema basado en YARN para el procesamiento paralelo de grandes volumenes de datos