Documento de conferencia
Acceso Abierto

Escalabilidad y paralelización mediante el uso de Hadoop Distributed File System

Resumen

En el marco del proyecto de investigación Técnicas de recuperación de información en grandes volúmenes de datos heterogéneos con bases de datos NOSQL , el presente trabajo se orienta a evaluar configuraciones de clusters utilizando Hadoop Distributed File System (HDFS) para comprobar las capacidades de disponibilidad, escalabilidad y paralelización en la recuperación de información.\nDicha evaluación permitirá establecer las capacidades necesarias con las que debería contar un File System Distribuido, tanto desde la perspectiva de almacenamiento y técnicas de indexación, como de distribución de las consultas, paralelización, escalabilidad y rendimiento en ambientes heterogéneos.\nPara ello se diseñarán arquitecturas tanto centralizadas como distribuidas, y se realizarán las correspondientes verificaciones, estableciendo los porcentajes de mejora de rendimiento para cada arquitectura.

Palabras clave
Almacenamiento y Recuperación de la Información
Distributed file systems
Clustering
http://creativecommons.org/licenses/by/4.0/

Esta obra se publica con la licencia Creative Commons Attribution 4.0 International (BY 4.0)

item.page.license
Cargando...
Miniatura