Documento de conferencia
Acceso Abierto

Distribución de un analizador de contenido de Twitter utilizando el framework Hadoop Map-Reduce

Enlace externo
Resumen

En este trabajo presentamos la utilización de una plataforma distribuida para analizar diferentes estrategias de cómo crear perfiles de usuario en base a los intereses extraídos de los tweets. Estudiamos cómo esto beneficia el entendimiento de la semántica de las actividades de Twitter utilizándolos como motores para la recomendación de contenido y medimos los resultados en termino de tasa de error, exactitud y valor F. Luego proponemos crear perfiles de usuario combinando las estrategias planteadas con el fin de obtener un modelo más preciso. Para mejorar la eficiencia del cálculo dada la gran cantidad de datos , proponemos utilizar un entorno distribuido bajo un modelo de programación Map-Reduce con el objetivo de reducir los tiempos de análisis de información, al mismo tiempo que realizamos el procesamiento de texto en forma paralela.

Palabras clave
Procesamiento de Lenguaje Natural
minería de texto
http://creativecommons.org/licenses/by/4.0/

Esta obra se publica con la licencia Creative Commons Attribution 4.0 International (BY 4.0)

item.page.license
Imagen en miniatura