Análisis de paralelización con memoria compartida y memoria distribuida en clusters de nodos con múltiples núcleos

Wolfmann, Aaron Gustavo Horacio; Tinetti, Fernando Gustavo

Documento de conferencia

Acceso Abierto

Análisis de paralelización con memoria compartida y memoria distribuida en clusters de nodos con múltiples núcleos

Wolfmann, Aaron Gustavo Horacio

|

Tinetti, Fernando Gustavo

Fecha de publicación

octubre de 2008

Descripción

Workshop de Procesamiento Distribuido y Paralelo (WPDP)

Lugar de desarrollo

Instituto de Investigación en Informática

Evento

Congreso Argentino de Ciencias de la Computación

Nombre del evento

XIV Congreso Argentino de Ciencias de la Computación

Idioma

Español

Materia

Ciencias Informáticas

Extensión

12 p.

HDL 11746/3504

Descargas

Documento completo (190.6 KB)

Enlace externo

Recurso Completo

Resumen

This article presents the alternatives and performance results obtained after analyzing parallelization alternatives in clusters of nodes with multiple cores. The ultimate goal is to show if both processing and parallelization models (shared memory and distributed memory) need to be taken into account, or if only one of them is enough. The application used is classical in the context of highperformance computing: matrix multiplication. Even though this operation is representative of linear algebra applications, results are shown in terms of the conditions under which performance can be optimized and where algorithm parallelization efforts should be focused on for clusters of nodes with multiple cores. These clusters are nowadays considered as low-cost standards, since almost any desktop computer used to build clusters is based on a multi-core processor, and even on multi-processors. In any case, all processing units should be used to their maximum to optimize the performance of parallel applications.

En este trabajo se presentan las alternativas y los resultados de rendimiento obtenidos del análisis de las alternativas de paralelización en clusters de nodos con múltiples núcleos. El objetivo final es mostrar si es necesario tener en cuenta los dos modelos de procesamiento y paralelización (memoria compartida y memoria distribuida) o solamente uno de ellos. La aplicación utilizada es clásica en el contexto de cómputo de alto rendimiento: la multiplicación de matrices. Si bien esta operación es representativa de las aplicaciones de álgebra lineal, se muestran los resultados en términos de las condiciones bajo las cuales se puede optimizar rendimiento y hacia dónde debe estar enfocado el esfuerzo de la paralelización de algoritmos en los clusters de nodos con múltiples núcleos. Estos clusters son considerados como los estándares de bajo costo hoy en día, dado que casi cualquier máquina de escritorio con la que se construyen los clusters está basada en un procesador con más de un núcleo e, inclusive con más de un procesador. En cualquier caso, todas las unidades de procesamiento deberían ser utilizadas al máximo para optimizar el rendimiento obtenido por las aplicaciones paralelas

Palabras clave

Shared memory

Distributed memories

Parallel

Esta obra se publica con la licencia Creative Commons Attribution 4.0 International (BY 4.0)

Página completa del ítem

Análisis de paralelización con memoria compartida y memoria distribuida en clusters de nodos con múltiples núcleos

Título alternativo

Título de investigación

Directores

Compiladores

Editores

Editorial

Fecha de publicación

Descripción

Emisor del título

Lugar de desarrollo

Centro CIC

Libro/Informe

Recursos relacionados

Evento

Nombre del evento

Idioma

Materia

Area temática

Clasificación FORD

Cobertura Espacial

Extensión

Descargas

Enlace externo

Resumen

Palabras clave

item.page.license