Map Reduce by wikipedia

Map Reduce (http://fr.wikipedia.org/wiki/MapReduce)


MapReduce est un patron d'architecture de développement informatique, popularisé (et non inventé) par Google, dans lequel sont effectués des calculs parallèles, et souvent distribués, de données potentiellement très volumineuses (> 1 teraoctet).
Les terminologies de « Map » et « Reduce », et leurs idées générales, sont empruntées aux langages de programmation fonctionnelle utilisés pour leur construction (map et réduction de la programmation fonctionnelle et des langages de programmation tableau).
MapReduce permet de manipuler de grandes quantités de données en les distribuant dans un cluster de machines pour être traitées. Ce modèle connaît un vif succès auprès de sociétés possédant d'importants datacenters telles Amazon ou Facebook. Il commence aussi à être utilisé au sein du Cloud computing. De nombreux frameworks ont vu le jour afin d'implémenter le MapReduce. Le plus connu est Hadoop qui a été programmé par Apache Software Foundation. Ce framework possède des inconvénients qui réduisent considérablement ses performances notamment en milieu hétérogène. Des frameworks qui permettent d'améliorer les performances de Hadoop ou les performances globales du MapReduce (tant en termes de vitesse de traitement qu'en consommation électrique) commencent à voir le jour.


Commentaires

Posts les plus consultés de ce blog

le Conservatoire (Cnam) accueille le Forum science, recherche & société

Le TOGAF Domaines d'architectures (partie 1): La norme TOGAF est un cadre pour l’architecture d’entreprise.