MR | Introdução

MapReduce (Big Data)

Introdução


A evolução das técnicas de obtenção de dados aumentou a quantidade destes que temos à disposição. Isso significa que, frequentemente, temos de processar mais dados para obtermos as informações que queremos. Para fazer com que isso aconteça em um tempo razoável, é necessário aumentar a capacidade de processamento das entidades envolvidas. O aumento do poder individual de processamento pode ser custoso ou até tecnicamente inviável. A figura 1 mostra uma tendência na diminuição do aumento da frequência dos processadores.

Dessa forma, para obter o resultado de algum processamento em tempo razoável, frequentemente faz-se necessária a paralelização ou distribuição da computação dos dados.

O modelo MapReduce é uma abstração criada para oferecer aos implementadores uma interface que seja simples e poderosa, separando os problemas da paralelização dos problemas a serem resolvidos, buscando uma uniformidade na abordagem dessas questões de paralelismo.


Anterior | Topo | Próxima