MR | Introdução

A evolução das técnicas de obtenção de dados aumentou a quantidade destes que temos à disposição. Isso significa que, frequentemente, temos de processar mais dados para obtermos as informações que queremos. Para fazer com que isso aconteça em um tempo razoável, é necessário aumentar a capacidade de processamento das entidades envolvidas. O aumento do poder individual de processamento pode ser custoso ou até tecnicamente inviável. A figura 1 mostra uma tendência na diminuição do aumento da frequência dos processadores.

Figura 1 - A frequência dos processadores Intel de acordo com o ano de lançamento - Gráfico obtido com dados de [6].

Dessa forma, para obter o resultado de algum processamento em tempo razoável, frequentemente faz-se necessária a paralelização ou distribuição da computação dos dados.

O modelo MapReduce é uma abstração criada para oferecer aos implementadores uma interface que seja simples e poderosa, separando os problemas da paralelização dos problemas a serem resolvidos, buscando uma uniformidade na abordagem dessas questões de paralelismo.

Anterior | Topo | Próxima

MapReduce (Big Data)

Introdução