Mineração de Dados

Das mais variadas definições, podemos estabelecer que o Big Data e a Mineração de Dados são dois pontos diferentes sobre o mesmo tópico. Big Data, como já conceituado é uma terminologia que define grandes volumes de dados e todas as variáveis inerentes a sua seleção, manipulação e armazenamento. Já a Mineração de Dados é referente a atividade de investigar dentro do Big Data os dados relevantes ao que se procura. É olhar a informação no nível detalhado, é transformar os dados em conhecimento (Fayyad, Usama, 1996).

Todas as definições traçaram o principal fundamento da Mineração de Dados como sendo o de identificar padrões na observação dos dados, porém somente em um Fayyad é categórico ao definir uma ligação direta entre a Mineração de Dados e a descoberta do conhecimento.

Fayyad apresenta o processo de transformação dos dados em conhecimento, chamado DCBD - Descoberta de Conhecimento nos Bancos de Dados. Esse processo aborda a transformação da informação desde o início com a aplicação do Big Data, passando pela Mineração de Dados até o agregamento desse valor desse conhecimento ao negócio.

Segundo Fayyad, essas etapas são descritas da seguinte forma: