top of page

Mineração de Dados – Big Data – O que é?

Muito se fala em Big-Data e Data Analytics. Neste artigo vamos conversar sobre o elemento central responsável pela parte analítica do Big Data, ou seja, pela preparação e análise das grandes massas de dados, que é chamada de Mineração de Dados. Ela sempre me despertou muito interesse pelos horizontes de pesquisa que ainda estão abertos.

 

A mineração de dados surgiu como área de pesquisa e aplicação independente em meados da década de 1990. Mas suas origens na matemática, estatística e computação são muito anteriores a este período, ganhando evidencia nos últimos anos, com a publicação do relatório BIG Data: The Next Frontier for Innovation, Competition and Productivity.

Temos um cenário em que o número de usuários da Internet no mundo passa de 4 bilhões, com dispositivos de “rastro” pessoais, (celulares, wearables), disseminação do uso de redes sociais, processos de coletas de dados mais eficientes e precisos, etc. Este cenário associado com o desenvolvimento tecnológico de captar dados e armazenar em grande velocidade, com baixo custo e grande capacidade de processo, facilitou a integração e o cruzamento de dados, apontando tendências e padrões.

No entanto, a diferença entre dados e informação/conhecimento é maior que a nossa capacidade de transformar um no outro de maneira rápida e precisa, principalmente para massa de dados com grandes volumes, variedades e velocidades.

O desafio é descobrir informações de dados em grandes massas. Este processo, conhecido como KDD – Knowledge Discovery in Databases, parte da ideia de minerar para descobrir conhecimento. Em outros termos “torturamos” os dados até os mesmos expressarem algum conhecimento não relevado em uma primeira análise.

De forma simplificada, a Mineração de Dados pode ser definida como um processo automático ou semiautomático de explorar analiticamente os dados. Com a finalidade de descobrir padrões relevantes que ocorrem, e que sejam importantes para embasar a assimilação de informações importantes, suportando a geração de conhecimento.

Alguns exemplos podem ser vistos nas áreas de marketing – estudo de comportamento de redes sociais, por exemplo, detecção de fraudes e medicina. Como técnicas de análise dos dados, destacam-se, a Associação, Classificação e o Agrupamento. O caso da empresa Target (rede americana de Supermercados), é um exemplo prático por Associação. A rede tinha interesse em vender produtos para bebês. Associou público alvo e data da compra, colocando produtos que eram comprados em conjunto no mesmo espaço. Chegou a prever a gravidez pela mudança no padrão de compras.

Espero ter “desmitificado” um pouco o tema. Até a próxima pessoal!!!


bottom of page