Home  >  Inovação

Cinco problemas que vem com o big data

Quanto mais dados, mais complexa será a tarefa de geri-los. Certamente, sua empresa irá se deparar com alguns contratempos na jornada

COMPUTERWORLD EUA

21/08/2015 às 8h45

big_data_analytics.jpg
Foto:

Pense da seguinte maneira: Uma pequena quantidade de dados até pode ser facilmente gerenciada e analisada de forma simples, gerando aceitáveis níveis de inteligência. Afinal de contas, os volumes e componentes difusos analisados não são tão grandes assim. Mas quando os dados ganham novas proporções, crescendo de forma constante, adicionam problemas até então não vivenciados. 

Essa é a visão de Nate Silver. Fundador do site de jornalismo de dados FiveThirtyEight (agora propriedade da ESPN), ele trabalha escavando uma montanha de registros. O executivo falou durante uma conferência promovida pela HP, em Boston, e descreveu os problemas que podem vir junto com big data.

Ocupam muito espaço

Silver diz que mesmo pequenas quantidades de dados podem ser difíceis de gerir, tanto em termos de armazenamento quanto de análise. A lógica sugere que, quanto mais dados as empresas tiverem, mais complexa será a tarefa de geri-los. Você precisará responder perguntas do tipo: Vale comprar equipamentos para guardá-los? Melhor armazenar na nuvem? Com que frequência você precisa acessar esses registros? Como pode lidar com latência?

Trazem perspectivas difusas

Uma questão relativa à grande quantidade de dados é que isso cria polarização e diferentes perspectivas. Vamos dizer que existam dois silos em sua empresa. Parece simples decifrar o que esses dois recipientes contem de maneira macro. Agora, se você está analisando 100 pesquisas, pode haver muitas nuances dentro desses dados. Certamente, já deve ter ouvido que os números dizem o que as pessoas querem ouvir e que, espremidos, podem dizer qualquer coisa. Pois bem, quanto mais dados tiver, mais espaço de manobra existe para respostas imprecisas.

Geram falsos positivos

Silver cita o livro de Daniel Kahneman intitulado “Thinking, Fast and Slow” para apontar o fato de que as pessoas tomam decisões baseadas em um subconjunto de dados a partir do pensamento rápido. A melhor pratica é o “pensamento lento” e a verdadeira racionalização dos dados. Com big data, pensamento rápido (e não analisar dados por completo) pode levar a falsos positivos.

A imensidão é complexa

O especialista usa o termo “encontrar sinal em meio ao barulho”, que seria uma versão um pouco diferente do velho “agulha no palheiro”. Quanto mais dados você tem, mais difícil é encontrar algo de fato valioso naquela montanha.

Nem sempre trazem aquilo que você estava procurando...

Imagine o Google Maps dando-lhe instruções e sugerindo como alternativa uma rota “mais rápida”. Porém, apenas depois de pegar esse caminho descobrirá que ele é esburacado ou sem asfalto. Às vezes, sistemas de big data oferecem atalhos que, na verdade, não são exatamente aquilo que você estaria procurando.