Big Data > Analytics, Hadoop, Open Source

Open source é o "novo normal" para o Big Data

A próxima geração de plataformas de dados será inteiramente de código aberto, acredita o CEO da Talend

18 de Março de 2016 - 16h00

Não é nenhum segredo que o Hadoop e o Apache Spark são as tecnologias mais quentes no mercado de Big Data, mas o que é menos frequentemente notado é que ambos são open-source.

Mike Tuchen, ex-executivo da Microsoft que agora é CEO da fornecedora de Big Data Talend, acha que não é coincidência.

"Estamos vendo uma mudança do status quo", disse ele. "A próxima geração de plataformas de dados será inteiramente de código aberto."

A plataforma que ele está se referindo é um ecossistema Hadoop expandido, em que toda a pilha é open source. "É o novo normal", disse ele.

Como um fornecedor de tecnologias de integração para essa plataforma, a Talend aposta todas as suas fichas no Hadoop, no Apache Spark e no código aberto em geral. Por isso o entusiasmo de Tuchen não chega a ser exatamente uma surpresa. A Talend oferece produtos voltados para Big Data, Cloud e integração de aplicações, entre outras, e todas são baseadas em software de código aberto.

Ainda assim, a aposta da Talend parece estar valendo a pena. A empresa vai celebrar o seu 10º aniversário este ano, ostentando na carteira clientes de grande nome como a GE, o Citi, a Lufthansa, a Orange e a Virgin Mobile.Está em meio a uma grande expansão. No final de 2015, vendia seus produtos em cinco países; até o final deste ano, serão 15, segundo Tuchen. Isso vai significar a contratação de cerca de 200 novas pessoas aumentando a força de trabalho para 750 profissionais, ao todo.

Os clientes apreciam co open source por permitir "experimentar antes de comprar", mas também já começam a ver o mundo open source evoluindo mais rapidamente do que o mundo proprietário por causa do compartilhamento entre os desenvolvedores.

"Todo o ecossistema Hadoop está se movendo mais rápido do que aconteceria caso dependesse de um único fornecedor", disse Tuchen.

Por tudo isso, organizações como a Forrester acreditam que o Hadoop é uma plataforma que precisa de ser usada em grandes empresas, formando a pedra angular de qualquer futura plataforma flexível de gestão de dados. Se sua empresa tem dados estruturados, não estruturados e binários, há espaço relevante para o Hadoop. E há duas grandes razões para isso: as empresas têm muito mais dados para gerir e o Hadoop é uma grande plataforma, especialmente por permitir combinar dados antigos legados com novos dados não estruturados.

Hoje, um grande número de empresas está oferencedo serviços e suporte em torno do Hadoop, tornando-o portanto mais atraente para as organizações. Cloudera, Hortonworks e MapR. IBM e Pivotal são as que têm maior presença no mercado, segundo a Forrester. A Talend corre por fora.