Home  >  Plataformas

Google abre biblioteca para cientistas de dados protegerem privacidade

Companhia tornou open source sua biblioteca de privacidade diferencial. Gerente de produto de Privacidade explica como funciona a ferramenta

Por Carla Matsu

05/09/2019 às 10h02

Foto: Shutterstock

O Google anunciou nesta quinta-feira (5/9) que está tornando pública sua biblioteca de privacidade diferencial. A biblioteca reúne ferramentas que a gigante de Mountain View vem desenvolvendo nos últimos anos para extrair informações e contexto de dados anonimizados de usuários.

A privacidade diferencial permite que empresas e organizações obtenham informações e ideias sem que os donos dos dados sejam identificados. Para jogar um pouco de luz à tecnologia, em entrevista à Computerworld Brasil, Miguel Guevara, gerente de produto do Google na área de privacidade, explica que a ferramenta é utilizada internamente para recursos do Google Maps. Um dos exemplos é o uso da biblioteca para determinar os horários de pico de um restaurante quando um cliente o busca no Maps e ainda procura conhecer os pratos favoritos de um local.

De acordo com o Google, a biblioteca de privacidade diferencial lançada hoje é a mesma utilizada pela empresa internamente. Sua disponibilidade é gratuita para qualquer entidade ou pessoa interessada em usá-la.

Ao tornar open source a biblioteca, o Google diz que espera facilitar e democratizar as estratégias de análises de dados não só de empresas e empreendedores, mas de organizações não governamentais e de governos. "É muito caro desenvolver produtos de privacidade. A gente demorou dois anos. E imagine que você é uma empresa e precisa compartilhar dados e estatísticas e, na maioria dos casos, os engenheiros de software não têm dois anos para desenvolver algo assim. Nosso objetivo é que mais organizações tenham acesso a essa tecnologia sem ter de pagar os custos de se ter uma equipe especializada", resume Guevara.

Segundo o desenvolvedor, a biblioteca foi construída para ser fácil de se utilizar. "Para cientistas de dados é muito fácil. A única coisa que precisam é baixar a biblioteca e usar no computador deles, do mesmo jeito que fazem as operações do dia a dia", explica.

Privacidade diferencial na prática

A medida que empresas e governos se debruçam sobre dados extraídos de aplicações online, eles têm em mãos o potencial valioso de conhecer melhor seus clientes e populações e, consequentemente, tornar produtos e serviços mais eficientes. Entretanto, a privacidade é o grande calcanhar de Aquiles quando se fala em dados. Ao anonimizá-los, as organizações podem extrair valor dessas informações sem a inquietante preocupação de expor usuários.

"No nível mais abstrato, qualquer organização que tem dados pode usar esta biblioteca. Imagine que o governo quer compartilhar dados sobre qualidade dos hospitais comparando quanto o paciente passa tempo em um hospital. Assim, você pode imaginar que se pacientes esperam mais tempo em um hospital do que em outro, talvez aquele não seja tão bom", exemplifica Guevara.

Outro exemplo do uso da biblioteca poderia ser encontrado no planejamento urbano das cidades. "Um urbanista, muitas vezes, precisa saber como a população se movimenta na cidade. Esta informação é importante para planejar a cidade. E esses dados são sensíveis ao mesmo tempo, pois dizem respeito onde as pessoas moram, trabalham. É um bom exemplo do valor da privacidade diferencial, pois esses dados têm valor social e ao mesmo tempo são sensíveis por natureza. E a privacidade diferencial ajuda a encontrar um equilíbrio entre a utilidade e a privacidade dos dados", complementa.

O Google também garante que, além de incluir um amplo conjunto de testes, a biblioteca inclui o que chama de “Stochastic Differential Privacy Model Checker”. "Para explicar de forma resumida, essa característica ajuda a assegurar a correção das informações e a evitar erros", explica a companhia. Há ainda uma extensão PostgreSQL e também receitas comuns para quem está começando a adotar a ferramenta.

Além da biblioteca de privacidade diferencial, o Google tornou recentemente uma versão open-source da Privacidade Tensorflow, que permite a desenvolvedores da ferramenta treinar modelos privados de forma diferencial.