Home  >  Plataformas

Open source: por que a Salesforce está abrindo a plataforma de AI Einstein

Empresa cria biblioteca de código TransmogrifAI e aposta na contribuição da comunidade para fortalecer ferramenta de machine learning

Scott Carey - Computerworld UK

21/08/2018 às 12h55

Foto: Shutterstock

A Salesforce está apostando no conceito de Open Source (Código Aberto) ao abrir as tecnologias de machine learning e inteligência artificial que estão por trás da sua plataforma Einstein.

Com o nome de TransmogrifAI, a biblioteca AutoML tem menos de 10 linhas de código Scala escritas sobre o Apache Spark e pode ser usada por desenvolvedores que procuram treinar modelos de machine learning para prever o comportamento do cliente sem precisar usar um grande conjunto de dados para treinamento.

"Ele foi desenvolvido com foco na aceleração da produtividade do desenvolvedor de machine learning por meio da automação de machine learning e uma API que impõe segurança, modularidade e reutilização em tempo de compilação. Por meio da automação, ele alcança precisões próximas a modelos manuais com quase 100 vezes de redução no tempo", afirma a empresa em seu site.

Em um extenso post no Medium na semana passada, Shubha Nabar, diretor sênior de ciência de dados da equipe Salesforce Einstein, disse que, três anos atrás, quando a companhia se propôs a construir capacidades de machine learning na plataforma Salesforce, aprendeu que a construção de machine learning em escala empresarial sistemas é ainda mais difícil.

A chave para a Salesforce quando estava desenvolvendo o Einstein era ser capaz de fornecer insights inteligentes e ações recomendadas sem agrupar todos os dados de seus clientes. Isso representou um sério desafio para o fornecedor antes de adquirir um grupo de empresas especialistas em machine learning, incluindo a MetaMind e seu fundador Richard Socher, que agora é cientista-chefe da Salesforce.

"Até esse ponto, se você não conseguir ver ou normalizar os dados, não poderá aplicar a inteligência", disse o CEO da Salesforce, Marc Benioff. "Temos grandes quantidades de dados, petabytes e petabytes, portanto, temos os dados de que precisamos e a resposta é que agora podemos operar com esses dados sem interferir na relação de confiança com nossos clientes."

O produto final é uma maneira de construir um modelo de machine learning único e modular que pode funcionar em conjuntos de dados menores e mais personalizados, dando a impressão de vários modelos específicos de domínio.

Nabar explicou que, com apenas algumas linhas de código, um cientista de dados pode automatizar a limpeza de dados, a engenharia de recursos e a seleção de modelos para chegar a um modelo de desempenho a partir do qual ela possa explorar e interagir mais.

"O TransmogrifAI tem sido transformacional para nós, permitindo que nossos cientistas de dados implantem milhares de modelos em produção com o mínimo de ajuste de mão e reduzindo o tempo médio de turn-around para treinar um modelo de desempenho de semanas para apenas algumas horas", explicou Nabar.

"Embora esse nível de automação tenha sido essencial para escalar para fins corporativos, acreditamos que cada empresa hoje tem mais casos de uso de machine learning do que cientistas de dados, e a automação é a chave para levar o poder do machine learning ao alcance", adicionou o executivo.

Explicando porque o Salesforce decidiu levar esse projeto para a comunidade de código aberto, Nabar diz que a empresa tem sido um usuário de longa data e colaborador do Apache Spark, e está animada para continuar a construir o TransmogrifAI ao lado da comunidade.

"O machine learning tem o potencial de transformar a maneira como as empresas operam e acreditamos que as barreiras à adoção só podem ser reduzidas por meio de uma troca aberta de ideias e código. Trabalhando a céu aberto, podemos reunir diversas perspectivas para continuar avançando e torná-lo acessível a todos", completou.

Deixe uma resposta