Tecnologia > I.A.

9 mitos do Aprendizado de Máquina

Aqui você encontrará uma visão clara daquilo que o Machine Learning pode ou não oferecer

21 de Março de 2018 - 15h51

O Machine Learning (Aprendizado de Máquina / ML) está se provando tão útil que é tentador presumir que ele pode resolver qualquer problema e ser aplicado a qualquer situação. Assim como outras ferramentas, o ML é útil em áreas específicas, especialmente para problemas que você sempre teve, mas sabia que não poderia contratar ninguém para resolvê-los, ou para questões com um objetivo claro, mas sem um método óbvio para alcançá-lo.

Mesmo assim, todas as organizações provavelmente aproveitarão o Machine Learning de uma ou outra forma, uma vez que 42% dos executivos disseram recentemente à Accenture que esperam que a Inteligência Artificial (IA) estará por trás de todas as novas inovações em 2021. Mas você terá resultados melhores se olhar para além do hype e evitar esses mitos comuns ao entender o que o Machine Learning pode (ou não) fazer.

Mito: Machine learning é IA
Machine Learning e Inteligência Artificial costumam ser usados como sinônimos, mas, apesar de o ML ser a técnica usada com maior sucesso fora dos laboratórios de pesquisa, a IA é um campo amplo que cobre áreas como visão computacional, robótica, e processamento de linguagem natural, assim como abordagens como satisfação de restrição que não envolvem ML. Pense nela como algo que faz as máquinas parecerem inteligentes. Nenhuma dessas áreas são o tipo geral de “IA” que algumas pessoas temem que poderia competir com ou atacar a humanidade. 

Tome cuidados com as “buzzwords” e seja preciso. O Machine Learning é sobre padrões de aprendizado e prever resultados a partir de grandes conjuntos de dados; os resultados podem parecer “inteligentes”, mas no fundo são sobre aplicar estatísticas com velocidade e escala sem precedentes.

Mito: Todos os dados são úteis
Você precisa de dados para o Machine Learning, mas nem todos os dados são úteis. Para treinar o seu sistema de ML, você precisa de dados representativos que cubram os padrões e resultados com os quais o seu sistema de Aprendizado de Máquina precisará lidar. Você precisará de dados que não possuem padrões irrelevantes inclusos (como fotos que mostram todos os homens de pé e todas as mulheres sentadas, ou todos os carros no estacionamento e todas as motos em uma área cheia de lama). Isso porque o modelo de Machine Learning que você cria vai refletir esses padrões excessivamente específicos e buscar por eles nos dados que forem usados em conjunto. Todos os dados que você usar para treinamento precisam estar bem classificados, e rotulados com os recursos que correspondem às perguntas que você vai fazer para o sistema de Machine Learning, o que exige muito trabalho.

Não presuma que os dados que você possui são limpos, claros, representativos ou fáceis de classificar.

Mito: Você sempre precisa de muitos dados
Os principais avanços feitos recentemente em reconhecimento de imagens, em compreensão de leitura por máquinas, tradução de idiomas e outras áreas, aconteceram por causa de ferramentas melhores – hardwares de computação como GPUs que podem acessar grandes quantidades de dados em paralelo, e grandes conjuntos de dados classificados, incluindo o ImageNet e o Stanford Question Answering Dataset

Mas graças a um truque chamado Transferência de Aprendizado (transfer learning, em inglês), você nem sempre precisa de um grande conjunto de dados para conseguir bons resultados em uma área específica. Em vez disso, você pode ensinar a um sistema de Machine Learning como aprender usando um grande conjunto de dado e então fazê-lo transferir essa habilidade para aprender o seu próprio conjunto de dados de treinamento, muito menor. É assim que funcionam as APIs de visão customizada da Salesforce e da Microsoft Azure: você só precisa de 30 a 50 imagens mostrando o que quer para conseguir classificá-las e conseguir bons resultados.

A Transferência de Aprendizado permite customizar um sistema pré-treinado para o seu próprio problema com uma quantidade relativamente pequena de dados. 

Mito: Qualquer um pode criar um sistema de Machine Learning
Existem muitas ferramentas e frameworks open-source para Machine Learning e incontáveis cursos te mostrando como usá-los. Mas o ML ainda é uma técnica especializada; você precisa saber como preparar dados e particioná-los para testes e treinamentos; como escolher os melhores algoritmos e quais heurísticas usar com eles; assim como transformar isso em um sistema confiável em produção. 

Você também precisa monitorar o sistema para garantir que os resultados permaneçam relevantes com o passar do tempo. Não importa se o seu mercado muda ou se o seu sistema de Machine Learning é bom o bastante que você acaba com um conjunto diferente de clientes, você precisa verificar continuamente se aquele modelo ainda se encaixa no seu problema.

Entender o Machine Learning da maneira correta exige experiência. Se você está apenas começando, busque por APIs para modelos pré-treinados que você pode acionar a partir do seu código enquanto adquire ou contrata expertise em ciência de dados e ML para construir sistemas customizados.

Mito: Todos os padrões de dados são úteis
Pessoas que possuem asma, dor no peito ou doenças cardíacas - e qualquer um que tenha 100 anos de idade – possuem uma taxa de sobrevivência à pneumonia melhor do que você esperaria. Ela é tão boa, na verdade, que um simples sistema de Machine Learning feito para automatizar a admissão de pacientes em um hospital pode enviá-las de volta para casa (um sistema baseado em regras treinado com os mesmos dados como uma rede neural fez exatamente isso). Infelizmente, a razão pela qual essas pessoas possuem uma taxa de sobrevivência alta é porque elas sempre foram admitidas imediatamente no hospital porque a pneumonia é muito perigosa para elas. 

O sistema está vendo um padrão válido nos dados. Mas não é um padrão útil para escolher quem admitir no hospital (apesar de que isso poderia ajudar uma empresa de segurar a prever os custos para o tratamento, por exemplo). Mais perigoso ainda: você não saberá que esses padrões que não são úteis estão no seu conjunto de dados, a não ser que já saiba sobre eles.

Em outros casos, um sistema pode aprender um padrão válido (como o controverso e polêmico sistema de reconhecimento facial que dizia prever a orientação sexual das pessoas a partir de selfies) que não é útil porque não possui uma explicação clara e óbvia.

Os modelos conhecidos como “Black Box” são eficientes, mas não deixam claro qual padrão eles aprenderam. Algoritmos mais inteligíveis e transparentes, como os Generalized Additive Models, deixam mais claro o que o modelo aprendeu para que você possa decidir se a sua implementação será útil.

Mito: Aprendizado por reforço está pronto para ser usado
Virtualmente todos os sistemas de Machine Learning existentes atualmente utilizam aprendizado supervisionado. Na maioria dos casos, eles são treinados com conjuntos de dados claramente classificados, cuja preparação contou com a participação de seres humanos. Fazer a curadoria desses dados é um processo que exige tempo e esforço. Por isso, há muito interesse em formas não supervisionados de aprendizagem, especialmente o chamado “aprendizado por reforço" (reinforcement learning /RL, em inglês) – em que um agente aprende por tentativa e erro, ao interagir com o seu ambiente e receber recompensas por comportamentos corretos. 

O sistema AlphaGo, da DeepMind, usou RL juntamente com aprendizado supervisionado para derrotar os principais jogadores de Go. E o Libratus, um sistema criado por uma equipe da universidade Carnegie Mellon, usou o RL juntamente com duas outras técnicas de IA para derrotar alguns dos melhores jogadores de pôquer do mundo na categoria Texas Hold ’Em (que possui uma estratégia de apostas longa e complexa). Os pesquisadores estão fazendo experimentos com o aprendizado por reforço nas mais diversas áreas, que incluem desde robótica até testes com softwares de segurança.

No entanto, o RL é menos comum fora da comunidade de pesquisas. O Google usa a DeepMind para economizar energia nos seus data centers ao aprender a resfriá-los de maneira mais eficiente. A Microsoft utiliza uma versão específica e limitada do RL chamada de “contextual bandits” para personalizar manchetes de notícias para os visitantes do portal MSN.com. O problema é que poucos ambientes do mundo real possuem recompensas facilmente verificáveis e feedback imediato, e é especialmente desafiador alocar recompensas quando o agente realiza diversas ações antes que qualquer coisa aconteça. 

Mito: Machine Learning é imparcial
Como o Machine Learning aprende a partir dos dados, ele irá replicar qualquer viés presente no conjunto de informações. Buscar por imagens de CEOs, por exemplo, provavelmente trará imagens de homens brancos porque há mais CEOs homens e brancos. Mas acontece que o ML também amplifica o viés. 

O conjunto de dados COCO, normalmente usado para treinar sistemas de reconhecimento de imagens, possui fotos de homens e mulheres. Mas mais mulheres são mostradas próximas a aparelhos de cozinha, enquanto que mais homens são mostrados com teclados e mouses, raquetes de tênis ou pranchas de snowboard. Treine o sistema com o COCO e ele irá associar homens com aparelhos de computação de maneira mais forte do que as estatísticas das fotos originais.

Um sistema de Machine Learning também pode adicionar parcialidade a outro. Treine um sistema de ML com frameworks populares para representar palavras como vetores que mostram as relações entre eles e ele irá aprender estereótipos como “o homem é para a mulher como o programador de computador é para a dona de casa”, ou médico para enfermeira e chefe para secretária. 

Se você usar esse sistema com um que faça a tradução entre idiomas que tenham pronomes como “ele” e “ela”, como português e inglês, para outros com pronomes neutros, como finlandês, “they are a doctor” (algo como “eles são médicos”) se transforma em “he is a doctor” (“ele é um médico”) e “they are a nurse” (algo como “elas são enfermeiras”) vira “she is a nurse” (“ela é uma enfermeira”)

Receber recomendações similares em um site de compras é útil, mas é algo problemático quando estamos falando de áreas sensíveis e pode produzir um loop de feedback. Se você entrar em um grupo do Facebook contra vacinas, por exemplo, a engine de recomendação da rede social vai sugerir outros grupos focados em teorias da conspiração ou que acreditam que a Terra é plana. 

É importante tomar cuidado com as questões de parcialidade no Machine Learning. Se você não puder remover o viés do seu conjunto de dados de treinamento, use técnicas como regularizar as associações de gênero entre pares de palavras para reduzir o viés ou adicionar itens não relacionados às recomendações para evitar o chamado “filter bubble”.

Mito: Machine Learning só é usado para o bem
O Machine Learning empodera ferramentas de antivírus, em buscas de comportamentos de ataques recém-descobertos para encontrá-los assim que eles são lançados. Mas, da mesma forma, os hackers estão usando o ML para investigar essas ferramentas de antivírus, assim como desenvolver ataques de phishing direcionados e em escala ao analisar grandes quantidades de dados públicos ou analisar o quanto as tentativas anteriores de phishing foram bem-sucedidas.

Mito: Machine Learning vai substituir as pessoas
É comum ficar preocupado que a Inteligência Artificial vai acabar com empregos – e ela certamente vai mudar quais atividades fazemos e como as realizamos. Os sistemas de Machine Learning melhoram a eficiência e o compliance e reduzem custos. No longo prazo, eles vão criar novos cargos nos diferentes mercados, assim como vão tornar obsoletas algumas posições atuais.

Mas muitas das tarefas que o Machine Learning automatiza simplesmente não eram possíveis antes, seja por conta da complexidade ou da escala. Você não poderia contratar pessoas suficientes para visualizar todas as fotos publicadas nas redes sociais para verificar se elas traziam algo da sua marca, por exemplo.

O que o Machine Learning já começou a fazer é criar novas oportunidades de negócios, como melhorar a experiência do consumidor por meio da chamada manutenção preditiva, e oferecer sugestões e suporte para os tomadores de decisões das empresas. Assim como foi com as gerações anteriores da automação, o Machine Learning pode liberar os profissionais para que eles usem os seus conhecimentos e criatividade.