Home  >  Carreira

Como criar a descrição ideal para cargos de ciência de dados

Carreira é uma das mais valorizadas no mercado de trabalho e empresas têm tido dificuldades para encontrar profissionais qualificados

Sharon Florentine | CIO EUA

30/10/2018 às 17h36

cientista de dados
Foto: Shutterstock

No mercado de trabalho no mundo dos dados, a demanda supera de longe a oferta, diz Chris Nicholson, cofundador e CEO da empresa de inteligência artificial e deep learning Skymind, e cocriador do framework de código aberto Deeplearning4j. Isso significa que as organizações devem resistir à tentação de buscar candidatos com a última habilidade necessária em ciência de dados em favor da contratação de potencial e, em seguida, treinamento no trabalho.

“Muito da ciência de dados tem a ver com estatística, matemática e experimentação - então a empresa não está necessariamente procurando por alguém com experiência em ciência da computação ou engenharia de software, embora deva ter alguma experiência em programação”, diz Nicholson. “A empresa quer pessoas de ciências, matemática, física e ciências naturais - pessoas treinadas para pensar em ideias estatísticas e usar ferramentas computacionais. Eles precisam ter a capacidade de analisar dados e usar ferramentas para manipulá-los, explorar correlações e produzir modelos de dados que façam previsões.”

Como o trabalho de um cientista de dados não é projetar sistemas inteiros, a experiência mínima de programação é boa, diz Nicholson. Afinal, a maioria das organizações pode contar com engenharia de software, DevOps ou equipes de TI para construir, gerenciar e manter a infraestrutura em apoio aos esforços da ciência de dados. Em vez disso, os candidatos fortes à ciência de dados geralmente têm experiência em ciências e devem ser proficientes em ferramentas de ciência de dados em uma ou mais pilhas diferentes.

Como criar a descrição correta para cargos em ciência de dados

Melhores práticas gerais

Quando se trata de elaborar qualquer descrição de trabalho, o responsável está basicamente comercializando sua organização, diz Ammon Bartram, diretor de dados e cofundador da Triplebyte. O objetivo é comunicar por que esse cargo é uma oportunidade estimulante, em vez de se concentrar apenas nas habilidades e responsabilidades. Muitas organizações que buscam cientistas de dados cometem esse erro, colocando-as em desvantagem logo de cara.

“Recrutadores geralmente escrevem coisas como: 'Deve ter um diploma técnico, três anos de experiência e profundo conhecimento do Apache Hadoop'. Isso é um erro, mesmo que você realmente queira alguém com esses atributos”, diz Bartram. "Para um papel de alta qualificação como a ciência de dados, o objetivo é convencer os candidatos que podem estar em cima do muro que sua empresa e seu cargo são interessantes e valem o seu tempo."

Isso é especialmente importante não apenas porque o mercado é tão quente, mas porque “muitas das habilidades necessárias são específicas da indústria e da empresa. As organizações usam idiomas diferentes, preferem as pilhas de tecnologia de certos fornecedores e ferramentas proprietárias específicas, de modo que cabe às equipes de contratação saber quais.”

Em vez disso, é preciso concentrar-se na missão da empresa, no que a função irá realizar e em qualquer detalhe técnico dos problemas que os candidatos terão de resolver, diz Bartram. “Para a ciência de dados em particular, pode ser ótimo escrever sobre os conjuntos de dados interessantes aos quais o candidato terá acesso.”

Ao começar as descrições de trabalho dessa maneira, o recrutador conseguirá engajar os candidatos mais facilmente e conseguirá passar para as habilidades técnicas mais difíceis necessárias para a função.

Habilidades específicas necessárias

Linguagens e ferramentas específicas variam de acordo com a empresa, mas acima de tudo é fluência em estatística, seguida por alguma experiência de programação e familiaridade com sistemas de dados, diz Bartram. Aqui, é importante ser específico quando necessário.

“Além das habilidades básicas, as empresas podem querer conhecimento de aprendizado de máquina - compreensão de modelos de machine learning específicos e ferramentas comuns para trabalhar com eles. Tensorflow e scikit-learn são as duas bibliotecas mais comuns em uso”, comenta o especialista.”As empresas podem querer experiência em qualquer linguagem de programação específica, como Python, Java, R etc. E as empresas podem querer familiaridade com os sistemas de dados específicos que usam, como PostgreSQL, MongoDB, Airflow, Hadoop, Redshift”.

Nicholson acrescenta o Matlab, um ambiente computacional numérico e uma linguagem de programação proprietária da Mathworks, a essa lista de fundamentos.

"Essas são ferramentas com as quais a maioria dos profissionais de ciências naturais e estatísticos estão familiarizados, o que lhe dá uma boa impressão de que os candidatos podem pensar sobre esses problemas da maneira certa. E se eles estão trabalhando em aprendizado de máquina - o Python dominou como a linguagem preferida nesse campo, assim como Canvas, Keras e Tensorflow. Se eles têm um desses, mas não o outro, isso não é um problema. É mais importante que eles sejam adeptos de um, porque isso mostra que eles podem aprender novas ferramentas rapidamente”.

Pavel Dmitriev, vice-presidente de ciência de dados da Outreach, usa uma lista mais extensa ao contratar, acrescentando que, para ser bem-sucedido na empresa, os candidatos devem ter conhecimento prático de tudo isso, mas ser extremamente proficientes em pelo menos um par.

“Algumas dessas são específicas do domínio. Para nós, a linguagem natural é muito crítica por causa de nossos negócios, mas em outras empresas pode ser algo diferente. Mas, em geral, procuramos habilidade com codificação e algoritmos; manipulação de dados; gerenciamento de big data; machine learning; processamento de linguagem natural; compreensão de negócios; como formalizar problemas e transformá-los em problemas matemáticos; e habilidades de comunicação”, comenta ele.

Habilidades interpessoais

Como os cientistas de dados devem colaborar com uma grande variedade de colegas, as habilidades virtuais são essenciais e não devem ser negligenciadas em nenhuma descrição de trabalho. Comunicação, trabalho em equipe, colaboração, paixão e missão são fundamentais para qualquer candidato a ciência de dados.

“Ser um cientista de dados envolve comunicar-se com colegas de trabalho e trabalhar em equipe. As duas principais habilidades aqui que influenciam se um candidato recebe ofertas são sua capacidade de comunicação e seu entusiasmo pelo que a empresa está fazendo”, comenta Bartram.