Mais do que
conhecimento em estatística, matemática e TI, profissional reúne a habilidade
de encontrar uma agulha no palheiro.
Uma adolescente vai
ao supermercado e, ao passar no caixa, recebe um folheto informativo sobre
gravidez. Ela ainda não sabe, mas, a partir da listagem de produtos comprados,
foi identificada a probabilidade de gestação, confirmada semanas depois. Como
chegaram ao resultado? Por meio do somatório de tecnologia, análise e, claro, o
trabalho de um... cientista de dados.
Nos últimos meses,
a carreira despontou como uma das mais promissoras em tecnologia da informação,
especialmente com a explosão do Big Data, termo usado para descrever a grande
quantidade de dados que precisa ser analisada para apoiar as tomadas de
decisão. Já é considerada por analistas do mercado a profissão do futuro. A
previsão de dobrar o volume de dados a cada dois anos e o salto de Hadoop
[projetado para uso intensivo de dados] tem impulsionado a importância desse
talento.
“Em meio a uma
montanha de dados, o cientista de dados deve localizar padrões e identificar
insights, fornecendo subsídios para que empresas identifiquem o melhor caminho
para conduzir os negócios e conquistar diferencial competitivo”, explica Pedro
Desouza, cientista de dados da EMC, que há 20 anos trabalha no segmento.
É como encontrar
uma agulha no palheiro. “Cientista de dados é aquele que, normalmente, tem
formação em Ciência da Computação, Matemática e Estatística com conhecimentos
profundos nessas áreas. Mais do que isso, ele entende de negócios”, descreve
Desouza. É ainda alguém curioso, que gosta de resolver problemas e não tem medo
de errar e se comunicar.
Explicar a
aplicação dos resultados matemáticos na linguagem dos negócios é vital nessa
profissão. “Existem pessoas altamente técnicas que falham em não se preocupar
com esse ponto. Aquele que adota essa postura, rapidamente, vai parar no
terceiro subsolo do prédio”, brinca. Saber extrair informação de um banco de
dados também faz parte da lista de um bom profissional da área [veja mais no
quadro].
Cientista de dados
é diferente de um estatístico. “Um estatístico não manipula dados. Ele os
recebe em um arquivo e não participa do caminho anterior. O cientista tem
conhecimento fim a fim, desde a fonte até o produto final”, esclarece.
De fato, prossegue
o executivo, encontrar um profissional que reúna características tão
particulares não é tarefa fácil. “Levando em conta que a demanda por cientistas
de dados é latente e cresce, esse sujeito começa a ficar raro”, assinala. Não
por acaso, seu salário gira em torno de seis dígitos nos Estados Unidos.
Esse quadro tem
levado a uma inflação do mercado, observa. “A busca é tão alta que pessoas que
trabalham em campos relacionados inserem em seus currículos palavras-chave como
‘Hadoop’, ‘Big Data’, para atrair a atenção das empresas, mesmo sem o
conhecimento necessário”, explica.
Desouza enfrenta
esse desafio na hora de contratar. “Para driblar, busco sólido embasamento
estatístico e matemático, experiência em desenvolvimento Java, algoritmos
estatísticos e PhDs.” Ele diz que uma das estratégias que tem adotado é
localizar esses profissionais em conferências técnicas de alto nível.
“Contratei dois dessa forma.”
Para companhias que
querem fisgar esse especialista, ele recomenda a ajuda de uma consultoria. Isso
porque, segundo ele, é preciso, em primeiro lugar, desenvolver uma cultura
analítica. “Além disso, ainda há dúvidas sobre para quem o cientista de dados
vai se reportar: para o CEO? Ele estará posicionado na estrutura de negócios ou
TI?”, questiona.
Além da sala de
aula
Desouza reuniu as
competências necessárias ao longo do tempo por meio do acúmulo de experiência.
“O volume de conhecimento é crítico e o grande desafio da profissão. Não se
aprende com um único curso”, observa. O executivo, por exemplo, formou-se em
1985 no Instituto Tecnológico da Aeronáutica (ITA) e partiu para o mestrado em
seguida, também no ITA, e doutorado na Carnegie Mellon University (CMU), em
Pittsburgh, nos Estados Unidos, país que mora até hoje.
O tema de sua
especialização foi o primeiro passo para que ingressasse na área. “Optei por
abordar a otimização de problemas de grande porte. A complexidade me chamou a
atenção”, diz. “Esse desafio passou a ter valor de negócios, abrindo
oportunidades no mundo corporativo”, completa.
Atuou na IBM,
BusinessObjects, Qualcomm e lidera, desde o início de 2011, na área de
consultoria da EMC, uma equipe de 15 PhDs, que têm formação em matemática e
estatística com conhecimento de indústrias. “Temos contratos com grandes
clientes, especialmente em setores como varejo, finanças, companhias aéreas,
internet e energia que querem tirar conhecimento de ‘caixas’ para reduzir
custos e serem mais efetivos em suas estratégias”, aponta.
Estar em linha com
o que há de novo na literatura fez a diferença em sua trajetória. “Muitos
departamentos de pesquisa realizam estudos na área. É preciso ver o que é
publicado nos jornais científicos, misturar com os requerimentos do cliente e
adaptar os algoritmos para atender às necessidades”, afirma.
E como funciona o
dia a dia do cientista de dados? Na área de consultoria, diz, tudo começa com
um bate-papo com o cliente para entendimento dos processos. “Depois, pedimos
acesso ao banco de dados. Não queremos que eles nos forneçam os dados, porque
pode haver uma filtragem e eliminação de informações que podem ser
importantes”, explica.
Diante de
terrabytes de dados, o profissional deve aplicar algoritmos, analisar e fazer
descobertas. “A busca começa no escuro, já que o universo é baseado em
algoritmos probabilísticos, então, não tem uma resposta correta para o
problema”, observa.
Mas a natureza do
Big Data ajuda a ser mais assertivo. “É diferente da estatística pura e por
isso não generaliza. É possível entender o padrão de consumo de um usuário e
não mais de um grupo”, explica. Ele aponta que a tecnologia é fundamental nesse
processo, porque análise e modelo estatístico são somente a ponta do iceberg.
Ele cita a
aplicação do conceito na área de saúde. Por exemplo, um médico recomenda uma
cirurgia para um paciente em determinadas condições e ele pede autorização para
o plano, a combinação tecnologia + análise + atuação do cientista de dados em
tempo real pode alertar o médico se ele realmente quer partir para o
procedimento, levando em conta que naquelas condições, 70% de seus colegas
sugerem outros exames. “A TI tem enorme potencial do ponto de vista humano”,
conclui.
Por Déborah Oliveira