Aquarela

Aquarela Analytics branco

Os desafios do Cientista de Dados

os desafios do cientista de dados

Cientistas de dados estão ganhando popularidade em diversos campos de atuação, como esportes, arte, medicina, indústria e finanças. Muitos concordariam que se o renascimento (séc 14 ao 17) foi a força cultural, econômica e política responsável por instigar a construção do conhecimento e carregar a humanidade da idade média para a idade moderna. Hoje são os dados a força responsável por empurrar a humanidade adiante na direção da inovação tecnológica. E um dos profissionais que agregam nessa força é o cientista de dados. Mas afinal, quais são os desafios que um cientista de dados encontra no dia-a-dia?

Qualidade dos dados

Com frequência vemos memes na internet relacionados aos desafios dos cientistas de dados e sobre o tempo que dedicam para cada atividade. O imaginário popular enxerga somente atividades super complexas acontecendo durante o processo criativo de um cientista. Porém sempre nos deparamos com o engraçado fato de que limpar os dados e fazer a análise exploratória deles. O que de antemão não parece ser uma tarefa tão complexa, acaba sendo a tarefa que mais toma tempo desse profissional. De uma maneira divertida, esses memes acabam retratando a realidade dessa profissão. É um pouco cômico como uma atividade tão dependente da qualidade dos dados tenha que lutar tanto para deixá-los usáveis de alguma forma. Mas existe beleza nisso, afinal de contas o mundo nem sempre se comporta com a teoria que esperamos, e entender as complexas relações que levam os dados a chegarem desse jeito também traz consigo informação.

Desafios do cientista de dados: expectativas vs realidade

Esse é o primeiro desafio que encontramos no dia-a-dia: lidar com a expectativa de encontrarmos dados tão bonitos e limpos como aqueles que lidamos durante os cursos/estudos. Com frequência gastamos um bom tempo não só entendendo que dados estamos observando, mas também como limparmos eles, tratarmos conjuntos faltantes, achar o balanço ideal utilizando técnicas de undersampling ou oversampling, lidar com outliers e ainda como automatizar esse processo para fazer parte da nossa pipeline de modelo.

Mudança de contexto

O próximo desafio que faz parte da atividade de um cientista é ser astuto o suficiente para lidar com diferentes contextos em diferentes projetos. A amplitude de áreas em que a ciência de dados se aplica é muito extensa. Às vezes é complexo migrar de uma atividade em que previsão de série temporal de sensores é o foco para áreas de mercado de ações. A gama de ferramentas de análise disponíveis também é algo que muitas vezes deixam os cientistas ansiosos. Nesses casos é sempre o conhecimento básico sobre qual algoritmo está por traz dela, qual técnica ou quais equações de previsão de séries temporais estão envolvidas que será o guia da decisão. Por fim, vale ressaltar que ferramentas novas surgem o tempo todo, e é impossível ficar atento a todas. Portanto, o melhor amigo do cientista continua sendo as técnicas clássicas e o conhecimento em estatística.

Adequação ao negócio

Outro ponto importante é estar atento à solução proposta e sua conexão com a proposta de valor do negócio. Pouco adianta utilizar técnicas super complexas e robustas como redes neurais se a necessidade do negócio é conseguir analisar um conjunto de dados muito grande com uma boa frequência. O fato é que sempre existem soluções sofisticadas para solucionar o problema que você precisa, mas que usualmente não são escaláveis dentro da proposta. Estar atento como a atividade de cientista de dados impacta na solução final do software é fundamental para ter ideia do todo e buscar a melhor solução possível.

Gestão de tempo

A atividade de cientista de dados leva o nome de cientista não por acaso. É um exercício de descobrimento e criatividade. Acontece que muitas vezes esse exercício entra em conflito com as necessidades ágeis de entregas de resultado. É comum vermos cientistas que muitas vezes se sentem ansiosos por não concluírem atividades que estão atreladas a esse processo criativo dentro dos prazos ágeis que se esperaria. É importante reconhecer que a atividade às vezes leva mais tempo do que se imaginava. Também é importante reconhecer a demora e se preciso mudar de estratégia, ou seja, não se apegar às rotas escolhidas inicialmente e que estejam demorando muito para trazer conclusões necessárias, sempre existe um plano B a ser seguido. A intermediação desses conflitos internos também faz parte da atividade.

Escopo do cargo de cientista de dados

Quando falamos de dados, estamos falando da fonte de trabalho de diversos tipos de profissionais. O cientista de dados é somente um deles. Apesar de às vezes as fronteiras entre as atividades serem um pouco difusas, é importante conhecer o papel de outros ramos como o Engenheiro de Dados, o Analista BI e ainda o Engenheiro de Machine Learning. Entender os diversos papéis é importante até mesmo para descobrir talvez novas paixões do que se gostaria de fazer, além de que acaba sendo imprescindível no sentido de que são papéis cuja interação com o cientista precisa ser eficiente para tudo andar da melhor forma possível. As entregas de cada ponta precisam estar alinhadas para o fluxo do dado seguir em harmonia até criar a informação que se deseja.

Comunicação

Nesse sentido, torna-se imprescindível para um bom cientista de dados saber se comunicar de maneira assertiva e eficiente. É através de uma boa comunicação que a maioria dos problemas são evitados. Mas mais importante que isso, é através de uma boa comunicação que os demais integrantes da sua equipe podem entender e auxiliar da melhor forma possível a construir a melhor solução que se possa. Afinal de contas, não pense que a atividade de cientista é uma atividade isolada, como muitas vezes o estereótipo prega. É somente através da interação de diferentes e diversas mentes pensantes que podemos alcançar o potencial máximo para encontrar a melhor solução para o desafio proposto.

Conclusão – Os desafios do cientista de dados

Como o cientista passa a maior parte do tempo programando e explorando os dados, muitas vezes ele se enxerga como fazendo parte de um fluxo de informações, como se fosse quase uma peça de uma máquina maior. Mas a chave para transformarmos o que os dados dizem em novas ideias está exatamente no que a humanidade sabe ser e que a máquina simplesmente não o é. A humanidade sabe ser curiosa, o que nos leva a buscar novos entendimentos sobre as coisas.

É a curiosidade por emoções que nos leva a tentar entender pontos de vista diferentes, que ascendem nossa empatia. Também é a curiosidade por ideias e soluções que desperta a criatividade, que é o motor da inovação e articulação de novas soluções. A curiosidade por influenciar é a faísca que leva ao entendimento do poder da comunicação, que leva a instigar novas mentes. E, por fim, é a curiosidade pelo resultado que desperta a liderança.

A habilidade mais crucial para um cientista de dados ter é fazer as perguntas certas para os dados. É a curiosidade do cientista de dados que guia a busca por essas perguntas. É através das perguntas corretas e das soluções criativas que tornamos os dados em conhecimento significativo. E a boa notícia é que essas são exatamente as habilidades que nenhuma inteligência artificial poderia ter… ainda. “A fool with a tool is still a fool. Os dados ainda precisam de mentes curiosas para fazer a diferença.

Quem é a Aquarela Analytics?

A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial Corporativa na indústria e em grandes empresas. Por meio da plataforma Vorteris, da metodologia DCM e o Canvas Analítico (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania, Mercedes-Benz, Grupo Randon (automotivo), SolarBR Coca-Cola (varejo alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Auren, SPIC Brasil (energia), Telefônica Vivo (telecomunicações), dentre outros.

Acompanhe os novos conteúdos da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!

Autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Send this to a friend