Carreiras na Ciência de Dados 5 — O CIENTISTA DE DADOS
Para fechar o ciclo de artigos sobre as carreiras na área de ciência de dados, vamos falar da carreira mais “sexy” do século XXI, eleita pela Forbes!
O cientista de dados se tornou esse “Super Star” a partir de 2010, quando os grandes volumes de dados começaram a ganhar equipamentos e ferramentas que permitiram os avanços no processamento e aplicação de algoritmos estatísticos para predição de fenômenos de negócios, ou seja, os famosos “insights”.
A missão de analisar dados e simular hipóteses e cenários futuros já existia há anos, principalmente no mercado financeiro. Porém essa missão não era fácil de ser executada devido as dificuldades técnicas de reuni dados suficientes para ter uma amostragem significativa da realidade e depois ter infraestrutura de hardware suficiente para rodar os algoritmos.
Para essa missão, eram contratados estatísticos, engenheiros, economistas ou até administradores de empresas como eu. E a missão era analisar cenários de mercados, negócios, coletar informações, gerar estudos sobre riscos e oportunidades futuras.
Essa missão se tornou mais interessante quando começamos a coletar dados da internet, isto se tornou viável com ferramentas open source, ambientes cloud computing, e a possibilidade de rodar algoritmos complexos em poucos minutos.
Com isso nasceu a primeira geração de cientistas de dados, que faziam tudo. Desde a arquitetura da solução, a codificação dos processos de coleta, ingestão, tratamento e armazenamento de dados, os algoritmos, a apresentação dos dados e a elaboração da estratégia de negócios.
Bom, como podem ver, os primeiros cientistas de dados exerciam todas as funções simultaneamente, já que antes não havia essas possibilidades a medida em que iam surgindo novas tecnologias esses apaixonados pela inovação iam assimilando e criando soluções.
Por isso criou-se o mito do cientista de dados super herói! Mas a medida em que as tecnologias foram se ampliando, as possibilidades e utilização dos dados pelas empresas também, isso foi se tornando quase humanamente impossível.
Hoje temos uma infinidade de soluções de software e hardware para suportar o desenvolvimento de soluções baseadas em dados.
Como poderão observar nos mapas a seguir, o primeiro de 2012 mostra o mapa d soluções para área de BIG Data e Analytics nas diferentes camadas (rede, armazenamento, processamento, manipulação e apresentação de dados):
No segundo mapa de 2019 já podem notar a ligeira diferença:
Como podem perceber, por essa razão se tornou humanamente impossível ao cientista de dados dominar todas as soluções e exercer todos os papéis para execução de um projeto de ciência de dados.
Mas vamos as características necessárias para ser um “super star” ou “Cientista de Dados:
Hard Skills:
· Linguagem de programação SQL, Python, R são básicas;
· Linguagem Natural;
· Arquitetura de Redes Privadas (VPNs) e ambientes de Nuvem (Cloud Computing);
· Ecossistema Hadoop (ambiente open source);
· Bancos de Dados estruturados e não estruturados (SQL, Oracle, DB2, MySQL, PostgreSQL, MongoDB, etc);
· Estatística;
· Matemática;
· Leis de proteção de Dados (GDPR, LGPD);
· Ferramentas de Deep Learning, Machine Learning (Tensor Flow, H²O, etc);
· Algoritmos de Inteligência Artificial (Alexia, Cortana, Siri, Watson, Google, etc);
· Conhecer bem ao menos um setor da economia ajuda a se especializar em soluções para determinada indústria (Mercado financeiro, Agronegócios, Saúde, Energia, etc);
Soft Skills:
· Criatividade e curiosidade;
· Pensamento crítico e visão sistêmica;
· Capacidade analítica, avaliar por diferentes perspectivas para tomada de decisão;
· Gostar de solucionar problemas, persistência;
· Gostar de estudar e aprender sempre. Como podem ver a cada dia surgem novas ferramentas para aprender a usar;
· Trabalhar em grupos multiculturais. Cada vez mais esse profissional é demandado por diversos países, logo é preciso saber atuar com times de diferentes culturas;
· Liderança. Não sendo mais possível fazer tudo sozinho, é imprescindível saber liderar todos que estão envolvidos no projeto, o cientista de dados é quem dá o rumo para todos os outros se envolverem na busca da solução do problema. Se ele se perde, todos se perdem.
· Colaboração, saber atuar em ambientes colaborativos, dividir;
Espero ter contribuído aos aspirantes da área e que aqueles que já atuam sintam-se bem apresentados por aqui.
Como podem ver, não é fácil ser “Sexy” no século XXI! Mas não é impossível, buscar o aprendizado constante é característica para todas as profissões no mundo atual. A ciência de dados passou a ser fundamental para todas as profissões, já que em todas as áreas teremos que nos basear em dados ou sermos orientados por mecanismos de inteligência artificial, sendo assim…
Bora se capacitar na área!
Fontes:
· A Turbulent Year: The 2019 Data & AI Landscape — https://mattturck.com/data2019/
· Site CIO — https://cio.com.br/8-habilidades-indispensaveis-para-cientistas-de-dados/
· Site Época Negócios — https://epocanegocios.globo.com/Carreira/noticia/2019/09/o-habito-que-define-o-verdadeiro-lider-no-seculo-21-segundo-bill-gates.html
** Este texto não reflete, necessariamente, a opinião da Escola de IA