O Profissional de Data Science na visão da Aquarela

Nossas impressões sobre o processo de contratação de cientista de dados na Aquarela. Por que estamos fazendo isso? Porque sabemos o quão frustrante é não ter um retorno de nossas informações, ou pelo menos um feedback da submissão. Já vivemos muito disso em editais e na época de bolsas de estudo.

Dados da quota parlamentar disponíveis para download – Operação Serenata de Amor

Buenas pessoal, Com os feedbacks dos artigos relacionados ao projeto Serenata de Amor e a introdução dos conceitos de política supervisionada que eles estão ajudando a introduzir no país, descobrirmos que existem muitas pessoas curiosas (futuros cidadãos cientistas de dados) querendo informações mais detalhadas sobre o comportamento dos gastos dos parlamentares por partidos e por[…]

Em dia de Greve, 70 cientistas de dados se reúnem na operação “Serenata de Amor”.

    Amanhã, dia 28 de abril de 2017, ao invés de greve (não necessariamente contra ou a favor dela), 70 cientistas de dados, matemáticos, estatísticos, jornalistas, programadores e outros talentos estarão reunidos de forma voluntária até sábado a noite minerando dados governamentais para a redução imediata de desvios indevidos do dinheiro público federal que[…]

Saindo do limitado Excel para R ou melhor Python?

Olá pessoal, A comparação entre as plataformas R e Python começou há um tempo quando resolvi experimentar um sistema para edição e processamento de scripts chamado Jupyter Notebook, o qual é desenvolvido em Python. Até então sempre usei R. Aparentemente seria um processo tranquilo instalar um aplicativo, aí que a cobra pegou-me pela perna. Como[…]

Otimizando a gestão de pessoas com Advanced Analytics

Olá amigos,

Hoje vamos apresentar alguns insights relacionados à satisfação das pessoas no trabalho com apoio de técnicas e ferramentas de análise avançada de dados (Data Analytics) em uma área absolutamente estratégica, Recursos Humanos (RH). Utilizamos os dados disponibilizados neste link pelo cientista de dados Ludovic Benistant que teve o cuidado de fazer uma série de higienizações e anonimizações importantes na base para a análise.

Perguntas da pesquisa

Seguindo a metodologia DCIM (Data Culture Introduction Methodology) para orientar a pesquisa, levantamos as seguintes questões:

  • Quais os fatores de maior influência na satisfação dos colaboradores?
  • Quais os principais cenários de satisfação existentes?
  • Quais são os principais padrões associados aos cenários de satisfação?
  • Quais fatores influenciam a saída de profissionais?

 Características dos dados

No total foram 15 mil funcionários avaliados, considerando as seguintes variáveis já higienizadas por nossos scripts:

  1. Nível de satisfação (0 a 10) – Provavelmente preenchido pelo funcionário;
  2. Nota da última avaliação (0 a 10) – Provavelmente preenchido pelo superior;
  3. Número de projetos (2 a 7) – Número de projetos em que o empregado atuou;
  4. Média de horas mensais (96 a 310);
  5. Tempo na empresa (2 a 10) – Quanto tempo a pessoa já trabalha na empresa;
  6. Se tiveram um acidente de trabalho (Sim =1 / Não = 0);
  7. Se tiveram uma promoção nos últimos 5 anos (Sim =1 / Não = 0 );
  8. Faixa Salarial (Baixo = 1, Médio = 2, Alto = 3); Obs: Valores reais não disponíveis.
  9. Deixou a empresa (Sim =1 /Não = 0 ).

Número de pessoas por departamento

pessoas-por-departamento

Análise de Frequência/Distribuição da Satisfação

Abaixo vemos que a maior concentração de satisfação se encontra na faixa entre 7 e 9, sendo que há poucas pessoas com notas de satisfação entre 1.5 e 3.0.

screen-shot-2017-01-08-at-21-31-15

Resultados

Ranking de Influência de Fatores na Satisfação Laboral

Com o processamento dos dados utilizando os algoritmos da plataforma VORTX, chegamos ao ranking de influência sistêmica de fatores relacionados à satisfação dos funcionários, ou seja, quais os fatores que apresentam maior peso na variação da satisfação no trabalho. Abaixo estes fatores estão apresentados em ordem de importância, seguidos pela sua intensidade:

[…]

VORTX Big Data na otimização do Judiciário Brasileiro

Nós, da Aquarela Advanced Analytics, aceitamos o desafio de escrever como análises preditivas e machine learning podem acelerar os processos judiciais do Brasil. Antes disso, topamos o desafio de aplicar nossas técnicas e a ferramenta VORTX Big Data para encontrar padrões nos dados do judiciário brasileiro. Para conhecer os resultados, acesse o blog do Sajdigital Assine nossa Newsletter e receba[…]

Big Data na descoberta dos fatores chaves do IDH

Olá pessoal, hoje vamos mostrar mais um caso de estudo com o VORTX Big Data com dados reais. Nele mostramos como a abordagem de descoberta de cenários pode ajudar a tomada de decisão de forma profunda em vários setores. Para conhecer setores com grande potencial de aplicação vejam este artigo com 14 áreas sugeridas . Nesta análise em específico levamos em consideração perguntas típicas de gestores:

Quais os fatores que mais impactam no meu resultado?

Qual configuração ideal dos fatores (das variáveis) para se atingir o cenário com melhor desempenho?

Neste caso selecionamos 65 índices nacionais de 188 países para descobrir quais deles tem maior peso em relação ao Índice de Desenvolvimento Humano e quais cenários são criados pelas máquina. Para validar a precisão do algoritmo, plotamos no mapa os países de acordo com seu cenário.

As perguntas-chave desta análise:

  1. Quantos cenários de Índice de Desenvolvimento Humano existem no mundo e em quais cenários os países estão alocados?
  2. Entre os 65 índices, quais deles têm maior influência na variação do IDH?
  3. O que é o DNA de um cenário e como eles são utilizados para análise?

Bom, antes de ver os resultados, vejam todas variáveis analisadas abaixo. Então, tente descobrir intuitivamente quais seriam as repostas para pergunta 2. Esta é uma tarefa muito importante para a validação cenários. OK?

[…]

Como VORTX Big Data organiza o mundo?

Olá a todos, O objetivo deste post é mostrar o que acontece quando entregamos apenas números de 188 países à uma máquina (VORTX Big Data) e ele descobre por si só como eles devem ser organizados em diferentes caixas. Esta técnica é conhecida como análise de agrupamentos ou clustering! As questões que o artigo irá[…]

O que o VORTX Big Data diz sobre o quadro de medalhas olímpicas?

Aproveitando o clima de olimpíadas no Brasil, resolvi fazer uma análise de agrupamentos com o VORTX sobre os dados consolidados das medalhas distribuídas em Londres. Bom, então vamos lá!

Minerando os dados da votação do impeachment

Olá pessoal, O objetivo desse post é mostrar o que a computação e as abordagens de mineração de dados utilizados na área de Big Data podem gerar a partir dos dados da votação do processo de impeachment da presidente Dilma no dia 17 de abril de 2016. Então vamos lá, passo a passo! Passo 1: Coleta[…]