Neste post mostramos mais um caso de estudo utilizando a Inteligência Artificial Vorteris com dados reais. Aqui demonstramos como a abordagem de descoberta de cenários pode ajudar a tomada de decisão de forma profunda em vários setores. Para conhecer algumas áreas com grande potencial de aplicação, veja este artigo com 14 áreas sugeridas. Nesta análise em específico levamos em consideração perguntas típicas de gestores:
Quais os fatores que mais impactam no meu resultado?
Qual configuração ideal dos fatores (das variáveis) para se atingir o cenário com melhor desempenho?
Neste caso selecionamos 65 índices nacionais de 188 países para descobrir quais deles tem maior peso em relação ao Índice de Desenvolvimento Humano e quais cenários são criados pelas máquina. Para validar a precisão do algoritmo, plotamos no mapa os países de acordo com seu cenário.
As perguntas-chave desta análise:
- Quantos cenários de Índice de Desenvolvimento Humano existem no mundo e em quais cenários os países estão alocados?
- Entre os 65 índices, quais deles têm maior influência na variação do IDH?
- O que é o DNA de um cenário e como eles são utilizados para análise?
Bom, antes de ver os resultados, vejam todas variáveis analisadas abaixo. Então, tente descobrir intuitivamente quais seriam as repostas para pergunta 2. Esta é uma tarefa muito importante para a validação cenários. OK?
As variáveis selecionadas para análise foram:
- Índice de Desenvolvimento Humano IDH-2014
- Coeficiente de Gini 2005-2013
- Taxa de natalidade entre adolescentes de 15-19 por 100k 2010-2015
- Registro de nascimento abaixo de 5 anos 2005-2013
- Crescimento das emissões de dióxido de carbono anual médio
- Emissões de dióxido de carbono per capita 2011 (toneladas)
- Alteração percentual de florestas florestas 1900-2012
- Alteração de uso de dispositivos móveis 2009-2014
- Índice de preços do consumidor 2013
- Crédito interno fornecido pelo setor financeiro 2013
- Índice doméstico de preços 2009-2014
- Índice de volatilidade doméstica de alimentos 2009-2014
- Taxa de electrificação da população (distribuição elétrica)
- Anos de escolaridade esperados – Anos
- Exportações e importações percentual GPD – 2013
- Taxa de suicídio feminino para cada 100k pessoas
- Investimento estrangeiro direto entradas líquidas porcentagem do PIB 2013
- Área de floresta Percentual da área total de terras 2012
- Combustíveis fósseis percentual do total 2012
- Retiradas de água doce 2005
- Índice de Desigualdade de gênero 2014
- Despesa das administrações públicas – o crescimento anual 2005 2013
- Despesa das administrações públicas – Percentual do PIB 2005-2013
- PIB 2013
- PIB per capta
- Formação bruta de capital fixo do PIB 2005-2013
- RNB – Rendimento Nacional Bruto per capita – 2011 Dólares
- Pessoas desabrigadas devido a desastres naturais 2005 2014 por milhões de pessoas
- Taxa de homicídios por 100 mil pessoas 2008-2012
- Mortalidade Infantil 2013 por milhares
- Entrada de turistas internacionais por milhares 2013
- Mobilidade internacional de estudantes em escolarização superior 2013
- Usuários de internet percentagem da população 2014
- Violência por parceiro íntimo 2001-2011
- Expectativa de vida à ao nascimento em anos
- Taxa de suicídio masculino 100k pessoas
- Taxa de mortalidade materna por 100 nascidos vivos 2013
- Média de anos de escolaridade – Anos
- Assinantes de telefonia móvel para cada 100 pessoas 2014
- Esgotamento dos recursos naturais
- Taxa de migração por 1k pessoas 2010-2015
- Médicos por 10k pessoas
- População afetada por desastres naturais média anual por milhão de pessoas 2005-2014
- Percentual da população vivendo em área degradada de terras 2010
- População percentual com ensino secundário 2005-2013
- Ensino Pré-primário 2008-2014
- Ensino Primária-2008-2014
- Taxa de abandono escolar no primário 2008-2014
- População carcerária para cada 100k pessoas
- Fluxos de capital privado porcentagem do PIB 2013
- Despesa pública em percentagem do PIB educação
- Percentual despesas de saúde pública do PIB 2013
- Proporção de alunos por professor na escola relação primária 2008-2014
- Refugiados por país de origem
- Remessas entradas PIB 2013
- Percentual de fontes renováveis 2012
- Despesa em Pesquisa e Desenvolvimento 2005-2012
- Percentual da população em edução secundária 2008-2014
- Percentual de Quotas de assentos no parlamento para mulheres 2014
- Percentual de estoque de imigrantes da população 2013
- Os impostos sobre o lucro de renda e ganho de capital 205 2013
- População com educação terciária -2008-2014
- Receita tributária total do PIB 2005-2013
- Taxa de tuberculose por milhares 2012
- Menores de cinco anos Mortalidade 2013 milhares
Fonte dos dados
Abaixo foram as organizações responsáveis por calcular e disponibilizar os indicadores:
- UNDESA 2015,
- Instituto de Estatística da UNESCO de 2015,
- United Divisão de Estatística das Nações de 2015,
- Banco Mundial de 2015,
- FMI de 2015.
Para aqueles com dúvidas sobre a classificação deste estudo e as diferenças entre BI (Business Intelligence, Mineração de dados e Big Data) recomendamos este artigo “7 características para diferenciar BI, Data Maning e Big Data“
Após pressionar o botão do Vorteris Discoverer:
Quais países pertencem a quais cenários?
Quais os fatores que mais influenciam o IDH?
Nas imagens abaixo está a relação dos fatores e o grau de influência na formação dos cenários de baixo e alto IDH. O único fator excluído por baixa correlação foi “Violência por parceiro íntimo 2001-2011”.
Taxa de desigualdade de gênero vs IDH
Curiosamente, entre os top 10 fatores, surge o índice de desigualdade de gênero que leva em consideração a diferença entre os direitos e obrigações entre homens e mulheres. Este indicador comparando os países de alto IDH contra os de baixo IDH. Uma possível explicação para esse fato pode ser que países mais avançados geram cada vez mais renda com menor trabalho físico, ao contrário dos países menos desenvolvidos que ainda são fortemente dependentes da agricultura e indústria pesada. Possivelmente estes fatores afetem diretamente o papel da mulher na sociedadee.
EUA vs Demais países com alto IDH
Reunindo todos os fatores em apenas uma visualização, temos o contraste das diferenças sistêmicas entre dois cenários que atingiram um alto nível de desenvolvimento humano. Para se entender a dinâmica desta visualização é necessário imaginar que o eixo X se altera automaticamente para a escala de cada índice quando o cursor do mouse é acionado. Como aqui temos apenas uma imagem estática, deixamos a escala do IDH selecionada.
Insights e conclusões do estudo
As possibilidades geradas por meio das de algoritmos de mineração de Dados – leia aqui sobre o que é Data Mining – são várias e nos concentramos em algumas perguntas para limitar o escopo. Durante esta pesquisa, interessante foi ver a máquina confirmando ou não algumas hipóteses e intuições anteriores, sobre tudo na questão 2. É importante mencionar que não medimos a causalidade entre os fatores, os resultados mostram correlações sistêmicas apenas, o que é um grande passo para definição de prioridades de gestão. Abaixo estão alguns que chamaram a atenção:
- Desigualdade de gênero desempenhando um papel forte e correlação inversa no Índice de Desenvolvimento Humano enquanto estamos vivendo uma transição da era industrial para a informação onde o conhecimento supera as diferenças físicas dos gêneros.
- Pesquisa e desenvolvimento possui alta influência no IDH assim como a eletricidade.
- Os Estados Unidos têm seu próprio cenário devido às suas características sistêmicas únicas.
- Despesa pública geral e despesa pública com educação apresentaram baixa influência.
Aplicações empresariais
Aplicando as mesmas perguntas que tivemos no início do artigo, agora vamos ver como eles se pareceriam para diferentes cenários de negócios:
Vendas
- Quantos cenários existem para suas vendas? Qual segmento de cliente pertence a cada cenário?
- Entre vários fatores de negócios, quais deles têm maior influência para definir uma receita Alta ou Baixa?
- Qual é o DNA (características) de um cenário de receita alta e baixa?
Indústria
- Quantos cenários de produção / manutenção existem para sua linha de produção? Quais processos pertencem a cada cenário?
- Entre vários fatores de produção, quais deles têm maior influência para definir um resultado Alto ou Baixo ou um custo / manutenção alto ou baixo?
- Qual é o DNA (características) de um cenário de produção / manutenção alto e baixo?
Saúde
- Quantos cenários de pacientes existem para uma doença ou condição médica específica? Quais pacientes pertencem a cada cenário?
- Entre várias características do paciente, quais delas têm maior influência para resultar em níveis altos ou baixos de uma doença ou condição médica específica?
- Qual é o DNA (características) dos cenários de boa e má condição médica?
Em suma, esperamos que este artigo possa ajudar a esclarecer um pouco mais sobre as novas possibilidades de análises geradas por inteligência artificial em uma abordagem diferente com dados importantes e reais.
Um grande diferencial desta análise é o fato de não ter sido necessário adicionar nenhum parâmetro para a máquina, todos esses insights foram extraídos automaticamente da planilha com os dados formatados – leia aqui sobre o que é dataset.
Quem é a Aquarela Analytics?
A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial Corporativa na indústria e em grandes empresas. Por meio da plataforma Vorteris, da metodologia DCM e o Canvas Analítico (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania, Mercedes-Benz, Grupo Randon (automotivo), SolarBR Coca-Cola (varejo alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Auren, SPIC Brasil (energia), Telefônica Vivo (telecomunicações), dentre outros.
Acompanhe os novos conteúdos da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!
Autores
Fundador e Diretor Comercial da Aquarela, Mestre em Business Information Technology com especialização em logística – Universiteit Twente – Holanda. Escritor e palestrante na área de Ciência e Governança de Dados para indústria e serviços 4.0.
Fundador da Aquarela, CEO e arquiteto da plataforma Vorteris. Mestre em Engenharia e Gestão do Conhecimento, entusiasta de novas tecnologias, tendo expertise em linguagem funcional Scala e em algoritmos de Machine Learning e IA.
2 Comments
Seria possível disponibilizar a planilha de dados? Bom artigo!
Olá Kleyn, sim certamente. Você pode baixar neste site – https://www.kaggle.com/joniarroba/65-world-indexes-gathered