Há grande valor em representar a realidade por meio de visualizações, sobretudo as informações espaciais. Se você já viu um mapa, sabe que os polígonos que constituem os limites políticos de cidades e Estados são geralmente irregulares (ver Figura 1a). Essa irregularidade dificulta a condução de análises e, por isso, não pode ser tratada por ferramentas de Business Intelligence tradicionais.
Repare o ponto verde na Figura 1b, ele está sobre o polígono (‘bairro’) n.14, situado entre n.16 e n.18. Então responda agora: qual região está exercendo maior influência no ponto verde? É o bairro n.16 ou o n.18? O ponto verde é representativo pela região n.14, região n.16 ou n.18?
Para responder questões como essas e para minimizar o viés gerado por visualizações com polígonos irregulares, a Plataforma Vorteris faz o que se conhece por Normalização da Geografia, transformando os polígonos irregulares em polígonos de tamanho único e formato regular (ver Figura 1c).
Após a “normalização geográfica”, é possível analisar os dados de determinado espaço por meio de estatísticas absolutas, não somente relativas, e sem distorções provocadas por polígonos de tamanhos e formatos distintos.
Diariamente, pessoas, empresas e governos realizam inúmeras decisões considerando o espaço geográfico. Qual academia é mais perto de casa para eu me matricular? Em qual local devemos instalar o novo Centro de Distribuição da empresa? Ou, onde o Município deve posicionar as centrais do SAMU?
Assim, no artigo de hoje, propomos duas perguntas:
- O que acontece quando as informações georreferenciadas estão distorcidas?
- Quão próximo podem chegar nossas generalizações sobre o espaço?
Normalização geográfica
Trabalhando com polígonos e regiões
Lembrando que o conceito de polígono é derivado da geometria, sendo definido como: “uma figura plana, fechada e formada por segmentos de reta“. Quando o polígono possui todos os lados iguais e, consequentemente, todos os ângulos iguais, podemos chamá-lo de polígono regular. Quando isso não acontece, este é definido como um polígono irregular.
Fazemos o uso da divisão política da organização do território para entender seus contrastes, delimitando entre Nações, Estados e Municípios, por exemplo, mas também podemos delimitar regiões segundo diversas características, como a região da Caatinga, a região da Bacia Amazônica e até mesmo a zona do Euro ou zonas de eleitores do Trump e Biden. Enfim, basta cercar determinado local do espaço por alguma característica em comum. Os polígonos regionais, portanto, são extensamente utilizados para representar determinadas regiões ou a organização do território dessas regiões.
Diversas ferramentas de mercado preenchem polígonos com tonalidades distintas de cores, de acordo com os dados da região, buscando por contrastes entre estes. Mas, cuidado! No caso dos tamanhos e formatos dos polígonos não serem constantes, pode haver vieses geográficos, tornando a visualização passível a interpretações errôneas.
Dessa forma, a abordagem de polígonos se torna limitada nos seguintes aspectos:
- Comparações entre regiões de forma desigual;
- Necessidade de relativização de indicadores por número da população, área ou outros fatores;
- Não permite análises mais granulares;
- Demanda mais atenção dos analistas ao criarem afirmações sobre determinadas regiões.
Finalidade da normalização geográfica
Portanto, a razão de existir da normalização geográfica é a superação dos problemas típicos associados a análises de dados relacionadas aos polígonos irregulares, transformando a organização do território em um conjunto de polígonos (no caso, hexágonos) de tamanho e formato regulares.
No exemplo abaixo, comparamos as duas abordagens;
1) Análise com polígonos de mesorregiões e; 2) Hexágonos sobre a região sudeste do Brasil.
A Normalização Geográfica busca minimizar possíveis distorções de análise gerados por polígonos irregulares ao substituí-los por polígonos de formato e tamanho regulares. Isso proporciona uma alternativa elegante, agradável aos olhos e precisa, capaz de evidenciar padrões inicialmente desconhecidos.
A normalização deixa mais claro e simples a definição de vizinhança entre os polígonos, inclusive, promovendo melhor aderência aos algoritmos de inteligência artificial que buscam padrões e eventos que se autocorrelacionam no espaço.
Afinal, de acordo com Primeira Lei da Geografia:
“Todas as coisas estão relacionadas com todas as outras, mas coisas próximas estão mais relacionadas do que coisas distantes.”
Waldo Tobler
A normalização geográfica pode também ser feita de diferentes formas, como por triângulos equiláteros, quadrados ou hexágonos. No entanto, o hexágono proporciona o menor viés, dentre esses, devido ao menor tamanho de suas paredes laterais.
Com a normalização, torna-se possível a sumarização das estatísticas dos pontos (habitantes, residências, escolas, unidades de saúde, supermercados, indústrias, etc.) contidos dentro desses hexágonos de modo a haver constância na área de análise e, claro, significância estatística dessas sumarizações. Empresas de analytics maduras, com um datalake robusto e bem consolidado, passam a ter a vantagem nesse tipo de abordagem. Confira também nosso artigo sobre Como escolher uma empresa de analytics.
Utilização da geografia normalizada
A geografia normalizada pode também ser utilizada por meio de mapas interativos. Mapas desse tipo possibilitam um nível de aproximação bastante interessante nas análises, como podemos ver na animação abaixo, onde mostramos uma visualização da Plataforma Vorteris que apresenta as escolas na cidade de Curitiba.
Quanto mais escuro o hexágono, maior a quantidade de escolas. Perceba que também podemos ter acesso a outros dados através do pop-up e alterar o tamanho do hexágono a gosto.
“Quanto maior a quantidade de dados pontuais disponíveis em uma região, menor o tamanho possível dos hexágonos”.
Limitações da análise normalizada
Como toda a representação da realidade, modelos que utilizam a análise normalizada – apesar de grande valia na tomada de decisão – não substituem por completo a ilustração dos dados espaciais em polígonos irregulares, sobretudo quando:
- Há uma divisão política clara a ser considerada;
- Não há razoável volume de dados;
- Não há um consenso sobre o tamanho dos polígonos regulares.
Além disso, o processamento computacional para produzir mapas normalizados também deve ser levado em consideração, posto que o processamento dos dados nesse não se resume ao número de observações do fenômeno analisado, mas também ao tratamento da geografia sob análise. Por exemplo, workstations ou notebooks convencionais podem levar horas para processar cálculos geoestatísticos básicos das 5573 cidades do Brasil.
Conclusões e recomendações
Nesse artigo explicamos sobre normalização geográfica, sua importância, vantagens e cuidados para condução de análises espaciais. Além disso, comparamos duas abordagens importantes para análises de dados espaciais. Vale notar que essas abordagens se mostram complementares para haver um melhor entendimento da distribuição dos dados sobre o espaço. Portanto, recomendamos a visualização das análises em múltiplas facetas.
Percebemos que, ao desenhar o espaço geográfico de forma equânime, torna-se factível uma série de benefícios às análises, tais como:
- Alinhar o tamanho das visualizações de acordo com a necessidade do negócio;
- Adaptar as visualizações conforme a disponibilidade dos dados;
- Poder fazer comparativos “justos” entre os indicadores absolutos de cada região;
- Observar zonas de intensidade com menor viés;
- Simplificar a definição de vizinhança entre os polígonos, proporcionando, assim, melhor aderência a algoritmos espaciais;
- Encontrar padrões e eventos que se autocorrelacionam no espaço com maior acurácia;
- Utilizar algoritmos de inteligência artificial (supervisionados e não supervisionados) para assim identificar pontos de interesse que não seriam identificados sem a normalização. Mais informações em: Aplicação de Inteligência Artificial em análises georreferenciadas.
Por fim: toda ferramenta tem um propósito, as visualizações georreferenciadas podem levar a decisões ruins ou boas.
Dessa forma, usar a visualização correta, em conjunto com os algoritmos certos e bem implementados, a partir de um processo de analytics adequado, podem potencializar decisões críticas que levarão a grandes vantagens competitivas tão importantes frente aos desafios econômicos atuais.
Quem é a Aquarela Analytics?
A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial Corporativa na indústria e em grandes empresas. Por meio da plataforma Vorteris, da metodologia DCM e o Canvas Analítico (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania, Mercedes-Benz, Grupo Randon (automotivo), SolarBR Coca-Cola (varejo alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Auren, SPIC Brasil (energia), Telefônica Vivo (telecomunicações), dentre outros.
Acompanhe os novos conteúdos da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!
Autores
Graduado em Ciências Econômicas (UFSC). Competência em programação e análise de dados em R e especialidade em frameworks de visualizações dinâmicas e dashboards de analytics.
Mestre em Engenharia de Produção com graduação em Engenharia de Transportes e Logística. Durante o mestrado, se aprofundou nas áreas de macrologística e economia regional, e desenvolveu pesquisas nas áreas de logística reversa, relocalização de cadeias produtivas, terceirização logística e pesquisa operacional.
Fundador e Diretor Comercial da Aquarela, Mestre em Business Information Technology com especialização em logística – Universiteit Twente – Holanda. Escritor e palestrante na área de Ciência e Governança de Dados para indústria e serviços 4.0.