Todo Analista de Infraestrutura, DevOps ou mesmo o próprio Analista de Monitoramento desenvolve um plano de monitoramento para um serviço e inclui alguns objetivos de monitoramento.
O primeiro objetivo é garantir que os consumidores de monitoramento dentro da organização de T.I atinjam um alto nível de conforto ou de confiança com a solução que está sendo planejada para eles assim que possível.
O outro objetivo é avaliar continuamente os SLOs (Objetivos de nível de serviço) e os SLIs (indicadores de nível de serviço) correspondentes para o serviço específico e se esforçar para otimizá-los por meio de iterações de planejamento.
Como a observabilidade e o monitoramento têm bastante ligação, há uma distinção entre eles. O monitoramento coleta informações e informa que detectou um problema com base foi configurado para monitorar tais condições. Simplesmente declarado, onde é monitorado falhas conhecidas ou previsíveis.
Já a observabilidade é mais focada em combinar todos os dados coletados por suas ferramentas de monitoramento e buscar oportunidades para entender o comportamento desses sistemas. Por sua vez, pode ser usado este conhecimento para ajustar ainda mais o monitoramento detectando os sintomas e condições.
Por que a observabilidade é tão importante
A observabilidade é o primeiro paradigma do consumidor de monitoramento, pois ele reconhece o que é considerado ou percebido como operação normal de um serviço. Em outras palavras, ele busca visibilidade total, um princípio de monitoramento chave, assim que possível.
Assim que a observabilidade é alcançada, com base nesse nível inicial de visibilidade para desenvolver alertas acionáveis, é criado painéis úteis e avaliações de soluções AIOps (um acrônimo de “Artificial Intelligence for IT Operations”, ou seja, inteligência artificial para operações de TI). Isso acaba fornecendo tempo para que os analistas se sintam confortáveis com a métrica subjacente e os dados de monitoramento de logs.
A visibilidade total significa apenas alcançar e sustentar, porém a visibilidade suficiente contém três dimensões ou aspectos:
- Monitoramento em profundidade
- Monitoramento em amplitude
- Monitoramento em todo o modelo de integridade
Um analista de observabilidade não apenas foca na T.I, mas sim em garantir que os usuários finais possam consumir o conteúdo e que os SLOs sejam atendidos.
Monitoramento de sistemas e observabilidade
O monitoramento da infraestrutura e dos aplicativos é bastante complexo, mesmo com a computação em nuvem sendo mais presente em nosso dia a dia, o influenciamento do monitoramento na nuvem vem ganhando mais força e deixando o nível de complexibilidade bem mais alto e necessário.
Para arquitetos, o diagnóstico forma um núcleo de sua exploração de estruturas de monitoramento nativas de nuvem mais econômicas que permitem que o TI gerencie serviços em diferentes modelos de nuvem.
Os arquitetos precisam, como os operadores, entender quais informações de diagnóstico um componente de infraestrutura ou um aplicativo emite. Combinar fluxos de log multivariados, dinâmicos, de série temporal, com eventos, com estado e telemetria em uma inteligência valiosa depende do seguinte:
- Conhecimento e experiência da pessoa desenvolvedora ou engenheira de software, que tenha um entendimento profundo do destino de monitoramento.
- Experiência de solução de problemas e suporte reais usando os dados para encontrar problemas ou localizar as causas de problemas
- Revisão de incidentes anteriores para encontrar motivos não tecnológicos que podem ser corrigidos automaticamente mais tarde.
Na nuvem, o analista tem uma flexibilidade enorme nos tipos de serviços que pode escolher. O monitoramento inclui como eles mudam ao longo do tempo e podem ser dinâmicos, globais e resilientes.
Diferença entre Monitoramento e Observabilidade
A observabilidade funciona de modo em que as plataformas descobrem e coletam telemetrias de desempenho. São encontradas em quatro tipos de telemetria:
- Logs: são registros granulares, com carimbos de data/hora, completos e inalterável de eventos de aplicativos.
- Métricas: são medidas fundamentais da integridade do aplicativo e dos sistemas durante um determinado período de tempo.
- Rastreamento: registram a jornada ponta a ponta de cada solicitação do usuário.
- Dependências: revelam como cada componente do aplicativo depende de outros componentes, aplicativos e recursos de TI.
Já o monitoramento significa observar e verificar um progresso ou qualidade de algo por um certo período de tempo. A monitoração foi mudando conforme a infraestrutura e ferramentas disponíveis ao longo do tempo.
Como medir o monitoramento e a observabilidade
Ao implementar um sistema de monitoramento e observabilidade dentro da organização, é necessário acompanhar algumas métricas internas para visualizar o desempenho.
Existem algumas opções que podem ser acompanhadas com uma pesquisa mensal ou possivelmente analisar automaticamente os registros de alerta.
- Alterações feitas no monitoramento da configuração. Quantas solicitações de pull ou alterações por semana são feitas no repositório que contém a configuração de monitoramento? e com que frequência essas alterações são enviadas ao sistema de monitoramento?
- Alterações de ‘Fora do horário de funcionamento’. Verificar qual porcentagem dos alertas é gerenciada a noite. Em algumas empresas globais têm um modelo de suporte 24 horas, o que não torna isso um problema, mas pode indicar que não foi dada atenção suficiente aos principais indicadores de falhas.
- Falsos positivos. Quantos alertas resultaram em nenhuma ação ou foram marcados como ‘Trabalhando como pretendido’.
- Falsos negativos. Quantas falhas do sistema ocorreram sem alerta ou alerta depois do esperado.
- Alertas não funcionais. Qual porcentagem de alertas foi considerada ‘não aceitável’. Ou seja, o analista alertado não consegue tomar nenhuma medida imediata, devido a incapacidade de entender a implicação do alerta ou devido a um problema conhecido.
Conclusão – Monitoramento e Observabilidade
Quando se aplica a observabilidade e o monitoramento, os benefícios são imensos dentro da sua empresa, fazendo com que a inovação e implementação andem lado a lado deixando tudo mais rápido, custos reduzidos e melhor compreensão de como priorizar seu tempo e atenção dentro dos aplicativos.
Tudo isso leva a um entendimento mais profundo dos dados, sistemas e dos clientes. Além de agregar o crescimento nos negócios a medida que se tem visualizaçẽos em tempo real de como o sistema funciona.
Quem é a Aquarela Analytics?
A Aquarela Analytics é vencedora do Prêmio CNI de Inovação e referência nacional na aplicação de Inteligência Artificial Corporativa na indústria e em grandes empresas. Por meio da plataforma Vorteris, da metodologia DCM e o Canvas Analítico (Download e-book gratuito), atende clientes importantes, como: Embraer (aeroespacial), Scania, Mercedes-Benz, Grupo Randon (automotivo), SolarBR Coca-Cola (varejo alimentício), Hospital das Clínicas (saúde), NTS-Brasil (óleo e gás), Auren, SPIC Brasil (energia), Telefônica Vivo (telecomunicações), dentre outros.
Acompanhe os novos conteúdos da Aquarela Analytics no Linkedin e assinando a nossa Newsletter mensal!
Autor
DevSecOps Engineer na Aquarela Advanced Analytics. Formação Superior em Análise e Desenvolvimento de Sistemas e Pós-Graduando em DevOps and Cloud Computing. Apaixonado pela Cultura DevOps e entusiasta nas seguintes stacks tecnológicas: Cloud – AWS and GCP; Infraestrutura como Código – Terraform and Ansible; Containers – Docker and Kubernetes; Repositórios de código – Gitlab, Git and GitHub; Monitoramento – Grafana and Prometheus;