Company DescriptionAlter Solutions Portugal is an IT Consultancy Company, promoter of Digital Transformation, part of the Alter Solutions Group, created in 2006, in Paris.In 2022, Alter Solutions joined the act digital group, constituting a global community of talent in Technology, with presence in twelve countries: Germany, Belgium, Brazil, Canada, United States of America, Morocco, Spain, France, Luxembourg, Poland, Portugal and Serbia.
Also in 2022, we were certified as a Great Place to Work.In Portugal, we partner with over 120 clients and a team of over 500 people, working in projects for industries as diverse as banking, insurance, transportation, aviation, energy, and telecom.Headquarters of the Nearshore IT center, Alter Solutions Portugal has a dedicated team of around 30 specialized professionals, integrated into projects with several internationally renowned clients.Job DescriptionObservability Architect (ou arquiteto de observabilidade) é o profissional responsável por definir, projetar e implementar a estratégia de observabilidade de sistemas em uma organização.
O foco é garantir que aplicações, infraestruturas e serviços sejam monitoráveis de forma eficiente, possibilitando deteção proativa de problemas, troubleshooting rápido e melhoria contínua da performance.Principais responsabilidades:Desenhar a arquitetura de observabilidade:Definir como logs, métricas e traces serão coletados, armazenados e visualizados.Escolher ferramentas adequadas (como Prometheus, Grafana, OpenTelemetry, Elastic Stack, Datadog, New Relic, etc.
).Integrar soluções com pipelines CI/CD e infraestruturas em nuvem (AWS, Azure, GCP).Implementar padrões de instrumentação:Garantir que aplicações estejam corretamente instrumentadas para gerar métricas, logs e traces relevantes.Trabalhar com engenheiros de software e SREs para definir boas práticas de observabilidade no código.Definir KPIs e SLIs/SLOs:Trabalhar com times de produto, DevOps e negócios para mapear indicadores que reflitam a saúde do sistema (ex: latência, disponibilidade, erros, throughput).Automatizar e escalar a observabilidade:Criar automações para onboarding de novos serviços na stack de observabilidade.Desenvolver dashboards e alertas eficientes que evitem ruído (alert fatigue).Fomentar cultura de observabilidade:Educar os times sobre a importância da observabilidade para confiabilidade e performance.Liderar iniciativas de melhoria contínua da visibilidade dos sistemas.Skills e conhecimentos comuns:Ferramentas: Prometheus, Grafana, Loki, Jaeger, OpenTelemetry, Elastic Stack, Datadog, New Relic, Splunk, etc.Conceitos: Telemetria, tracing distribuído, métricas, logs estruturados, SRE, DevOps, SLIs/SLOs/SLAs.Linguagens e Infra: Experiência com containers (Docker, Kubernetes), pipelines CI/CD, APIs, eventualmente programação (Go, Python, Java).Cloud e automação: AWS CloudWatch, Azure Monitor, Terraform, Ansible, etc.A oportunidade é hibrida no Porto.