A Oskon.Tech é uma empresa especializada em engenharia de software e serviços profissionais de TI, parte de um grupo com mais de 20 anos de experiência no mercado de TI. Somos apaixonados por ajudar empresas a atingir o próximo nível através do desenvolvimento tecnológico e da transformação digital, combinando flexibilidade e criatividade para entregar soluções digitais robustas. Grandes empresas e marcas globais confiam nos nossos engenheiros altamente qualificados para desenvolver soluções tecnológicas excecionais.
Desde consultoria a planeamento estratégico, desenvolvimento, integrações avançadas e soluções personalizadas, especializamo-nos em entregar resultados. A nossa missão é fornecer soluções tecnológicas de elevada qualidade, ágeis e eficientes, proporcionando uma experiência superior ao utilizador e construindo relações de confiança duradouras.
Sediados em Lisboa, somos especialistas em talento, atraindo os melhores profissionais e ligando-os aos projetos mais ambiciosos no momento certo. O nosso sucesso resulta do investimento na inovação, do foco nos resultados e, acima de tudo, do compromisso com o bem-estar e a satisfação da nossa equipa.
Saiba mais sobre nós em www.oskon.tech.
Descrição da oportunidade:
Estamos à procura de um Site Reliability Engineer (SRE) para integrar a nossa equipa num dos nossos maiores parceiros, uma empresa de referência com projetos tecnológicos inovadores e presença em várias geografias.
Nesta função, vais integrar a equipa responsável por assegurar a entrega e operação de infraestruturas escaláveis, seguras e altamente disponíveis, com forte foco em ambientes Azure e Kubernetes. Terás um papel fundamental na automação de processos, na implementação de boas práticas de observabilidade e na colaboração direta com as equipas de desenvolvimento para garantir a fiabilidade e performance das plataformas em produção.
Responsabilidades:
* Desenhar, implementar e manter infraestruturas escaláveis, seguras e altamente disponíveis, com foco em Azure.
* Gerir clusters Kubernetes (preferencialmente AKS), assegurando performance, escalabilidade e segurança.
* Implementar e gerir soluções de Infrastructure as Code (IaC) com Terraform.
Observabilidade
* Implementar e manter soluções de monitorização, logging e alerting para garantir a fiabilidade da infraestrutura e a rápida resolução de incidentes.
* Utilizar ferramentas como Datadog (ou equivalentes) para melhorar a visibilidade das plataformas.
* Colaborar com as equipas de desenvolvimento para definir e monitorizar Service Level Indicators (SLIs), Service Level Objectives (SLOs) e Error Budgets.
Colaboração com Equipas de Desenvolvimento
* Trabalhar em estreita colaboração com as equipas de desenvolvimento para garantir que a infraestrutura responde aos requisitos das aplicações e às necessidades de performance.
* Prestar orientação técnica sobre as melhores práticas de deployment, escalabilidade e fiabilidade.
* Atuar como facilitador entre operações e desenvolvimento, promovendo uma verdadeira cultura DevOps.
* 3 anos de experiência em funções de Site Reliability Engineer (SRE).
* Sólidos conhecimentos em serviços Azure, incluindo networking, storage e compute.
* Experiência prática com Kubernetes (preferencialmente AKS), incluindo gestão e troubleshooting de clusters.
* Experiência comprovada em Infrastructure as Code (IaC) com Terraform.
* Conhecimento sólido de princípios de observabilidade e experiência com ferramentas como Datadog.
* Competências em scripting (Bash, Python ou PowerShell).
Porquê trabalhar connosco:
* Oportunidade de trabalhar com tecnologias emergentes.
* Possibilidade de trabalho remoto.
* Definição do teu próprio percurso profissional.
* Acesso a formação contínua e certificações.
* Crescimento através do nosso programa de mobilidade interna.
* ... e muito mais!
#J-18808-Ljbffr