Deskripsi Pekerjaan
Bergabunglah dengan tim kami di TechSol Indonesia untuk membangun sistem yang andal dan skalabel! Kami mencari Insinyur Keandalan yang berpengalaman untuk mengoptimalkan infrastruktur cloud dan memastikan ketersediaan layanan 99.99%. Anda akan berperan penting dalam transformasi DevOps kami dan membentuk budaya engineering excellence.
Tanggung Jawab
- Mengembangkan dan mengelola sistem monitoring observabilitas dengan Prometheus/Grafana
- Mengimplementasikan strategi automation CI/CD dengan Jenkins/GitLab CI
- Merancang arsitektur fault-tolerant untuk microservices di AWS/GCP
- Melakukan post-mortem analisis incident dan membangun SLO/SLI
- Optimalkan performa sistem dengan chaos engineering dan load testing
- Mentor tim junior dalam praktik SRE terbaik
Kualifikasi
- S1 Teknik Informatika/Rekayasa Perangkat Lunak dengan min. 3 tahun pengalaman
- Pengalaman praktis dengan Kubernetes, Terraform, dan CloudFormation
- Kemampuan analisis data dengan SQL dan scripting (Python/Bash)
- Memahami konsep SRE: SLI/SLO, Error Budgets, dan Incident Response
- Sertifikasi AWS/GCP Certified DevOps Engineer atau SRE
- Kemampuan komunikasi lisan dan tulisan yang luar biasa dalam Bahasa Inggris