Deskripsi Pekerjaan
Kami mencari Site Reliability Engineer berpengalaman untuk bergabung dengan tim infrastruktur kami di Jakarta. Anda akan menjadi bagian integral dalam memastikan sistem berjalan dengan lancar dan dapat diandalkan, menerapkan praktik DevOps terbaik untuk meningkatkan skalabilitas dan ketersediaan layanan. Bergabunglah dengan kami untuk membentuk masa depan teknologi Indonesia dengan solusi inovatif!
Tanggung Jawab
- Mengelola dan mengoptimalkan infrastruktur cloud (AWS/GCP/Azure) untuk performa maksimal
- Menerapkan otomasi CI/CD pipeline untuk deployment yang efisien
- Memantau sistem dengan tools monitoring canggih (Prometheus, Grafana)
- Merancang solusi disaster recovery dan high-availability
- Melakukan troubleshooting insiden dengan root cause analysis mendalam
- Mengembangkan dokumentasi teknis dan runbooks operasional
- Memimpin proyek skala besar untuk migrasi atau peningkatan sistem
Kualifikasi
- Sarjana Teknik Informatika atau bidang terkait dengan min. 3 tahun pengalaman
- Keahlian dalam scripting (Python/Go/Bash) dan konfigurasi as-code (Terraform)
- Pemahaman mendalam tentang Linux, jaringan, dan arsitektur microservices
- Pengalaman praktis dengan container orchestration (Kubernetes)
- Sertifikasi cloud (AWS/GCP/Azure) menjadi nilai tambah
- Kemampuan analitik tingkat lanjut untuk memecahkan masalah kompleks
- Experience dengan observability tools (Datadog/New Relic)