Deskripsi Pekerjaan
PT Teknologi Digital Nusantara mencari Site Reliability Engineer berbakat untuk bergabung dengan tim kami di Jakarta. Sebagai SRE, Anda akan bertanggung jawab untuk memastikan ketersediaan dan kinerja sistem kami dengan menerapkan praktik terbaik dalam DevOps dan SRE. Kami mencari profesional yang memiliki pengalaman dalam mengelola infrastruktur cloud, otomatisasi, dan pemantauan sistem.
Tanggung Jawab
- Mengelola dan memantau infrastruktur cloud (AWS, GCP, atau Azure) dengan fokus pada ketersediaan dan performa.
- Mengembangkan dan menerapkan praktik otomatisasi untuk meningkatkan efisiensi operasional.
- Membuat dan memelihara dokumentasi teknis untuk sistem dan proses operasional.
- Menangani insiden dan perbaikan cepat untuk meminimalkan downtime.
- Mengoptimalkan kinerja sistem dengan menerapkan praktik SRE seperti Error Budgets dan SLIs.
- Bekerja sama dengan tim pengembangan untuk memastikan kualitas layanan.
- Mengikuti tren teknologi terbaru dalam DevOps dan SRE.
- Menyediakan dukungan teknis untuk tim internal dan eksternal.
Kualifikasi
- Pengalaman minimal 3 tahun sebagai Site Reliability Engineer atau peran serupa.
- Paham dalam mengelola infrastruktur cloud (AWS, GCP, atau Azure).
- Pengalaman dalam otomatisasi (Terraform, Ansible, atau Kubernetes).
- Familiar dengan praktik SRE seperti Error Budgets, SLIs, dan SLAs.
- Kemampuan dalam pemantauan dan logging (Prometheus, Grafana, ELK Stack).
- Pengalaman dalam CI/CD pipelines (Jenkins, GitLab CI, atau GitHub Actions).
- Bersedia bekerja di lingkungan yang dinamis dan berorientasi pada solusi.
- Bahasa Inggris yang baik (minimal intermediate) untuk komunikasi internasional.