Deskripsi Pekerjaan
Kami sedang mencari Site Reliability Engineer (SRE) berbakat untuk bergabung dengan tim teknologi kami. Di PT Inovasi Digital Global, kami menghadapi skala transaksi yang besar setiap hari, dan keandalan infrastruktur kami adalah prioritas utama. Anda akan menjadi garda terdepan dalam memastikan layanan kami tersedia 24/7 dengan standar kualitas tertinggi.
Sebagai SRE, Anda tidak hanya akan memperbaiki sistem yang rusak, tetapi juga membangun sistem yang tangguh. Anda akan berkolaborasi erat dengan tim Engineering, Product, dan Security untuk mengimplementasikan praktik DevOps terbaik dan otomatisasi tingkat lanjut.
Tanggung Jawab
- Merancang, mengimplementasikan, dan mengelola infrastruktur cloud (AWS/GCP) yang scalable, aman, dan efisien.
- Mengembangkan dan mengotomatisasi alur kerja CI/CD (GitOps) untuk mempercepat pengiriman perangkat lunak (Release) secara konsisten.
- Memantau kesehatan sistem secara real-time, melakukan diagnosa insiden, dan merespons emergensi teknis dengan cepat dan tepat.
- Optimasi performa aplikasi dan database untuk memastikan latensi rendah dan throughput tinggi.
- Mengelola pemantauan observability menggunakan tools seperti Prometheus, Grafana, dan ELK Stack.
- Menerapkan praktik keamanan siber dan manajemen risiko secara berkelanjutan untuk melindungi aset perusahaan.
- Membangun dan memelihara infrastruktur sebagai kode (IaC) menggunakan Terraform.
Kualifikasi
- Sertifikat atau gelar Sarjana (S1) dalam Ilmu Komputer, Teknik Informatika, atau bidang terkait.
- Pengalaman minimal 3-5 tahun dalam peran Site Reliability Engineer, DevOps Engineer, atau Cloud Engineer.
- Penguasaan teknis yang kuat dalam Linux/Unix dan scripting (Python, Bash, atau Go).
- Pengalaman praktis dengan containerization (Docker, Kubernetes) dan orchestration.
- Familiaritas dengan platform Cloud (AWS, GCP, atau Azure) dan manajemen database (PostgreSQL, MongoDB).
- Memahami prinsip Cloud Native, microservices, dan serverless computing.