Insinyur Keandalan Situs Senior

Moledao

Negotiable
Remote5-10 Yrs ExpBachelorFull-time
Share

Remote Details

Open CountryWorldwide

Language RequirementsEnglish

Job Description

Show original text

Ringkasan

Kami sedang mencari Senior SRE Engineer (Fokus Operasi Dompet) untuk memastikan stabilitas, ketersediaan, dan performa infrastruktur inti bisnis kami di AWS. Peran ini mencakup pengelolaan lingkungan produksi global, membangun sistem yang skalabel dan sangat tersedia, menerapkan platform otomasi dan observabilitas, serta menjaga standar keamanan dan kepatuhan.


Tujuan Pekerjaan

  • Bertanggung jawab atas deployment.
  • Memastikan sistem berjalan andal, efisien, dan dalam skala besar.
  • Mengembangkan alat untuk meningkatkan uptime, performa, dan respons insiden.


Tanggung Jawab

  • Menjamin stabilitas, ketersediaan, dan performa infrastruktur global di AWS untuk operasi bisnis inti, serta memegang kepemilikan atas SLA produksi.
  • Merancang, mengoperasikan, dan memecahkan masalah komponen cloud-native seperti Kubernetes, Envoy, Service Mesh (Istio/Linkerd), dan ingress controller.
  • Meningkatkan efisiensi operasional melalui otomasi dan alat platform (IaC, CI/CD), mencapai observabilitas sistem, self-healing, dan pemulihan cepat dari insiden.
  • Menerapkan dan memelihara praktik keamanan operasional, termasuk kontrol akses (AWS IAM/K8s RBAC), kebijakan keamanan jaringan, manajemen kerentanan, dan respons insiden.
  • Membangun dan menyempurnakan sistem operasi global, termasuk perencanaan kapasitas, pemantauan dan alerting (Prometheus/ELK), pipeline CI/CD (GitLab/Jenkins), disaster recovery, dan pemulihan otomatis dari kegagalan.
  • Memahami arsitektur bisnis secara mendalam dan berpartisipasi dalam merancang solusi high-availability dan disaster recovery, dengan optimalisasi biaya secara berkelanjutan.


Kualifikasi

  • Pengalaman 5+ tahun di operasi Linux, SRE, atau DevOps, dengan keahlian dalam mengelola sistem terdistribusi berskala besar.
  • Maharah dalam layanan inti AWS (EC2, S3, VPC, IAM, ELB, RDS, dll.) dengan pengalaman arsitektur, operasional, dan optimisasi biaya.
  • Pengetahuan mendalam tentang arsitektur Kubernetes, termasuk pengelolaan, pemecahan masalah, dan tuning performa klaster produksi berskala besar.
  • Paham Envoy, Istio/Linkerd service mesh, atau Nginx/Istio ingress controller untuk manajemen lalu lintas L7.
  • Sadar dan berpengalaman dalam praktik keamanan operasional, termasuk kerentanan umum OS, jaringan, dan aplikasi serta langkah mitigasinya.
  • Maharah dalam minimal satu bahasa pemrograman (Go/Python/Shell) untuk menerapkan solusi otomasi bagi tantangan operasional.
  • Berpengalaman kuat dengan observability stack seperti Prometheus dan ELK, mampu membangun platform pemantauan yang efisien.
  • Terbukti berpengalaman dalam perencanaan kapasitas dan pengujian performa, dengan kemampuan mengukur bottleneck sistem dan merencanakannya sesuai kebutuhan.


Diutamakan:

  • Pengalaman mengelola tim SRE/tooling/platform.
  • Paham observability stack seperti Prometheus, Grafana, dan ELK.
  • Sertifikasi profesional seperti AWS (SAA/SAP), Kubernetes (CKA/CKE/CKS) merupakan nilai tambah.


Preview

Dorothy Mole

HR OfficerMoledao

Reply 1 Time Today

Posted on 23 December 2025

Moledao

<50 Employees

DAOs

View jobs hiring

Reporte

Recordatorio de seguridad del jefe

Si la posición requiere que trabajes en el extranjero, por favor ten cuidado y ten cuidado con el fraude.

Si encuentras a un empleador que tiene las siguientes acciones durante tu búsqueda de empleo, por favor repórtalo inmediatamente

  • retiene tu ID,
  • requiere que usted proporcione una garantía o recoja la propiedad,
  • le obliga a invertir o recaudar fondos.
  • recauda beneficios ilícitos,
  • u otras situaciones ilegales.
Tips
×

Some of our features may not work properly on your device.

If you are using a mobile device, please use a desktop browser to access our website.

Or use our app: Download App