Insinyur Keandalan Situs Senior

Moledao

Bisa Dirundingkan
Jarak jauh5-10 Tahun KedaluwarsaS1Penuh waktu
Bagikan

Detail Jarak Jauh

Negara terbukaDi seluruh dunia

Persyaratan BahasaInggris

Deskripsi Pekerjaan

Tampilkan teks asli

Ringkasan

Kami sedang mencari Senior SRE Engineer (Fokus Operasi Dompet) untuk memastikan stabilitas, ketersediaan, dan performa infrastruktur inti bisnis kami di AWS. Peran ini mencakup pengelolaan lingkungan produksi global, membangun sistem yang skalabel dan sangat tersedia, menerapkan platform otomasi dan observabilitas, serta menjaga standar keamanan dan kepatuhan.


Tujuan Pekerjaan

  • Bertanggung jawab atas deployment.
  • Memastikan sistem berjalan andal, efisien, dan dalam skala besar.
  • Mengembangkan alat untuk meningkatkan uptime, performa, dan respons insiden.


Tanggung Jawab

  • Menjamin stabilitas, ketersediaan, dan performa infrastruktur global di AWS untuk operasi bisnis inti, serta memegang kepemilikan atas SLA produksi.
  • Merancang, mengoperasikan, dan memecahkan masalah komponen cloud-native seperti Kubernetes, Envoy, Service Mesh (Istio/Linkerd), dan ingress controller.
  • Meningkatkan efisiensi operasional melalui otomasi dan alat platform (IaC, CI/CD), mencapai observabilitas sistem, self-healing, dan pemulihan cepat dari insiden.
  • Menerapkan dan memelihara praktik keamanan operasional, termasuk kontrol akses (AWS IAM/K8s RBAC), kebijakan keamanan jaringan, manajemen kerentanan, dan respons insiden.
  • Membangun dan menyempurnakan sistem operasi global, termasuk perencanaan kapasitas, pemantauan dan alerting (Prometheus/ELK), pipeline CI/CD (GitLab/Jenkins), disaster recovery, dan pemulihan otomatis dari kegagalan.
  • Memahami arsitektur bisnis secara mendalam dan berpartisipasi dalam merancang solusi high-availability dan disaster recovery, dengan optimalisasi biaya secara berkelanjutan.


Kualifikasi

  • Pengalaman 5+ tahun di operasi Linux, SRE, atau DevOps, dengan keahlian dalam mengelola sistem terdistribusi berskala besar.
  • Maharah dalam layanan inti AWS (EC2, S3, VPC, IAM, ELB, RDS, dll.) dengan pengalaman arsitektur, operasional, dan optimisasi biaya.
  • Pengetahuan mendalam tentang arsitektur Kubernetes, termasuk pengelolaan, pemecahan masalah, dan tuning performa klaster produksi berskala besar.
  • Paham Envoy, Istio/Linkerd service mesh, atau Nginx/Istio ingress controller untuk manajemen lalu lintas L7.
  • Sadar dan berpengalaman dalam praktik keamanan operasional, termasuk kerentanan umum OS, jaringan, dan aplikasi serta langkah mitigasinya.
  • Maharah dalam minimal satu bahasa pemrograman (Go/Python/Shell) untuk menerapkan solusi otomasi bagi tantangan operasional.
  • Berpengalaman kuat dengan observability stack seperti Prometheus dan ELK, mampu membangun platform pemantauan yang efisien.
  • Terbukti berpengalaman dalam perencanaan kapasitas dan pengujian performa, dengan kemampuan mengukur bottleneck sistem dan merencanakannya sesuai kebutuhan.


Diutamakan:

  • Pengalaman mengelola tim SRE/tooling/platform.
  • Paham observability stack seperti Prometheus, Grafana, dan ELK.
  • Sertifikasi profesional seperti AWS (SAA/SAP), Kubernetes (CKA/CKE/CKS) merupakan nilai tambah.


Preview

Dorothy Mole

HR OfficerMoledao

Balas Hari Ini 1 Kali

Diposting di 23 December 2025

Moledao

<50 Karyawan

DAOs

Lihat perekrutan pekerjaan

Laporkan

Pengingat Keamanan Bossjob

Jika posisi tersebut mengharuskan Anda bekerja di luar negeri, harap waspada dan waspada terhadap penipuan.

Jika Anda bertemu dengan perusahaan yang melakukan tindakan berikut selama pencarian kerja Anda, tolong segera laporkan

  • menahan ID Anda,
  • mengharuskan Anda untuk memberikan jaminan atau mengumpulkan properti,
  • memaksa Anda untuk berinvestasi atau mengumpulkan dana,
  • mengumpulkan keuntungan terlarang,
  • atau situasi ilegal lainnya.
Tips
×

Some of our features may not work properly on your device.

If you are using a mobile device, please use a desktop browser to access our website.

Or use our app: Download App