Sayt etibarlılığı mühəndisliyi üzrə aparıcı/baş mühəndis

Daimi Tam gün

İş haqqında

Görəcəyiniz işlər:

 

  • Mikroservis əsaslı tətbiqlər üçün xidmət səviyyəsi göstəriciləri (SLI) və məqsədlərini (SLO) müəyyənləşdirmək və həyata keçirmək
  • İnformativ panellər, metriklər və xəbərdarlıq mexanizmləri quraşdırmaq və təkmilləşdirmək
  • Sistem müşahidəsini davamlı yaxşılaşdırmaq - metriklər və izləmə sistemlərini təkmilləşdirərək sistem performansına daha dərin nəzarət, problem həlli vaxtını azaltmaq və proaktiv incident aşkarlanmasına dəstək vermək
  • İnfrastruktur, tətbiq və xidmət etibarlılığı üçün yüksək standartlar təyin edərək kod review vasitəsilə ən yaxşı təcrübələri irəli sürmək, mühəndisləri təlim etmək və komandalar arasında arxitektura və deployment proseslərinə təsir etmək
  • Strukturlaşdırılmış növbətçilik dəstək prosesinin (On Call) inkişafına və tətbiqinə töhfə vermək
  • İnsidentlər və əməliyyat anormallıqlarını araşdırmaq, həll etmək, əsas səbəb təhlili aparmaq və sonrakı təhlil prosesini həyata keçirmək
  • Təkrarlanan və ya manual əməliyyat tapşırıqlarını ("toil") müəyyən etmək, səmərəlilik və etibarlılığı artırmaq üçün skriptlər və ya avtomatlaşdırma həlləri hazırlamaq
  • Development, QA və Platform komandaları ilə sıx işbirliyi edərək etibarlılıq, genişlənə bilmə qabiliyyəti və təhlükəsizliyin sistem və tətbiq dizaynlarına inteqrasiya edilməsini təşviq etmək
  • Yeni texnologiyaları və yenilikləri izləmək, sistem davamlılığını və əməliyyat mükəmməlliyini artıran yeni alətlər və ya yanaşmaların qəbulu üçün tövsiyələr vermək

 

Bizim üçün uyğun namizəd:

 

  • Kompüter Mühəndisliyi və ya Kompüter Elmləri sahəsində ali təhsil
  • Əla ünsiyyət bacarıqları 
  • Linux təcrübəsi və şəbəkə sistemləri ilə tanışlıq
  • Python, Java və ya Go proqramlaşdırma dillərindən biri ilə təcrübə (Java üstünlükdür)
  • Mürəkkəb, genişmiqyaslı distributed sistemlərdə konteyner orkestrləşdirilməsi (nümunə: kubernetes), yük balanslaşdırıcıları (load balancers), verilənlər bazaları və storage sistemləri ilə tanışlıq
  • Güclü problem həll etmə qabiliyyəti(troubleshooting) və mövcud problemləri həll etməyi öyrənmək istəyi
  • Monitoring frameworklər ilə təcrübə, (OpenTelemetry üstünlükdür)
  • Prometheus + Thanos, Grafana Tempo, Grafana Loki ilə təcrübə (üstünlükdür)
  • OpenShift ilə təcrübə (üstünlükdür)