Sayt etibarlılığı mühəndisliyi üzrə baş mühəndis

Daimi Tam gün

İş haqqında

Görəcəyiniz işlər:

  • Mikroservis əsaslı tətbiqlər üçün xidmət səviyyəsi göstəriciləri (SLI) və məqsədlərini (SLO) müəyyənləşdirmək və həyata keçirmək;
  • İnformativ panellər, metriklər və xəbərdarlıq mexanizmləri quraşdırmaq və təkmilləşdirmək;
  • Sistem müşahidəsini davamlı yaxşılaşdırmaq - metriklər və izləmə sistemlərini təkmilləşdirərək sistem performansına daha dərin nəzarət, problem həlli vaxtını azaltmaq və proaktiv incident aşkarlanmasına dəstək vermək;
  • İnfrastruktur, tətbiq və xidmət etibarlılığı üçün yüksək standartlar təyin edərək kod review vasitəsilə ən yaxşı təcrübələri irəli sürmək, mühəndisləri təlim etmək və komandalar arasında arxitektura və deployment proseslərinə təsir etmək;
  • Strukturlaşdırılmış növbətçilik dəstək prosesinin (On Call) inkişafına və tətbiqinə töhfə vermək;
  • İnsidentlər və əməliyyat anormallıqlarını araşdırmaq, həll etmək, əsas səbəb təhlili aparmaq və sonrakı təhlil prosesini həyata keçirmək;
  • Təkrarlanan və ya manual əməliyyat tapşırıqlarını ("toil") müəyyən etmək, səmərəlilik və etibarlılığı artırmaq üçün skriptlər və ya avtomatlaşdırma həlləri hazırlamaq;
  • Development, QA və Platform komandaları ilə sıx işbirliyi edərək etibarlılıq, genişlənə bilmə qabiliyyəti və təhlükəsizliyin sistem və tətbiq dizaynlarına inteqrasiya edilməsini təşviq etmək;
  • Yeni texnologiyaları və yenilikləri izləmək, sistem davamlılığını və əməliyyat mükəmməlliyini artıran yeni alətlər və ya yanaşmaların qəbulu üçün tövsiyələr vermək.

 

Bizim üçün uyğun namizəd:

  • Kompüter Mühəndisliyi və ya Kompüter Elmləri sahəsində ali təhsil;
  • Əla ünsiyyət bacarıqları;
  • Linux təcrübəsi və şəbəkə sistemləri ilə tanışlıq;
  • Python, Java və ya Go proqramlaşdırma dillərindən biri ilə təcrübə (Java üstünlükdür);
  • Mürəkkəb, genişmiqyaslı distributed sistemlərdə konteyner orkestrləşdirilməsi (nümunə: kubernetes), yük balanslaşdırıcıları (load balancers), verilənlər bazaları və storage sistemləri ilə tanışlıq;
  • Güclü problem həll etmə qabiliyyəti(troubleshooting) və mövcud problemləri həll etməyi öyrənmək istəyi olan;
  • Monitoring frameworklər ilə təcrübəyə malik, (OpenTelemetry üstünlükdür);
  • Prometheus + Thanos, Grafana Tempo, Grafana Loki ilə təcrübə (üstünlükdür);
  • OpenShift ilə təcrübəsi olan (üstünlükdür) şəxsdir.