Selon un des fondateurs de la discipline SRE, le Site Reliability Engineering, c'est “ce qu'il se passe quand on demande à des ingénieurs logiciels de gérer les infrastructures et opérations d'un système IT”. Le SRE consiste à appliquer les techniques éprouvées du développement logiciels aux tâches d'exploitation : monitoring, déploiement, gestion des anomalies, etc.
Une démarche SRE vise à optimiser les équipes ainsi que les systèmes techniques qu'elles opèrent. L'objectif est de développer la capacité d'évolution des systèmes sans sacrifier les exigences de fiabilité et de disponibilité. Pour cela, la démarche s'appuie sur plusieurs piliers tels que la mesure constante de l'état de santé des systèmes, l'automatisation d'un maximum de tâches et l'apprentissage en continu des équipes.
A travers une alternance de modules théoriques, permettant de revenir aux fondations de la démarche, et de travaux pratiques, permettant de mettre en application les concepts, cette formation propose aux participants de mieux appréhender les techniques, méthodes et outils essentiels pour la mise en place d'une démarche SRE dans leur contexte.