Objectifs de l'outil

L'objectif de la mise en place de la page d'état des services informatiques est de se doter d'un moyen simple et efficace d'informer la communauté de l'état des services informatiques. Plus spéficiquement:

  • De l'état d'un service (fonctionnel, partiellement fonctionnel, non fonctionnel)
  • Du statut des interruptions de service en cours et des étapes que nous suivons pour arriver à une résolution
  • Des maintenances planifiés
  • De l'historique des interruptions de service

Accéder à l'outil

Description du concept

Pour la mise en place de cette page, nous utilisons un outil externe développé par Status Page (statuspage.io). Celui-ci est configuré et personnalisé selon nos besoins. Nous sommes en mesure d'y indiquer les services que nous souhaitons afficher sur la page et documenter les événements (interruptions de service et interruptions planifiées). Également, nous utilisons un autre service externe (localize.js) pour traduire la portion publique du site en français.

Au départ, l'état des services suivants sera présentée en permanence sur la page, ceux-ci ont été identifiés comme étant les services les plus importants d'un point de vue utilisateur:

 

Lors de la documentation d'un arrêt de service, il est alors possible de modifier l'état du service (Fonctionnel, Performance dégradée, Panne partielle, Panne majeure) en question sur la page et de détailler l'incident et son statut (En recherche de solution, Identifié, Sous observation, Résolu).

 

Toutefois, l'un des services étant "Autres services", il demeure possible d'indiquer un arrêt de service pour n'importe quel autre service n'apparaissant pas dans la liste de base tout en documentant de quel service il s'agit dans la description de celui-ci.

 

Par la suite, lorsque l'arrêt de service est résolu, la description de l'incident et de ses étapes de résolution se retrouve dans la section "Interruptions de service résolues".

 

Finalement, il est possible d'ajouter les "maintenances planifiées" afin d'aviser la communauté. Celles-ci se placent alors avant les interruptions de services résolues en attente de celles-ci. Pendant la période de réalisation de la maintenance l'information est automatiquement placée au haut de la page et est ensuite placée dans les "interruptions de service résolues" suite à la réalisation.

L'outil permet également d'automatiser certaines mises en jour en fonction de systèmes externes. Pour l'instant, nous n'utiliserons pas cette fonctionnalité mais l'évolution pourra éventuellement être faite.


Rôles et responsabilités

 

Point important à savoir : Lorsque l'on accède à la portion administrative de l'outil, chaque utilisateur est en mesure de modifier l'ensemble de la configuration de l'outil (il n'existe qu'un seul profil d'accès). Il est donc primordial de consulter la section rôles et responsabilités si vous devez utiliser l'outil.

 

Mise à jour des états et documentation des interruptions de services et des maintenances planifiées

La décision de déterminer qu’un incident doit être inscrit sur la page revient aux cadres ou aux responsables de services tel que définis dans le tableau ci-dessous. 

La procédure ci-dessous s'applique à tous les services à l'exception de Panopto et Vidéoconférence qui sont sous la responsabilité du Service de l'audiovisuel.

Si l'équipe des commis au 5050, ou toutes autres personnes, considèrent qu'une situation nécessiterait la documentation d'un incident sur la page, il est de leur responsabilité de communiquer avec un cadre ou les responsables de service afin d'obtenir l'autorisation.

La mise à jour et la documentation des interruptions dans l'outil est la responsabilité de:

  • l’équipe des commis du 5050 dans les heures d’ouvertures du centre de services. Dans le cas où un cadre ou un responsable de service constate une interruption de service ayant un impact sur la communauté, il est responsable d'aviser l'équipe du 5050 selon la chaîne téléphonique ci-dessous:
    1. Jocelyne Boisjoli - # direct - 0250
    2. Josiane Pion-Cummings - # direct - 5073
    3. Claude Roberge - # direct - 3364
      Note: Si la première personne de la chaîne ne répond pas, il ne faut pas laisser un message mais passer à la prochaine. Advenant qu'aucune de ces personnes ne soient rejoignable, il faut communiquer avec un cadre. Les cadres ou les responsables de services sont également responsables d’aviser le 5050 de tout changement de statut ou de la résolution d’un incident qui nécessite un changement sur la page. À l’extérieur des heures, ceux-ci sont responsables de faire les changements et de mettre les informations à jour.

  • des cadres ou des responsables de services à l'extérieur des heures

 

Dès qu’un incident ayant un impact sur la disponibilité du service est identifié par les cadres ou les responsables de services, ceux-ci doivent relayer l’information en indiquant:
  • Un titre significatif pour l’incident (système touché / nature / localisation)
    • Panne du sans fil au pavillon DS
    • Ralentissement de la livraison des courriels
    • Problème intermittent d'accès à SIGA3
    • www.uqam.ca inaccessible
  • Les services touchés
    • Si la composante n’est pas dans la liste des composantes prédéfinies, il faut sélectionner "Autres services"
  • Le statut du service (Performance dégradée, Panne partielle, Panne majeure)
  • Le statut de l’incident (En recherche de solution, Identifié, Sous observation, Résolu)
  • Autre détails à ajouter à l’incident (si nécessaire seulement)

 

ServicesCadre responsableResponsable du service
Courriel étudiants
  • Daniel Girard
  • Guillaume Riffard
  • Benoît Bélair
  • Michèle Pérucic
Courriel employés
  • Daniel Girard
  • Guillaume Riffard
  • Benoît Bélair
  • Sidahmed Bennaoum
Dossier académique
  • Daniel Girard
  • Guillaume Riffard
  • Grace Coppola
  • Vincent Rioux
  • François Boucher
  • Autres (à préciser)
Impression et photocopie
  • Daniel Girard
  • Guillaume Riffard
  • Léo Cloutier
 
Moodle
  • Grace Coppola
  • Vincent Rioux
  • Stéphanie Lanthier
  • Hélène Bouley
Portail étudiant
  • Daniel Girard
  • Guillaume Riffard
  • Michèle Perucic
  • Martin Simoneau
  • Michel Fraser
Réseau et Internet
  • Daniel Girard
  • Léo Cloutier
  • Ian Ruel
  • Armel Massam
  • Roberto Cruz
  • Yves Poirier
  • Mathieu Boutin
Réseau privé virtuel (VPN)
  • Daniel Girard
  • Léo Cloutier
  • Ian Ruel
  • Armel Massam
  • Roberto Cruz
  • Yves Poirier
  • Mathieu Boutin
Sans fil
  • Daniel Girard
  • Léo Cloutier
  • Ian Ruel
  • Armel Massam
  • Roberto Cruz
  • Yves Poirier 
SIGA3
  • Daniel Girard
  • Guillaume Riffard
  • Grace Coppola
  • Vincent Rioux
  • Autres (à préciser)

Sites Web
  • Daniel Girard
  • Guillaume Riffard
  • Grace Coppola
  • Vincent Rioux

 

Téléphonie
  • Daniel Girard
  • Léo Cloutier
  • Ian Ruel
  • Armel Massam
  • Roberto Cruz 
  • Monica Tanase
  • Steven Paré
  • Julie Desgroseillers
Autres services
  • Cadres seulement
Panopto
  • Jean-François Tremblay
  • Alain Provost
  • Bastien Vittecoq
Vidéoconférence
  • Jean-François Tremblay
  • Guy Gendron
  • Jimmy Beaudoin
  • Nicolas Leblond

 

Gestion de la plate-forme

Tous les autres aspects de gestion de la plate-forme sont sous la responsabilité de Stéphane Talbot et Mohcine Berbiche. Toute demande de modification d'éléments de celle-ci (services, traduction, code d'accès, look & feel, etc.) doivent passer par eux.

 

Commentaire

  1. Bonjour!

    Il y a un problème la section des annonces des maintenances planifiées.

    • La date de l'événement est en anglais;
      1. On lit : Scheduled for
      2. Le format de la date est en anglais : Dec 31
        • En français, une telle date se lit 31 déc.; noter que les mois ne prennent pas de majuscule.