Sprint qualité
Le “sprint qualité” est une méthodologie sur un temps court, 2h30, qui vise l’amélioration significative de la qualité d’un, et un seul, jeu de données.
Pourquoi ?
Le coût de la non-qualité peut être très important. Il est de notoriété qu'une très grosse partie d'un projet data, aujourd'hui, consiste en une phase de nettoyage et correction des données. De nombreux réutilisateurs s'en plaignent. Certains jeux de données, pourtant à haut potentiel, sont quasi-inutilisables aux dires de ses derniers.
Pour qui ?
Le sprint qualité peut s’adresser à tous les acteurs de la chaîne de production et de publication des données :
-
les collecteurs de données peuvent avoir une vue globale et partagée de la qualité de leur travail et mettre en oeuvre des dispositifs amont pour améliorer la qualité
-
les producteurs peuvent remonter des problèmes récurrents aux collecteurs et préparer le jeu pour la publication
-
les éditeurs peuvent remonter des problèmes aux producteurs, avant les remontées des utilisateurs
-
les réutilisateurs peuvent démarrer l’usage d’un jeu de données par ce process afin de s’assurer de la qualité globale du jeu
Comment ?
Le sprint qualité possède les caractéristiques suivantes :
-
méthodo minutée en mode “stress-test”
-
contient une check-list qualité pour ne rien oublier et dégrossir rapidement
-
elle permet de produire un rapport d’analyse qualité qui va servir de point de départ de la correction
Les supports de travail
Le sprint qualité est une méthodologie initialement conçue et réalisée au 2e semestre 2016, par le groupe de travail "Qualité des données" de la Fing, animé par Charles Nepote. Cette méthodologie est encore en phase d'amélioration. Les améliorations successives font l'objet d'un versionnement de la méthodologie, présenté ci-dessous.
- version 0.2beta (02 décembre 2016) :
- version 0.3beta (fabrication collaborative en cours, participez et faites vos commentaires directement dans le document !)
Des exemples de sprints
Le sprint qualité a d'ores-et-déjà fait l'objet de plusieurs tests réels. Certains ont été publié et peuvent donner une meilleure idée du résultat obtenu.
-
La base de données des accidents corporels de la circulation, dont le rapport qualité (11/2016) a été publié sur le portail data.gouv.fr
-
Le recensement des équipements sportifs du ministère des sports dont on peut également consulter le rapport qualité (01/2017).
N'hésitez pas à nous signaler ou nous raconter vos usages du sprint !
Version anglaise (travail en cours)
Une version a été traduite en anglais par les étudiants du cours Open Data for Urban Research à l’école urbaine de Sciences Po.