Stratégie d'innovation sur les données: les projets pilotes de l'OFS laissent entrevoir des gains de productivité

- EN- DE- FR
Stratégie d'innovation sur les données Stratégie d'innovation sur les données: les projets pilotes de l'OFS laissent entrevoir des gains de productivité

05.11.2019 - La statistique publique peut profiter des nouvelles méthodes d’analyse issues de sa stratégie d’innovation sur les données. L’automatisation de certaines tâches, notamment lors des travaux préparatoires, semble particulièrement prometteuse. Si les premiers résultats issus des projets pilotes de l’OFS sont encourageants, ils demandent toutefois à être affinés avant de pouvoir être utilisés pleinement dans la production courante, selon un premier état des lieux publié sur le microsite ’statistiques expérimentales’.

Le 21 novembre 2017, l’Office fédéral de la statistique (OFS) publiait sa stratégie d’innovation sur les données. Son objectif principal visait à évaluer la possibilité d’utiliser des méthodes d’analyse complémentaires issues des sciences des données (’data science’) pour la statistique publique. Cinq projets pilotes utilisant l’apprentissage automatique (’machine learning’), l’apprentissage profond (’deep learning’) et l’estimation sur petits domaines (’small area estimation’) permettant d’optimiser la production statistique ont été conduits.

La statistique officielle dispose depuis des décennies d’une vaste expérience et d’une maîtrise avérée dans la collecte, le traitement, l’exploitation et la diffusion de données et d’informations statistiques qu’elle a su développer constamment. Conscient des nouveaux enjeux qu’implique la transformation numérique, l’OFS s’est doté en 2017 d’une stratégie sectorielle visant à affronter les nouveaux défis auxquels notre société est confrontée.

Dans ce contexte les premières réponses apportées par l’OFS sont expérimentales et encore provisoires tout en étant conformes au code de déontologie décrit dans la Charte de la statistique publique de la Suisse. Elles montrent le potentiel, mais aussi les limites de l’utilisation de méthodes d’analyse complémentaires usuellement utilisées en sciences des données lorsque celles-ci sont appliquées à la statistique officielle.

Des projets pilotes pour des besoins réels

Les thématiques retenues pour les cinq projets pilotes sont concrètes et correspondent à des besoins réels de l’OFS. Elles sont issues des domaines des statistiques de la formation, des entreprises, de la superficie du sol et de l’aide sociale. Les données utilisées par les projets pilotes sont des données déjà disponibles à l’OFS. Aucune nouvelle source de données externe n’a été utilisée.
Les résultats provisoires de ces projets pilotes sont disponibles en ligne sous forme de rapports sur le site ’statistiques expérimentales’ de l’OFS. Ils sont également référencés au niveau international sur le site des statistiques expérimentales de l’Union européenne (Eurostat) qui fournit aussi les références à d’autres pays qui développent également des statistiques expérimentales.

Ces projets pilotes ont été présentés dans le cadre de conférences internationales aux niveaux européen et onusien. Les cinq projets pilotes figurent au programme des Journées suisses de la statistique publique 2019.

Un laboratoire dédié à l’innovation sur les données

Pour mener ces projets pilotes à terme, l’OFS s’est doté d’un laboratoire provisoire dédié à l’innovation sur les données. Cette plateforme de type nuage (’cloud’) a été mise à disposition et est exploitée par l’Office fédéral de l’informatique et de la télécommunication (OFIT). Conforme aux directives en matière de sécurité informatique et de protection des données, ce laboratoire, entièrement séparé de la production statistique courante et découplé de toute connexion à Internet, a permis à l’OFS d’acquérir par la pratique une large expérience sur la gouvernance et la gestion opérationnelle de ce type de plateforme. L’utilisation de logiciels au code source ouvert (’open source’) a été privilégiée.

Méthode en science des données (’data science’)

Encadrées par des experts externes provenant du monde académique et privé ainsi que par des spécialistes internes à l’OFS, les cinq équipes des projets pilotes ont suivi dans un premier temps une formation spécifique en méthodes de science des données et en programmation. Dans un second temps, elles ont pu appliquer les connaissances théoriques acquises. Organisées sous forme d’équipes pluridisciplinaires regroupant des experts métier, des informaticiens et des méthodologues, ces équipes ont évolué dans une structure agile.

Un logo spécifique

Les premiers résultats montrent que la statistique officielle peut tirer profit des méthodes d’analyse complémentaires dans des applications nouvelles et que ces méthodes représentent des alternatives profitables par rapport à la seule utilisation de méthodes classiques dans d’autres applications. L’automatisation de certaines tâches comme la préparation des données, l’interprétation d’images aériennes et spatiales ou des opérations de codification apparaissent comme des domaines particulièrement prometteurs en termes de gain d’efficacité.

Néanmoins, si ces premiers résultats sont encourageants, ils demandent à être affinés pour atteindre leur pleine maturité. Ceci avant de pouvoir les utiliser dans la production courante, raison pour laquelle l’OFS entend poursuivre ses efforts dans ce domaine. Ainsi, ces premiers résultats sont clairement signalés et accompagnés d’un logo facilement reconnaissable.

Stratégie d’innovation sur les données: les projets pilotes de l’OFS laissent entrevoir des gains de productivité
(PDF, 3 pages, 221 kB)