Dateninnovationsstrategie: Die Pilotprojekte des BFS versprechen Produktivitätsgewinne

    -     English  -  Français
Die öffentliche Statistik profitiert von den neuen Analysemethoden, die in der Dateninnovationsstrategie festgehalten sind. Namentlich die Automatisierung bestimmter Aufgaben, insbesondere bei den Vorbereitungsarbeiten, ist sehr vielversprechend. Die ersten Ergebnisse der Pilotprojekte des BFS stimmen zuversichtlich, doch die Methoden müssen noch verfeinert werden, um vollständig in die laufende Produktion integriert werden zu können. Zu diesem Schluss kommt eine erste Bestandesaufnahme, die auf der Microsite ’Experimentelle Statistiken’ veröffentlicht wurde.

Am 21. November 2017 veröffentlichte das Bundesamt für Statistik (BFS) seine Dateninnovationsstrategie. Diese zielt in erster Linie darauf ab, zu prüfen, inwiefern komplementäre Analysemethoden aus dem Bereich der Datenwissenschaft (’Data Science’) in der öffentlichen Statistik genutzt werden könnten. Dazu wurden fünf Pilotprojekte zur Optimierung der Statistikproduktion anhand von maschinellem Lernen (’Machine Learning’), ’Deep Learning’ sowie Kleingebietsschätzungen (’Small Area Estimation’) durchgeführt.

Die öffentliche Statistik verfügt über jahrzehntelange Erfahrung sowie bewährtes Knowhow in der Erhebung, Bearbeitung, Nutzung und Verbreitung von Daten und statistischen Informationen, das sie ständig weiterentwickelt hat. Angesichts der neuen Herausforderungen im Zuge der Digitalisierung hat das BFS 2017 eine Sektorstrategie erarbeitet, um den Veränderungen, mit denen die Gesellschaft konfrontiert ist, Rechnung zu tragen.

Die ersten Antworten des BFS sind experimentell und bislang provisorisch, entsprechen aber dem berufsethischen Kodex aus der Charta der öffentlichen Statistik der Schweiz. Sie zeigen das Potenzial, aber auch die Grenzen der Anwendung von komplementären Analysemethoden aus der Datenwissenschaft in der öffentlichen Statistik.

Pilotprojekte für reale Bedürfnisse

Die fünf Pilotprojekte beziehen sich auf konkrete Themen, die den tatsächlichen Bedürfnissen des BFS entsprechen. Sie werden in den Bereichen Bildungs-, Unternehmens-, Arealund Sozialhilfestatistik durchgeführt. Für die Pilotprojekte wurden Daten herbeigezogen, die beim BFS bereits vorliegen. Somit wurden keine neuen, externen Datenquellen verwendet.
Die provisorischen Ergebnisse der Pilotprojekte stehen in Form von Berichten auf der BFS-Microsite ’Experimentelle Statistiken’ zur Verfügung. Ausserdem sind sie neben weiteren Referenzen zu den Arbeiten verschiedener Länder in diesem Bereich auf der Seite über experimentellen Statistiken der Europäischen Union (Eurostat) verlinkt.

Diese Projekte wurden im Rahmen von internationalen Konferenzen auf europäischer Ebene sowie bei der UNO präsentiert. Die fünf Pilotprojekte der Schweiz stehen zudem an den Schweizer Tagen der öffentlichen Statistik 2019 im Fokus.

Dateninnovationslabor

Um die Pilotprojekte vollständig umzusetzen, hat das BFS ein provisorisches Dateninnovationslabor eingerichtet. Diese Cloud-Computing-Plattform wird vom Bundesamt für Informatik und Telekommunikation (BIT) zur Verfügung gestellt und betrieben. Das Labor ist gemäss den Vorgaben bezüglich Datenschutz und Informatiksicherheit komplett getrennt von der Statistikproduktion und nicht mit dem Internet verbunden. Das BFS hat damit wertvolle praktische Erfahrungen mit der Steuerung und operationellen Führung einer solchen Plattform gewonnen. Für die Arbeiten wurde Open-Source-Software eingesetzt.

Methoden der Datenwissenschaft (’Data Science’)

Begleitet von externen Fachleuten aus akademischen und privatwirtschaftlichen Kreisen sowie BFS-internen Expertinnen und Experten wurden die fünf mit den Pilotprojekten betrauten Teams zunächst in den Bereichen datenwissenschaftliche Methoden und Programmierung geschult. Anschliessend konnten sie die erworbenen theoretischen Kenntnisse in die Praxis umsetzen. Die fachübergreifenden Teams setzen sich aus Vertreterinnen und Vertretern des jeweiligen Themengebiets, der Informatik und der Methodik zusammen und entwickelten eine agile Struktur.

Ein eigenes Logo

Die ersten Ergebnisse zeigen, dass die öffentliche Statistik komplementäre Analysemethoden in neuen Anwendungen nutzen kann und dass diese Methoden im Vergleich zu herkömmlichen eine profitable Alternative darstellen. Die Automatisierung bestimmter Aufgaben wie insbesondere der Datenaufbereitung, der Luftbildinterpretation oder der Kodierung verspricht wesentliche Effizienzgewinne.

Die ersten Ergebnisse sind sehr vielversprechend, doch die Methoden müssen noch verfeinert werden, bevor sie vollständig ausgereift sind und für die laufende Produktion verwendet werden können. Aus diesem Grund will das BFS die Bestrebungen in diesem Bereich fortsetzen. Die ersten Resultate sind mit einem leicht erkennbaren Logo klar gekennzeichnet.