Den verwaisten Artikeln in Wikipedia Sichtbarkeit verleihen

- EN- DE - FR- IT
(© Image: Wikipedia)
(© Image: Wikipedia)

Wikipedia ist die umfangreichste frei zugängliche Wissensplattform im Internet. Dennoch hat eine Studie der EPFL festgestellt, dass 15% ihres Inhalts unsichtbar sind. Um dies zu ändern, haben die Wissenschaftler ein neues Werkzeug entwickelt.

Mit 60 Millionen Artikeln in über 300 Sprachversionen wächst der Inhalt von Wikipedia ständig mit einer Rate von etwa 200 000 neuen Artikeln pro Monat. Meistens entdecken die Nutzer neues Wissen und vertiefen ein Thema, indem sie auf die Hyperlinks klicken, die einen Artikel mit einem anderen verbinden. Aber was ist mit den Wikipedia-Artikeln, auf die kein anderer Artikel verweist?

Diese werden als "verwaiste Artikel" bezeichnet. Um dieses Phänomen besser zu verstehen, haben Forscherinnen und Forscher des Data Science Laboratory (DLAB) der Fakultät für Informatik und Kommunikation der EPFL in Zusammenarbeit mit dem Forschungsteam der Wikimedia-Stiftung die erste systematische Studie über verwaiste Artikel in den 319 Sprachversionen von Wikipedia durchgeführt, die zum Zeitpunkt der Studie existierten.

"Wikipedia ist ein Netzwerk wie Straßen, das Internet, chemische Verbindungen oder Gene, und jedes Netzwerk beruht auf dem Konzept der Navigierbarkeit, die es ermöglicht, von einem Ort zu einem anderen zu gelangen. Informationsnetzwerke sind nach bestimmten Hierarchien organisiert. Wir wollten verstehen, warum bestimmte Artikel nie aufgerufen werden. So haben wir begonnen, uns mit verwaisten Artikeln zu beschäftigen", erklärt Akhil Arora, Doktorand am DLAB und Hauptautor der Studie Orphan Articles: The Dark Matter of Wikipedia.

Die Forscherinnen und Forscher stellten fest, dass fast 9 Millionen Wikipedia-Artikel in allen Sprachen, d. h. etwa 15 %, verwaist waren, d. h. für Nutzerinnen und Nutzer, die Wikipedia aufrufen, unsichtbar waren, und dass es sie in fast allen Bereichen auf der Plattform gab. Im Allgemeinen werden nicht verwaiste Artikel doppelt so häufig aufgerufen wie verwaiste Artikel. Über bloße Korrelationen hinaus stellten die Forscherinnen und Forscher auch eine kausale Beziehung zwischen dem Hinzufügen von Links zu verwaisten Artikeln und der Erhöhung der Anzahl ihrer Seitenaufrufe fest.

Die mangelnde Sichtbarkeit der verwaisten Artikel ist auf die Art und Weise zurückzuführen, wie die Wikipedia-Seiten durchsucht und betrachtet werden. Nutzer können eine Suchmaschine verwenden, die sie zu einer bestimmten Seite in Wikipedia weiterleitet, Wikipedia als Enzyklopädie nutzen und von einem Artikel zum nächsten springen oder beide Methoden kombinieren.

In all diesen Fällen muss die Person, die einen Artikel verfasst, nicht nur Links in den Artikel einfügen, die auf andere Artikel verweisen, sondern auch alle relevanten Wikipedia-Artikel kennen, auf die der Artikel verweisen könnte, was keine leichte Aufgabe ist.

Eine Person schreibt einen Artikel über ein Thema, mit dem sie sich auskennt, und kann daher Links zu anderen Artikeln hinzufügen", sagt Akhil Arora. Manchmal sind diese Beziehungen nicht symmetrisch und der gesamte Inhalt von Wikipedia ist mit dem Universum vergleichbar."

Die Forschung hat gezeigt, dass es große Unterschiede zwischen den einzelnen Sprachen gibt. In über 100 Sprachen liegt der Anteil verwaister Artikel bei über 30%, wobei Ägyptisch-Arabisch (78%) und Vietnamesisch (50%) besonders hoch sind. Diese beiden Sprachen gehören zu den 20 Sprachversionen der Wikipedia, die die Mehrheit bilden. Dies unterstreicht das Problem der mangelnden Kompetenz der Redakteurinnen und Redakteure in bestimmten Sprachen und zeigt die Notwendigkeit, bestehende Werkzeuge wie FindLink , die sie bei dieser Aufgabe unterstützen, zu verbessern.

Eine interessante Erkenntnis der Studie ist, dass ein Artikel, der in einer Sprache verwaist ist, nicht immer auch in anderen Sprachen verwaist ist. Dies veranlasste die Forscherinnen und Forscher dazu, einen neuen Ansatz zu entwickeln, um Artikel zu identifizieren, die über die Übersetzung von Links auf verwaiste Artikel verweisen können.

"Wenn derselbe Artikel in einer anderen Sprache nicht verwaist ist, bedeutet dies, dass die Redakteurinnen und Redakteure andere Artikel gefunden haben könnten, die auf diesen Artikel verweisen können. Sie mussten also nur den Link von den anderen Sprachen auf die Sprache übertragen, in der der Artikel verwaist war. Wir haben herausgefunden, dass auf diese Weise Links für über 63% der verwaisten Artikel vorgeschlagen werden konnten", sagt Akhil Arora.

Das Team der EPFL arbeitet weiterhin mit Forscherinnen und Forschern der Wikimedia Foundation zusammen, um diesen Ansatz in ein Werkzeug umzuwandeln (siehe den ersten Prototypen ), das die Erfahrung der Nutzerinnen und Nutzer bei der Konsultation von Wikipedia verbessern soll. Dabei setzt sie auch KI ein, um an zwei Fronten zu diesen Bemühungen beizutragen.

Erstens arbeiten die Forscherinnen und Forscher mit grafischen neuronalen Netzen, um die Linkempfehlungen zu organisieren, die als Grundlage für das Tool dienen sollen. Zweitens entwickeln sie ähnlich wie bei einer Heatmap ein zusätzliches Tool, das Redakteurinnen und Redakteure an die Stelle auf einer Seite führen kann, an der sie erwägen sollten, neue Konzepte hinzuzufügen, die dann die generative KI nutzen, um einen Ausgangstext vorzuschlagen. Es ist wichtig zu beachten, dass die ehrenamtlichen Redakteurinnen und Redakteure die von der KI geleistete Arbeit verbessern, redigieren und überprüfen. Der Ansatz der KI bei Wikipedia war immer der von "Closed-Loop"-Systemen, bei denen Menschen in der Schleife sind.

"Die Gemeinschaft der Redakteurinnen und Redakteure leistet der Welt einen Dienst, aber es gibt nicht genügend von ihnen, vor allem in Minderheitensprachen. Eines unserer Ziele ist es, sie besser zu unterstützen, da das Schreiben und Aktualisieren von Artikeln eine zeitraubende Aufgabe sein kann. Wikipedia ist ein unglaublicher Open-Access-Dienst. Deshalb sind die Werkzeuge, die wir erstellen, so nützlich für die Redakteurinnen und Redakteure, die diese großartige Arbeit leisten", schloss Akhil Arora.