Crowdfunding finished
Wir wollen mit Tools die Wikipedia transparenter machen. Damit Journalismus mehr sehen kann und Wissenschaftler*innen bessere Daten haben.
320 €
Fundingsum
8
Supporters
Privacy notice
Privacy notice

About this project

Funding period 5/3/22 12:51 PM - 7/11/22 11:59 PM
Realisation Mai 2022 bis Dezember 2022
Start level 300 €

Der gesamte Betrag fließt in das Projekt. Bezahlt wird damit auch: Startnext-Provision (4 %), freiwillige Startnext-Unterstützung (6 %), Umsatzsteuer (19 %).

Category Journalism
City Berlin

Project description show hide

What is this project all about?

Die Wikipedia ist eine der meistgelesenen und einflussreichsten Informationsquellen. In ihren Tiefen ist sie viel komplexer, als die meisten Leser*innen in der Regel zu sehen bekommen. Allein die deutsche Wikipedia hat über 2,6 Millionen Artikel. Die Wikipedia gibt es in 315 verschiedenen Sprachversionen. Da jede Änderung nach dem Wiki-Prinzip gespeichert bleibt, gibt es Abermillionen gespeicherter Bearbeitungen.

Ich habe durch mühsames, 'händisches' Durchforsten von Versionsgeschichten von Wikipedia-Artikeln seit 2012 zahlreiche Manipulationen von Wikipedia-Inhalten aufgedeckt in Medien wie der ZEIT oder Spiegel Online. Dabei ging es um Unternehmen, Politiker*innen, Lobbyorganisationen oder PR-Leute, die Wikipedia-Einträge schönten und um sogenanntes Paid Editing, bezahltes Schreiben in Wikipedia.

Bei meinen Recherchen konnte ich zum Teil auf Wikipedia-Tools zurückgreifen, die Wikipedianer*innen oder die Wikimedia Foundation im Netz zur Verfügung stellen. Die Tools greifen auf die Wikipedia-API zu. Das ist eine öffentliche, frei zugängliche Online-Datenschnittstelle, über die man alle Änderungen an Wikipedia-Seiten herunterladen kann.

Doch auch mit diesen Tools bleibt die Wikipedia so undurchsichtig wie ein riesiger Heuhaufen. Um Wikipedia-Manipulationen auf die Spur zu kommen, sind nämlich nicht nur Millionen von Artikel-Bearbeitungen relevant, sondern auch ellenlange Diskussionen auf unzähligen Artikel-Diskussionsseiten und Benutzer-Diskussionsseiten. Einige Bereiche der Wikipedia - deren Oberfläche ist schon in die Jahre gekommen - wie etwa Archive lassen sich nur schlecht manuell durchsuchen.

Drei IT-Expert*innen haben deshalb Softwarelösungen entwickelt, die ich bei meinen journalistischen Recherchen einsetzen kann und die Wikipedia für jedermann transparenter machen:

  • Das zweite Tool hat Dominik Henn programmiert. Es kann vollautomatisiert über die Wikipedia-API abrufen, ob von einem ganzen IP-Block (mit Hunderten oder Tausenden von IPs) Bearbeitungen in der Wikipedia vorgenommen wurden - und das gezielt für jede der 315 Wikipedia-Sprachversionen. Mit dem Tool konnte ich unter anderem herausfinden, dass über das IT-Netz des Bundes 17.000 Mal die deutsche Wikipedia geändert wurde. Mein F.A.Z.-Bericht wurde von mehreren Medien aufgegriffen.
  • Das dritte Tool von Marie Hoffmann analysiert mit einem Python-Skript Wikipedia-Diskussionsseiten. Die Idee dahinter: Autor*innen, die Paid Editing betreiben oder Manipulationen vornehmen, starten oft Threads auf Artikel-Diskussionsseiten, um etwas zu pitchen. Oder sie sind stets und sofort zur Stelle, wenn jemand einen Thread startet, um Änderungen zu verhindern oder zu beeinflussen. Das Problem: Diskussionsseiten können Dutzende von DIN-A4-Seiten umfangreich sein. Das Skript kann binnen Sekunden Diskussionen analysieren und per Diagramm anzeigen, welche Accounts besonders aktiv sind und in den genannten Kategorien besonders hohe Werte haben. Das Tool erlaubt mit verblüffender Genauigkeit, einzugrenzen, welche Accounts sich für weitergehende Recherchen im Zusammenhang mit Paid Editing eignen. Das Tool habe ich für eine Recherche genutzt, deren Ergebnis ich in Kürze veröffentlichen werde. Weitere Recherchen mit dem Tool laufen bereits.

Die drei Tools sind zu 100 Prozent datenschutzkonform, da sie ausschließlich auf Daten zurückgreifen, welche die öffentliche Wikipedia-API ohnehin zum Abruf anbietet.
Wikipedia basiert auf MediaWiki, einer freien Open-Source-Wiki-Software. Daher sind die Tools in ihrer Anwendbarkeit auf die Wikipedia nicht beschränkt, sondern eignen sich grundsätzlich für jedes Wiki, das auf MediaWiki basiert.
Über Weiterentwicklungen berichten wir im Blog zu diesem Pitch.

Die Programmierarbeiten für die vier Tools wurden ehrenamtlich erbracht, um meine journalistischen Recherchen zu ermöglichen. Mit diesem Crowdfunding möchten wir Mittel sammeln, um die bestehenden Tools weiterentwickeln und verbinden zu können und ganz neue Lösungen zu entwickeln. Dies soll weitere Enthüllungen möglich machen.
Wir haben bereits viele gute Ideen und möchten unsere Technologie teilen - für mehr Transparenz bei einer der wichtigsten Informationsquellen der Welt.

What is the project goal and who is the project for?

Unser Projekt richtet sich an Menschen, die Transparenz bei einer der wichtigsten Wissensplattformen im Netz fördern möchten. Und an solche, die die Technik selbst nutzen möchten für wissenschaftliche, künstlerische oder journalistische Zwecke.

Why would you support this project?

* Weil Journalismus und Open Data gemeinnützig sind und Förderung verdient
* Weil die bereits entwickelten Tools den Praxistest bereits bestanden haben
* Weil Projekte wie dieses keine Millionenspenden erhalten wie die Wikipedia

How will we use the money if the project is successfully funded? 

Das Geld fließt vollständig in die Entwicklung neuer Tools. Außerdem bezahlen wir damit die Umsatzsteuer (19 %), die Startnext-Gebühren (4 %) und die freiwillige Startnext-Unterstützung (6 %).

Who are the people behind the project?

Marvin Oppong, freier (Daten)journalist, Recherchedozent, Bonn
Johannes Filter, Softwareentwickler, Data Scientist, Berlin
Dominik Henn, Computerlinguist, Data Scientist, Berlin
Marie Hoffmann, Research Engineer, Berlin

Project updates

6/13/22 - - Bislang nicht die erhoffte Unterstützung -...

- Bislang nicht die erhoffte Unterstützung
- Es sollte ein Langzeit-Crowdfunding sein und die Zeit war zu kurz gewählt
- Verlängerung verspricht Aussicht auf Erreichung des Mindestbetrags

Support now 

Discover more projects

share
Wiki Transparency Project
www.startnext.com

This video is played by Vimeo. By clicking on the play button, you agree to the transfer of necessary personal data (e.g. your IP address) to Vimeo Inc (USA) as the operator of Vimeo. For more information on the purpose and scope of data collection, please see the Startnext privacy policy. Learn more