.

.

Donnerstag, 2. September 2010

BBC, The Guardian und Los Angeles Times zeigen den Nutzen von Open Data auf

Update 1: Eine weitere Zusammenfassung findet ihr jetzt auch auf Martin Belams Blog.
Update 2: Martin hat die Diskussion unter den Teilnehmern noch weiter zusammen gefasst.

Nachdem mich bereits vor einiger Zeit Georgi Kobilarov von uberblic zum ersten Berliner Meetup zum Data-Journalism (#ddj) eingeladen hatte, konnte ich gestern diese Gelegenheit wahrnehmen, um unsere aktuellen Überlegungen zur Weiterentwicklung von www.futurechallenges.org speziell in Bezug auf die Visualisierungen vor 70 Teilnehmern vorzustellen und zur Diskussion zu stellen.



Von links nach rechts: Ole Wintermann, Jem Rayfield, Silver Oliver, Gert Kamp, Eric Ulken, Tom Scott, Martin Belam
Foto: Georgi Kobilarov

Bevor ich unsere Plattform vorstellte, konnte ich sehr spannenden Vorträgen von Jonathan Gray (Open Knowledge Foundation), Tom Scott (BBC Earth), Martin Belam (The Guardian), Gert Kamp (dpa), Silver Oliver und Jem Rayfield (BBC FM&T Journalism) und Eric Ulken (Los Angeles Times) zuhören.
Jonathan stellte die Grundüberlegungen dar, die hinter der Idee von Open Data (Einladung zum Mitmachen über das OpenPad) liegen und worin sich diese von den Prinzipien der Wissensverbreitung des 20. Jahrhunderts (Abschottung, Silo-Denken, Hierarchien) unterscheiden. Er verwies auf ein aktuelles Projekt der OKF (Where does my money go?), in dem es darum gegangen sein, die gegenwärtige Problematik des öffentlichen Haushaltes im UK allgemein verständlich darzustellen. Als nächster Schritt sei geplant, dem Steuerzahler anschaulich vorzuführen, wofür seine Steuern Tag für Tag genau verwendet werden.
Tom betonte in seinem Vortrag die Notwendigkeit, Webseiten danach aufzubauen, dass der User auf der Suche nach Inhalten sei und nicht nach bestimmten Webseiten. Dies veranschaulichte er durch verschiedene sehr professionell gestaltete Screenshots der Seite von BBC Earth.
Martin (@currybet) zeigte in einer ausgesprochen (!) unterhaltsamen Folienpräsentation anhand der Spiele der deutschen Fußballnationalmannschaft („Germany against Serbia - just to remember that you lost not only one match“), in welcher Weise Twitter Open Data generiert und dies dann animiert dargestellt werden kann. Ergebnis dieser Verknüpfung war eine twittergenerierte animierte Bubble-Darstellung des Spiels gegen Serbien. Beeindruckend!
Gert (@gkamp), Silver und Jem stellten die Verwendung von Open Data speziell aus der Sicht der Entwickler dar.
Eric stellte eine Aktion der LAT („Grading the teachers“) vor, im Rahmen derer die Leistungen von Lehrern an allgemeinbildenden Schulen (mit Hilfe von Klassenarbeiten) einer Bewertung unterzogen wurde und diese Bewertung auch vollkommen transparent in das Netz eingestellt wurde. Dies war aus seiner Sicht ein sehr schöner Anwendungs- und Verwertungsfall von Open Data. Es war nach der diesjährigen deutschen Google Street View-Diskussion nicht unbedingt überraschend, dass unmittelbar nach den Ausführungen nach dem Datenschutz und der Glaubwürdigkeit dieser Tests gefragt wurde.
Ich wies anschließend in meiner Präsentation auf die Herausforderung hin, Daten (quantitativ und Qualitativ) für ein Fachgebiet (Interdependenzen und Kausalitäten zwischen globalen Megatrends) zu identifizieren, für das es bisher keine nennenswerten Daten gebe, und diese wenigen Daten dann auch noch in einer Weise auf unserer Seite darzustellen, dass sie nicht nur einen einmaligen Aha-Effekt ergeben sondern vielmehr langfristig immer wieder zu recherchieren einladen.


Learnings:

The Guardian und BBC stellen heute schon weite Teile ihrer Data-Sets in Google Spreadsheet z.V. und platzieren sie damit eigentlich bei einem medialen Konkurrenzunternehmen. Die Redner beider Institutionen betonten in ihren Vorträgen immer wieder den deutlichen Mehrwert, diese Daten so offen und transparent zugänglich zu machen. Ich denke, wir sollten aus deutscher Sicht den Erfahrungen dieser beiden großen Medieninstitutionen vertrauen und uns ein Stück weit aus dem Versteck heraus wagen, in das wir uns teilweise in diesem Sommer mit Google Street View begeben haben.
Beide Seiten (Techniker und User/Journalisten) können jedoch durchaus noch ihr gegenseitiges Verständnis der jeweiligen anderen Seite verbessern. Hier gibt es anscheinend etliche Effizienzpotentiale. Einerseits werden Daten nicht allein dadurch sinnvoll und verwendbar, dass sie sehr schön und flexibel aufbereitet werden; andererseits sollte man nicht unbedingt programmieren können, um die Daten für seine Arbeit zu verwenden. Ein überdurchschnittliches Einlassen auf die Technik sollte allerdings schon vorhanden sein, da die Daten natürlich nicht abschließend aufbereitet jedem einzelnen User präsentiert werden können. Die offene, unaufgeregte und von beiden Seiten konzentriert geführte sachliche Diskussion hat gezeigt, dass sich Data-Journalism auf einem sehr guten Weg befindet.

P.S. Aus wissenschaftsmethodischer Sicht sei angemerkt, dass die freie Suche nach Mustern in den Daten nicht dem systematischen Vorgehen in der Beantwortung einer Forschungsfrage entspricht, da hiermit Scheinkorrelationen befördert werden. Dieser Aspekt wurde bisher nicht thematisiert und könnte ja  vielleicht Gegenstand eines nächsten Meetup sein.