#7/ 2020
7/12

Chancen auf neue Formate

Aus den Medienlaboren: Automatischer Journalismus, neuester Stand

Automatischer Journalismus zieht in die Redaktionen ein. Doch was viele für ein Rationalisierungswerkzeug oder den Untergang der anspruchsvollen Berichterstattung halten, ist in Wahrheit eine Chance auf neue Formate – und auf neue Ressourcen. 

Wer automatischen Journalismus einmal ganz direkt, interaktiv und bei der Arbeit erleben möchte, der ruft die Website schickler-shorty.de auf. Dort hat das Hamburger Beratungsunternehmen Schickler ein Werkzeug veröffentlicht, das automatisch Texte kürzt. Entwickelt hat es der promovierte Informatiker Christoph Mayer, der bei Schickler die Abteilung „Data Science/Künstliche Intelligenz“ leitet. 

Und so funktioniert es: In einem linken Fenster geben die Redakteure den zu kürzenden Text ein, rechts wirft – ähnlich wie deepL oder Google Translator bei Übersetzungen – das Tool dann die gekürzte Fassung aus. Auf einem Regler kann man in Ein-Prozent-Schritten beliebig einstellen, wie viel Prozent gekürzt werden soll. Oben links auf der Webseite heißt es klein und kursiv: Beta. Zur Sicherheit. Doch das ist eine Untertreibung.


Schicklers Shorty zeigt ganz gut, wo „Automatischer Journalismus“ im Augenblick hierzulande steht: Er ist zwar in den deutschen Medienunternehmen angekommen, nur noch nicht so ganz. Etliche – wie etwa die Stuttgarter Zeitung – haben bereits erste automatisch generierte Angebote im Markt und bauen an weiteren. Viele haben erste Anwendungen kurz vor dem Launch. Es existiert kaum ein Medienunternehmen, das nicht gerade Angebote entwickelt. 

Drei überregionale Tageszeitungen – sonst eher Wettbewerber – bauen gerade an einer gemeinsam Lösung. In Österreich will eine Tageszeitung die Veränderungen in den dort öffentlichen Grundbüchern auslesen, um daraus ein Format zu entwickeln: Es interessiere die lokalen Leser, wenn etwa ein Handelskonzern ein Grundstück kauft, um dort einen neuen Supermarkt zu bauen. Der Bayerische Rundfunk in München eröffnete Ende April ein eigenes Automation-/Artificial Intelligence-Lab. 


Das Webinar zum Thema

Zum Thema automatischer Jouralismus bietet der DPR im Juli und September ein jeweils zweistündiges weiterführendes Webinar an: Automated Journalism,
Dienstag, 14.07.2020 10:00 Uhr,
Donnerstag, 24.09.2020 14:00 Uhr
Infos unter 
https://digital-publishing-report.de/automated-journalism



„Rund ein Viertel unserer Kunden denken über den Einsatz von Anwendungen im Bereich der Künstlichen Intelligenz nach, etwa fünf Prozent über automatische Textgenerierung, die ebenfalls mit Algorithmen der Künstlichen Intelligenz arbeitet“, sagt Till Plumbaum, Head of Research beim Berliner IT-Beratungsunternehmen Neofonie. 

In Baden-Württemberg treffen sich die Daten-Redakteure einiger regionaler Tageszeitungen regelmäßig zum Erfahrungsaustausch. Zusätzlich hat man eine eigene Website gebaut: http://ddjbw.de. Viele Tageszeitungen bringen gerade automatisierte Verkehrsnachrichten oder Formate für Mikro-Berichterstattung über einzelne Stadtteile und Quartiere auf den Weg.

Und die Coronakrise gab dem Thema mit automatisch generierten Statistiken weitere Dynamik. So wurden die Zahlen der Johns-Hopkins-Universität automatisch von Algorithmen generiert. Sogar der 17-jährige High-School-Schüler Avi Schiffmann aus der Nähe von Seattle sammelte per Algorithmus Daten zu Covid-19 und veröffentlichte sie auf seiner Website ncov2019.live, die zeitweise Millionen von Visits erreichte.

Als am Mittwoch, den 18. März, die welt.de und t-online.de ein spannendes Fußballwochenende mit einem Lokalderby zwischen Hertha BSC und Union Berlin, ankündigte, wunderten sich dagegen die Fans: Bereits Tage zuvor waren alle Spiele abgesagt worden: Coronakrise. Wer die Texte („Wer Hertha BSC als Gegner hat, kann sich auf eine harte Partie einstellen. Schon 53 Gelbe Karten kassierte die Mannschaft in dieser Saison“) bis zu Ende gelesen hatte, konnte den Grund für die Panne erahnen. So hieß es bei der Welt etwa am Ende des Beitrags: „Dieser Artikel wurde automatisch von unserem Partner Retresco anhand von Spieldaten erstellt. 

Doch leider hatte der Algorithmus, der die Textgenerierung steuert, die Viren-Pandemie nicht mitbekommen. Und die Redaktion hatte ihren Fußball-Textroboter schlicht aus dem Blick verloren. Einen Tag später deaktivierten die Redakteure ihre automatische Anwendung. 


Das Dossier zum Thema

Einen Überblick über wichtige Studien, Analysen sowie weitere Cases und Erfahrungen sowie alle relevanten Informationen zu diesem Thema finden Sie auf unserer neuen Dossierseite unter https://digital-publishing-report.de/dossiers/



Dabei halten schon seit einigen Jahren automatische Formate Einzug in die Angebote der Medienhäuser: Chatbots, die in der Lage sind, einfache Dialoge mit Kunden, Abonnenten, Social-Media-Fans und -Followern, Lesern und Nutzern zu führen, gehören bereits zum Standard. Ebenso automatisierte Marketing-Kampagnen, die oft profilbasiert ihre individuellen Kampagnen starten. Etwa wenn BtB-Medien ihre Nutzer, die ein Whitepaper heruntergeladen haben, weiter vertrieblich bearbeiten. Algorithmen, oft auf Basis von Künstlicher Intelligenz, generieren für Online-Shops Produkttexte, die sich mittlerweile sogar in der Tonalität automatisch modulieren lassen.

„Artificial Intelligence wird einen weitreichenden und tiefgreifenden Einfluss darauf haben, wie Journalismus gemacht und konsumiert wird“, bilanzierte die Ende letzten Jahres veröffentlichte Studie „New powers, new responsibilities“ von Charlie Beckett, Professor an der London School of Economics and Political Science. Befragt wurden 71 Medien-Unternehmen aus 32 Ländern, darunter auch Arte, Axel Springer, Bayerischer Rundfunk, Deutsche Welle, RTL, Spiegel Online und Süddeutsche Zeitung.

Rund 60 Prozent der Medienunternehmen zeigten sich besorgt, das AI einen Einfluss auf ihr journalistisches Angebot habe. Dieser Einfluss sei bereits für 44 Prozent spürbar. 19 Prozent erwarteten erste Auswirkungen im Jahr 2020. Rund 19 Prozent rechneten damit innerhalb der nächsten zwei Jahre, 22 Prozent innerhalb der kommenden drei bis fünf Jahre. Demgegenüber stand: 73 Prozent haben keine AI-Strategie! 

Dabei wird „ein Großteil aller Nachrichten in wenigen Jahren automated journalism sein, weil die Zahl der Nachrichten zunimmt“, sagt Wolfgang Zehrt, ehemaliger Vorstand der Nachrichtenagentur dapd und heute „Self-employed robot journalist. Digital content and strategy consultant (Selbstbeschreibung). Das gelte besonders für ganz spezifische, für regionale und für sehr kleine Zielgruppen.

Einer der internationalen Vorreiter ist die Multimedia-Nachrichtenagentur Press Association (PA), die in Großbritannien und Irland tätig ist. PA ist Teil der Aktiengesellschaft PA Media Group Limited, deren 26 Hauptaktionäre hauptsächlich nationale und regionale Zeitungsverlage sind – ein ähnliches Modell wie das der dpa. Zusammen mit dem Londoner Datenjournalismus-Startup Urbs-Media startete AP Ende 2017 mit „Radar“ ein Angebot automatisch generierter Lokalnachrichten.

„Im Zusammenspiel von Reportern, Daten und Algorithmen produzieren wir lokale Geschichten zu Themen wie etwa Verbrechensstatistik, Krankenhauswartezeiten und das Schulschwänzen von Schülern“, sagt Urbs-CEO Alan Renwick. Rund 40.000 Lokalnachrichten habe man allein in den ersten drei Monaten erstellt. Seit Juni 2018 bietet der Dienst 391 Kanäle an, für jeden britischen Verwaltungsbezirk einen. Acht regionale Nachrichtenanbieter, die zusammen 329 Radiostationen, Print- und Digital-Dienste betreiben, haben als erste zahlende Abonnenten den "robotergenerierten" Nachrichtendienst abonniert.

Einer der hiesigen Vorreiter ist die Stuttgarter Zeitungsgruppe: Bereits 2017 startete sie ihren „Feinstaubalarm“, der automatische Meldungen generiert, sobald die Luftbelastung an unterschiedlichen Standorten in der Schwabenmetropole einen gewissen Schwellenwert überschreitet. Die computer-generierten Meldungen sind mit dem Autorenkürzel AX versehern. Der Leser soll sehen: Hier schreibt eine Maschine. 

Im Juli letzten Jahres startete die StZ die ebenfalls automatisch generieren Crime Map: „Damit werten wir automatisch die öffentlich bekannten Delikte in der Stadt aus und können zudem für sehr spezifische Zielgruppen berichten – was ohne Automatisierung, also rein mit menschlicher Arbeitskraft gar nicht möglich wäre“, sagt Jan Georg Plavec, zuständiger Multimedia-Redakteur bei der Stuttgarter Zeitung. 


Die Crimemap kommt seit Start auf eine Gesamtreichweite von 150.000 Visits, bei rund 2,5 Minuten Verweildauer. Ohne Personalkosten liegen die Initialaufwände für Feinstaubradar und Crimemap jeweils zwischen 30.000 und 50.000 Euro. Dazu kämen laufende monatliche Kosten von etwa 500 Euro. Gesponsort wird der Feinstaub-Radar von Bad Hindelang Tourismus, die Crimemap von Telenot Alarmanlagen. Beide Angebote seien in sich profitabel. Außerdem sei man gerade in Gesprächen mit möglichen Lizenznehmern für die Crimemap.

Automatischer Journalismus generiere nicht nur einen interessanten Long-Tail, sagt Plavec, jede Art von Datenjournalismus laufe auf automatischen Journalismus hinaus: „Im Verkehrsbereich, bei Staus, aber auch im ÖPNV, ginge viel mehr als bisher gemacht wird.“ Im Sport würde man sich zu sehr auf Fußball konzentrieren und die teils hervorragenden Datensätze in anderen Sportarten unbeachtet lassen. Auch ließen sich die Zeitungsarchive nutzen: Etwa mit Text Mining oder den Verfahren der automatischen Bilderkennung. „Medienhäuser sitzen da auf unglaublichen Content-Schätzen“, sagt Plavec. Naheliegend sei die automatisierte Zusammenfassung von größeren Textmengen, um z.B. automatisierte Newsletter zu erstellen. Auch Text Mining hält er für sehr vielversprechend und fragt: Warum gibt es nicht längst Software, die automatisiert interessante Geschichten aus digitalen Archiven zutage fördert?

„Wir können beliebig schnell aus vorhandenen Datensätzen etwa Indexberichte automatisieren“, sagt Saim Alkan, Chef des Stuttgarter Startups AX Semantics. „Dazu zählen Listicle-Formate wie etwa ‚Die fünf preiswertesten Cabrios’ oder ‚Die teuersten Grundstücke, die wir ad hoc generieren können. Seine Firma betreibt eine Plattform, mit der Unternehmen ab 270 Euro im Monat in die automatische Textgenerierung einsteigen können. Rund 400 Kunden und 1.000 Anwender habe man bereits, davon sind etwa zehn Prozent Medienunternehmen, überwiegend regionale Zeitungen und Agenturen. „Damit demokratisieren wir KI“, schwärmt Alkan.

Der Dienstleister Retresco bietet mit textengine.io eine Self-Service-Plattform an: "Sie wandelt strukturierte Daten – etwa Produktinformationen, Wetter-, Sport- oder Verkehrsdaten – automatisiert in natürlichsprachlichen Text um“, sagt Sebastian Golly, Head of Natural Language Generation bei Retresco. Mit ihrem Do-it-Yourself-Portal wird Textgenerierung praktisch zur Commodity.

„Texte aus Texten und sogar Texte aus vielen unterschiedlichen Texten kommen bald“, prognostiziert Experte Wolfgang Zehrt. In der Zusammenfassung „unendlich vieler Datenquellen“ werden Analysen tolle Erkenntnisse liefern: „Wir machen gerade gute Fortschritte, aus Daten automatische komplette Videos zu generieren, mit unterschiedlichen Einstellungen.“ Unglaublich komplexe Datenberge lassen sich auf Boulevard-Level herunterbrechen, meint Zehrt. Wahlen, Klima, Soziodaten, einschließlich begleitender Grafik und Voice-Content. Alexa und andere Voice-Inhalte würden ohnehin schon zusammen mit dem Text ausgeliefert. Denn die Stimmerkennung von Alexa oder Siri verwandelt die gehörte Sprache in geschriebenen Text, verarbeitet ihn als Text, generiert als Text die Antwort und verwandelt die Textantwort wieder in gesprochene Sprache.

Börsenberichte seien inzwischen ja ein „Automated-Journalism“-Klassiker. Zusammenfassungen von mehreren Börsenplätzen plus historische Einordnungen seien dagegen schon anspruchsvoll. „Das machen wir gerade für die WELT“, meint der Experte. Für digitaldaily.de produziere man rund um Corona diverse Texte und Grafiken vollautomatisch aus vielen internationalen Quellen. Die Website generiert sich praktisch automatisch. „Die Zugriffe darauf sind extrem hoch“, berichtet Zehrt.

„Wir sind gerade auf der Suche nach neuen Datenquellen, die auch im Lokalen relevant sind“, sagt Jörg Pfeiffer. Seit Anfang Februar arbeitet der Redakteur bei der dpa auf der neu geschaffenen Stelle „Productmanager Automated Content & Data Journalism“. Sein Auftrag: Neue „datenjournalistische Produkte durch die Integration von technischem und journalistischem Knowhow entwickeln. Darunter fallen auch redaktionelle und journalistische Formate, die sich - ohne laufendes Zutun von Redakteuren - selbst generieren und automatisch aktualisieren. Dazu will man nicht nur auf Texte und Bilder aus dem eignen Archiv zurückgreifen, sondern auch auf relevante und verlässliche externe Inhalte und Daten. Doch das ist nicht so einfach: So fehlt bei Kommunalwahlen in Deutschland mangels einheitlichem Wahldatenstandard eine einheitliche, flächendeckende Datenbasis dafür.“

Trotz dieser Kinderkrankheiten lassen sich Automatisierungsprozesse grundsätzlich gut standardisieren und skalieren relativ schnell. In einem zumindest national vergleichsweise großen Markt wie Deutschland gibt es hier gute Chancen für Geschäftsmodelle.

Auch bei den redaktionellen Abläufen etablieren sich immer mehr automatisierte Prozesse. Denn das Zusammenspiel unterschiedlicher Anwendungen verspricht Effizienzgewinne und Mehrwerte: „Im Augenblick sind wir gerade dabei, die Systeme in Reihe zu bringen“, sagt AX-Semantics-Gründer Saim Alkan. Etwa wenn Bilderkennungssysteme ihre Daten an Textsysteme übergehen, die daraus einen Text machen. Welcher Spieler etwa das Tor geschossen hat, kann im Video die Bilderkennung heute meist selbstständig erkennen. Auch der Videoschnitt ließe sich automatisieren, sagt Alkan.

Wolfgang Zehrt und sein Team arbeiten etwa gerade für einen US-Verlag daran, aus vorhandenen schlechten Meldungen handwerklich bessere, also „journalistischere" Meldungen zu machen. Texte aus Daten seien im Vergleich dazu eher einfach, versichert er. Anstatt Textbausteine und Regeln setze man hier wirkliche KI in Form von Machine Learning ein. Dafür muss der Algorithmus nämlich trainiert werden: „Nach ein paar Tausend Beispielmeldungen hat unser Tool verstanden, wie es Meldungen zu diesen Themen schreiben muss“, sagt Zehrt. Dann suche sich die Software auch die Themen komplett selbst aus. „Das wird sehr interessant“, freut sich der Roboter-Journalist. 

Trotzdem verschwindet klassische journalistische und redaktionelle Arbeit nicht – die Autoren und Redakteure werden nur von einem Teil ihrer Aufgaben entlastet – vom eher simplen Teil. Der anspruchsvolle Anteil bleibt: „Wenn ich etwa eine KI über unsere Crimemap-Datenbank laufen lasse, dann wird die mir garantiert interessante Zusammenhänge aufdecken, denn in der Mustererkennung ist KI gut und das sollte man auch automatisieren“, sagt Plavec, „doch vermutlich werde ich aus fünfzig aus Sicht der KI auffälligen Mustern jene heraussuchen müssen, die auch für unsere Leser interessant sind.“ Und Urbs-CEO Alan Renwick sagt: „Roboterjournalismus ist nur so gut wie die Menschen, die ihn betreiben.“

 



 

            
                                                        

Olaf Deininger: Der Wirtschaftsjournalist und Digitalexperte blickt auf eine langjährige Erfahrung in leitenden Positionen zurück, unter anderem als Chefredakteur von „handwerk magazin“ (2014 bis 2019) in München, Entwicklungsleiter beim Deutschen Landwirtschaftsverlag (München), Chefredakteur beim Deutschen Sparkassenverlag in Stuttgart sowie Kreativdirektor/Chef der Entwicklung bei der Internetagentur PopNet (Hamburg). Olaf Deininger veröffentlichte Studien, Marktüberblicke und Produktvergleiche zu Business-Software und IT-Lösungen.

Die Zukunft ist schon da – Auswahl an KI-Anwendungen, die heute bereits im Einsatz sind