#24/ 2018
4/11

medien und künstliche intelligenz

Künstliche Intelligenz (KI) und deren Bedeutung für Medien und Journalismus – dabei geht es nicht um eine „starke“ künstliche Intelligenz, die sich mit den allgemeinen Problemlösungsfähigkeiten eines Menschen messen kann. Sondern vielmehr darum, für welche fachspezifischen Aufgaben eine „schwache“ künstliche Intelligenz absehbar heute schon eingesetzt werden kann. 

Neuronale Netzwerke als Impulsgeber der KI

Nach dem Schub, den regelbasierte Systeme („Expertensysteme“) der KI in den Achtzigerjahren gegeben hatten, stehen heute künstliche neuronale Netzwerke (artificial neuronal networks, ANNs) mit Mittelpunkt des technischen Fortschritts. Die Möglichkeiten solcher Systeme stützen sich insbesondere auf:

  • die Leistungsfähigkeiten moderner Hardware wie Grafikprozessoren. Diese können die Operationen in den einzelnen Neuronen des Netzwerks massiv parallel abarbeiten.
  • die Fähigkeiten des maschinellen Lernens, mit denen sich ein solches neuronales Netzwerk an vorgegebene Ein-/Ausgabemuster anpassen kann. In der Strukturierungsform eines neuronalen Netzwerks mit vielen verborgenen Zwischenschichten zwischen Ein- und Ausgabelayer ist ein solches Netzwerk insbesondere in der Lage, unbekannte Strukturen in den Eingabedaten selbstständig zu erlernen („deep learning“).

Die Fähigkeit des maschinellen Lernens bedeutet eine in ihrer wirtschaftlichen Relevanz nicht zu unterbewertende Effizienzsteigerung. Schon in den Achtzigerjahren des letzten Jahrhunderts stand KI im Mittelpunkt des technischen Fortschrittes. Die Euphorie dieser Jahre war durch die neuen Möglichkeiten von regelbasierten Expertensystemen in den Einsatzfeldern Diagnose uns Konfiguration geprägt. Der Preis dieses Erfolgs aber war ein hoher manueller Pflegeaufwand für das Expertenwissen – sowohl für Akquisition und Pflege des zugehörigen, strukturierten Datenmodells wie auch der Inferenzregeln, mit denen Schlussfolgerungen aus den Daten abgeleitet werden. Dieser Pflegeaufwand war der Grund, warum sich solche Systeme nicht nachhaltig durchsetzen konnten. Der „KI-Winter“ der Neunzigerjahre machte deutlich, dass die Pflege solcher Expertensysteme mit wirtschaftlichem Aufwand praktisch nicht möglich war.

Dies sollte heute beim Thema Roboter- bzw. Datenjournalismus nachdenklich stimmen, dessen Textgenerierung überwiegend auf einem regelgesteuerten Vorgehen beruht.

Maschinelles Lernen mit neuronalen Netzwerken

Um ANN-Qualitätsergebnisse von 90 Prozent und mehr zu erreichen, ist die Verwendung des überwachten Lernens heute der Regelfall. Dabei werden von Menschen bewertete, paradigmatische positive wie negative Trainingsbeispiele eingesetzt. Ein unbeaufsichtigtes (selbst)bestärkendes Lernen von ANNs ist eher noch Zukunftsmusik. KI-Leuchttürme wie Googles AlphaGo-Programm, das 2016 erstmalig einen der weltbesten menschlichen GO-Brettspieler schlagen konnte, weisen allerdings genau in diese Richtung. Das KI-System verwendet zwei ANNs, jeweils eines, um den nächsten Zug zu generieren, und eines, um die Spielposition zu bewerten. Seine Spielstärke gewann das System, indem es mehrere Millionen Spiele gegen sich selbst spielte und dabei seine Strategie erlernte.

Anwendungsfelder künstlicher Intelligenz in den Medien

Im Bereich der Medien zeichnen sich heute vier Einsatzbereiche für künstliche Intelligenz ab. Drei dieser Einsatzbereiche sind Anwendungen von ANNs. Natürlich ist KI als Wissenschaftsdisziplin deutlich mehr als ANNs und maschinelles Lernen. 

I Prädiktive Wartung in der Drucktechnik

Durch die Digitalisierung und Vernetzung stehen heute vielfältige sensorische Daten von allen technischen Komponenten eines Drucksystems zur Verfügung. Die Integration und Verdichtung dieser Daten lassen einen bevorstehenden Ausfall eines Drucksystems schon im Vorfeld erkennen. Fachleute gehen davon aus, dass zukünftig 80 Prozent der Wartung von Drucksystemen von entsprechend spezialisierten Dienstleistern durchgeführt wird, und die Verlage höchstens noch 20 Prozent der Wartung, typischerweise die Reparaturen in Notfallsituationen, selbst vornehmen.

II Inhaltserschließung von Texten, Bild- und Videodaten

Die KI-basierte automatische Inhaltserschließung von Bild- und Videodaten bietet für die redaktionelle Arbeit wahrnehmbare Effizienzsteigerungen. Für Texte beinhaltet dies die textuelle Erkennung von Personen, Objekten und Orten des Geschehens, von denen im Text die Rede ist („entity extraction“). Dies ermöglicht es, dem Text passende verwandte Artikel, Bilder und/oder Werbung zuordnen zu können.  Dieser Service wurde und wird von den großen Suchmaschinen (wie FAST) schon seit einer Dekade zu Premiumpreisen angeboten und erforderte einen hohen Pflegeaufwand. Der Service ist jetzt für einen Bruchteil der Kosten möglich. Neu hinzu gekommen sind jetzt mit KI Unterstützung die Motiverkennung in Bildern und Videos sowie die visuelle Erkennung von bekannten Personen des öffentlichen Lebens („celebrities“). In der Summe bieten die KI-Techniken eine wesentlich reichhaltigere, automatische Zuordnung von Metadaten zu Texten, Bildern zu attraktiven Preisen und entlasten den Redakteur/Reporter von dieser Aufgabe. Für Sportvideos ist mit KI Verfahren eine automatische Verdichtung des Inhaltes auf die spielentscheidenden Szenen möglich. Der Filmproduzent UFA setzt neuronale Netzwerke etwa für die automatische Übersetzung und Untertitelung von Serienvideos in sehr viele andere Sprachen ein. Eine manuelle Synchronübersetzung solcher Serienvideos wäre aus Kostengründen überhaupt nicht wirtschaftlich.

III Inhaltsgenerierung, Datenjournalismus

Die datengesteuerte, automatische Generierung von Wetterberichten, von Sportberichten (z. B. im Breitensport, Washington Posts Heliograf) und von Unternehmensberichten (z. B. Bloomberg) nimmt aus Kostengründen einen immer breiteren Raum im Journalismus ein. Bei Bloomberg enthält schon ein Viertel aller Texte in den Produkten des Unternehmens automatisch generierte Inhalte. Die ethische Frage, ob solche Berichte explizit als Roboter- bzw. Datenjournalismus gekennzeichnet werden sollten, wird vielerorts kontrovers diskutiert.

IV Personalisierter Inhalt und Service

Die Personalisierung von redaktionellen Inhalten und werblichen Angeboten ist heute eine der unstrittigen Stärken von Amazon, Facebook, Netflix und vielen mehr. Die Personalisierung erfolgt auf Basis eines mit KI-Verfahren erstellten individuellen Interessensprofils für jeden Nutzer dieser Dienste. In den Medien dominiert Netflix den Einsatz von KI-Verfahren zur Personalisierung seiner Angebote; das Thema gewinnt aber auch gerade für personalisierte elektronische Programmführer (EPG) für Hörfunk und Fernsehen zunehmend an Bedeutung.

Eine besondere Bedeutung haben natürlichsprachliche Chatbots im Kundenservice. Sie können heute nicht nur die typischen Anfragen und Beschwerden von Kunden erkennen, im Dialog verarbeiten und das Notwendige veranlassen. Die KI kann auch die aktuelle Gefühlslage eines Kunden aus seiner Sprache erkennen. Sie kann dann entsprechend korrektiv reagieren. Oder einen menschlichen Service Agenten entsprechend informieren, an den das Gespräch nach Klärung des grundsätzlichen Kundenanliegens weitergereicht wird. Typischerweise wird der Chatbot auf Basis des individuellen Kundenprofils das Gespräch steuern. In dieses Profil fließen die Historie der Kundenbeziehung und die erkannte Gefühlslage des Kunden aus dem aktuellen Gespräch ein. Insbesondere wird das Kündigungsrisiko ermittelt. Durch eine entsprechende Tonalität und Konzessionsbereitschaft des Gesprächs sowie spezifische Angebote versucht der Chatbot, eine solche Kündigung möglichst zu vermeiden.

Demokratisierung der künstlichen Intelligenz

Unter diesem Motto bieten die großen Plattformbetreiber – wie Amazon, Google – pay-per-use-Services für einen einfachen Zugang zu KI-Technologien an. Amazons AWS bietet etwa den Zugriff auf KI-Technologien in drei Ebenen an. Application services erlauben die Verwendung von vortrainierten neuronalen Netzwerken für Bilder und Sprache. Sie sind ohne Kenntnisse der dort eingesetzten KI Technologien durch Kunden zu verwenden. Die Ausgangsdaten müssen aber stets zuvor in die S3 Cloud des Anbieters geladen werden.

  • Für Bilder und Videos leisten die Services eine Inhaltserschließung durch Generierung von Metadaten. Weiter können Personen und Texte in Bildern erkannt und in Videostreams verfolgt werden, inklusive der Erkennung bekannter Persönlichkeiten des öffentlichen Lebens.
  • Die Sprachservices bieten eine Erkennung gesprochener Sprache, Inhaltserschließung („entity extraction“), Erkennung der Gefühlslage (sentiment) des Sprechenden, Übersetzung, Generierung gesprochener Sprache und die Konfigurierung von Chatbots an. Diese Services kommen auch für die Echo/Alexa Produkte des Anbieters zum Einsatz.


Künstliche Intelligenz (KI) als Schlüsseltechnologie des 21. Jahrhunderts

Es ist eine zunehmend verbreitete Einschätzung, dass künstliche Intelligenz eine der Schlüsseltechnologien des 21. Jahrhunderts sein wird. Man sollte sich aber über den aktuellen Stand des Einsatzes dieser Technologie im Alltagsleben keinen Illusionen hingeben. Vor Kurzem stürzte eine nagelneue Boeing 737 Max in Indonesien ab – offenkundig wegen technischer Probleme. 189 Menschen verloren ihr Leben. Boeing bietet für die Maschinen dieser Bauart sein „Onboard Network System (ONS)“ an. Unter Verwendung einer Satellitenverbindung zum Flugzeug ist mit ONS in Echtzeit eine Analyse der aktuellen technischen Daten des Flugzeuges sowie eine prädiktive Analyse fehlerhafter Aggregate der Maschine möglich. Das ONS realisiert damit auch eine Echtzeit „Black Box“ des Flugzeuges. Das System war bei der Fluglinie (aus wirtschaftlichen Gründen) nicht in Verwendung. Unter anderem wehren sich Pilotenverbände gegen eine laufende Überwachung ihrer Maschinen – und damit Ihrer fliegerischen Tätigkeit. Künstliche Intelligenz hat also noch mit deutlichen Akzeptanzproblemen in der Praxis zu kämpfen. Selbst dann, wenn es um Hunderte von Menschenleben und Investitionsgüter in mehrstelliger Millionenhöhe geht.

Bei einer Befragung von Bürgern Deutschlands, Frankreichs, Spaniens, der USA, Großbritanniens, Kanadas und China war die Ablehnungsquote von künstlicher Intelligenz mit 20 % in Deutschland von allen Ländern am höchsten, mit 2 % in China am niedrigsten (USA, Großbritannien, Frankreich, jeweils: 10 %, 12 %, 14 %).

In China besitzt das Thema künstliche Intelligenz einen strategischen Stellenwert in der wirtschaftlichen Entwicklung. Der chinesische Staat sieht die Zukunftstechnologie nicht nur als Eckpfeiler zur Sicherung seiner Position als zukünftige Supermacht. China möchte bis 2030 im Bereich der KI nicht nur eine technisch/wirtschaftliche Spitzenposition erreichen. KI wird dort auch in einer politischen Dimension als geeignete technologische Basis zur flächendeckenden Überwachung der Bevölkerung und Sicherung der Stabilität des politischen Systems gesehen. Nach einer Prognose der OECD werden im Jahr 2030 jedenfalls etwa 37 % der Hochschulabsolventen aus den OECD/G20 Staaten in den relevanten KI-Wissenschaftsfächern Informatik, Mathematik, den Natur- und den Ingenieurwissenschaften aus China kommen. Die USA und Russland steuern noch ca. 4,5 % der Absolventen bei, Deutschland ganze 1,4 %!

Dr.-Ing. Rainer Lutze ist Inhaber der gleichnamigen Unternehmensberatung, die seit der Jahrtausendwende Medienunternehmen im Bereich der digitalen Transformation und Internettechnologien berät. Dr. Lutze hat an der TU Darmstadt Informatik studiert und dort promoviert. Er beschäftigt sich seit vielen Jahren mit Anwendungen und dem Einsatz von Künstlichen Intelligenz in der Praxis. Dazu gehören – neben den Medien – die Bereiche eHealth und Actively Assisted Living (AAL). Dr. Lutze berichtet regelmäßig in seinen Blogs http://www.augenhoehe.eu und http://www.wearables-at-work.biz über entsprechende aktuelle Entwicklungen in den Bereichen des digitalen Journalismus und von Wearables.

Künstliche Intelligenz kurz erklärt