#6/ 2021
10/17

„Ein Kundenmagazin in drei Sprachen maschinenübersetzt – das funktioniert“

Neuronale Machine-Translation-Engines sind ein Meilenstein in der Technologieentwicklung

Die Firma Phoenix Contact im lippischen Blomberg hat sich vom Mittelständler zum Global Player im Bereich Elektrotechnik und Automation mit über 17.000 Mitarbeitern und Niederlassungen in mehr als 50 Ländern entwickelt. Dem wird das Unternehmen auch im Publishing gerecht: Das 68-seitige Kundenmagazin UPDATE, das in vier Sprachen erscheint, wird größtenteils maschinell übersetzt. Es ist sehr gut lesbar, der individuelle Schreibstil bleibt erhalten. Grund für uns, mit Steffen Schröder, Manager Translation Services bei Phoenix Contact, und Jasmin Nesbigall, Leitung MTPE beim Sprachdienstleister oneword, darüber zu sprechen, wie das geht.

Herr Schröder, kommen wir gleich zur wichtigsten Frage: Sie haben ein redaktionell sorgfältig aufgebautes Kundenmagazin und lassen es von einer Maschine in Englisch, Spanisch und Französisch übersetzen. Kann das gut gehen? Wie sind Ihre Erfahrungen?

Schröder: Machine Translation in Reinform kann natürlich nicht gutgehen. Dessen muss man sich bewusst sein. Vielleicht muss ich ein bisschen weiter ausholen, wie wir überhaupt dazu gekommen sind: Wir haben den Markt schon länger beobachtet. Als dann vor zwei bis drei Jahren neuronale Machine-Translation-Engines ihren Siegeszug antraten, war ziemlich schnell klar, dass die Qualität eklatant besser war als alles, was wir vorher am Markt gesehen hatten. Das war wirklich ein Meilenstein in der Technologieentwicklung.

Für uns war das auch der Impuls, uns intensiver mit Machine Translation zu beschäftigen. Zum einen, um die Entwicklung mitgestalten zu können und nicht von ihr überholt zu werden. Zum anderen aber auch, weil wir neugierig waren. Wir fanden hochinteressant, was da passiert. Phoenix Contact ist ein Technologieunternehmen, wir sind Innovationen gegenüber aufgeschlossen und finden heraus, welchen Nutzen wir daraus ziehen können.

Mit diesem Spirit sind wir ins Thema eingestiegen. Wir haben für uns Standarddokumente definiert, die wir dann über einen längeren Zeitraum mit verschiedenen Engines getestet haben. Wir haben sowohl externe Engines getestet als auch interne On-Premises-Lösungen. Die sind dann trainierbar und unternehmensspezifisch. 

Die Ergebnisse haben wir für uns bewertet. Und wir haben recht schnell gemerkt, dass diese reine Machine Translation nicht das ist, was wir suchen. Die Ergebnisse entsprachen nicht unseren Qualitätsansprüchen.

Auf welche Probleme sind Sie gestoßen? Und wie haben Sie diese gelöst?

Schröder: Zum einen stoßen Maschinen bei einigen Formulierungen an ihre Grenzen. Die Fehler fallen teilweise erst Muttersprachlern auf. Dann kommt dazu, dass wir viel mit Fachterminologie arbeiten. Wir haben für Fachwörter praktisch unser eigenes Unternehmenswörterbuch inklusive der passenden Übersetzungen. Das kann so eine Maschine per se erstmal nicht kennen. Und selbst wenn sie damit trainiert ist, wendet sie es nicht immer richtig an. Der Weg einer KI-basierten NMT zum Ergebnis ist nicht immer nachvollziehbar. 

Unser Stand war zu diesem Zeitpunkt: Wir wollten die neue Technologie ohne Qualitätseinbußen nutzen. Allein war uns das nicht möglich, daher haben wir uns an den Sprachdienstleister oneword gewandt. Gemeinsam haben wir einen Workflow erarbeitet, der neben der reinen maschinellen Übersetzung ein humanes Post-Editing einschließt. Das war der Gamechanger, der das Ganze dann auch für uns interessant gemacht hat.

Konkrete Nachfrage zum Kundenmagazin, das mir auch als Beispiel vorliegt: Wie gehen Sie da vor? Welche Erfahrungen haben Sie ganz praktisch auf dem Weg gemacht?

Schröder: Das Überarbeiten der maschinell vorübersetzten Texte durch muttersprachliche Posteditoren hat sich für uns als bestmöglicher Weg erwiesen. Es kombiniert das Optimum aus den Zielen Kosten- und Zeitreduktion per Machine Translation und unserem Qualitätsanspruch. Wir haben zunächst damit angefangen, verschiedene Publikationstypen mit MTPE (Machine Translation + Post-Editing, Anm. d. Red.) zu testen und sind schnell beim Kundenmagazin angekommen.

Der Prozess lief so ab, dass wir das fertige redaktionelle Magazin an oneword gegeben haben, und dann gab es die ersten MTPE-Projekte. Wir arbeiten bei vielen unserer Publikationen mit einem Review-Schritt in den internationalen Tochtergesellschaften. Das heißt, die muttersprachlichen Kollegen vor Ort bekommen die Übersetzung vor Veröffentlichung. Sie können dann noch Anmerkungen machen und Rückmeldungen geben. Eine Maschine übersetzt nicht immer so wie der Humanübersetzer vorher, und teilweise gab es noch Fehler, die durch die Maschine passiert sind. Zu Beginn hatten wir daher intensive Feedback-Schleifen zwischen oneword und den Tochtergesellschaften. Von Ausgabe zu Ausgabe haben wir die Abläufe optimiert, das Feedback eingearbeitet und dann auch weitere Sprachen reingenommen. 

Frau Nesbigall, Sie haben das Projekt als Dienstleister betreut: War es für Sie auch ein Lernprozess? Wie kann man den Aufwand dabei einschätzen? Wie hat das Ganze im Ablauf funktioniert?

Nesbigall: Es war ein Lernprozess mit allen Beteiligten. Natürlich gibt es Stilunterschiede im Vergleich der Maschine mit den vorherigen Humanübersetzern. Aber unser Vorteil war, dass wir die Stammübersetzer als Posteditoren gewinnen konnten. Denn die hatten ja schon den Background von Phoenix Contact, das ganze Know-how und kannten sich mit den Projekten aus. Dann begann der Lernprozess: Wie viel muss angepasst werden, damit wir weiterhin auf der gewohnten Stilebene bleiben? Inwieweit sind die Tochtergesellschaften informiert, dass der Prozess auf Machine Translation als Grundlage umgestellt wurde? Schließlich profitieren gerade die Tochtergesellschaften erheblich von der schnelleren Übersetzung – selbst wenn zu Beginn etwas mehr Review-Aufwand anfällt. Die Lokalisierung des Kundenmagazins ist durch MTPE nicht nur schneller, sondern unterm Strich auch günstiger geworden.

Der Begriff Machine Learning impliziert ja das Lernen. Insofern ist es ein normaler Prozess, an einem bestimmten Punkt zu starten und sich dann in Iterationen zum eigentlichen Produkt vorzuarbeiten. Doch eignet sich jeder Text für die maschinelle Übersetzung oder gibt es Unterschiede? In einem Spektrum von der technischen Dokumentation bis Günter Grass: Welche Textarten eignen sich und welche eignen sich gar nicht?

Nesbigall: Also, Schiller mit der Maschine zu übersetzen wäre schwierig. Rilke funktioniert dank simplerer Satzkonstruktion vielleicht schon eher. (Lacht.) Aber im Ernst: Wir sagen, dass wir keinen Text kategorisch ausschließen, weil wir immer erst eine Machbarkeitsanalyse durchführen. Nur wenn es sich ökonomisch für den Kunden lohnt, bieten wir Machine Translation an.

Was nun Textarten und Eignung angeht, ist das Besondere, dass sich die Engines durch das sogenannte Deep Learning ständig verbessern. So haben wir zum Beispiel vor drei Jahren noch Rechtstexte, Verträge etwa, komplett ausgeschlossen. Mittlerweile ist das eine der Textsorten, die am besten funktioniert. Weil bei diesen Texten viel standardisiert ist und die Maschinen mit einem enormen Corpus trainiert wurden.

Wichtig ist natürlich auch die Wahl der Engine, abhängig von der Textsorte und der Sprachkombination. Jede Engine hat individuelle Vor- und Nachteile. Wir haben zum Beispiel Engines, die sehr gut für Software, und welche, die sehr gut für Technik funktionieren. Als Dienstleister sehe ich uns in der Pflicht, am Ball zu bleiben und den Marktüberblick zu haben, statt immer die gleiche Maschine zu nutzen, nur weil diese besonders günstig ist oder aktuell gut passt. Das gilt sogar für den Fall, dass ein Unternehmen eine eigene Engine kauft und mit der eigenen Terminologie und den bisherigen Übersetzungen in Form von Translation Memorys trainiert. Da reden wir schnell über hohe Investitionskosten, 200.000 Euro sind da ein üblicher Einstiegspreis. Dann will man die Maschine natürlich auch nutzen, um die Kosten wieder einzuspielen. Doch gerade bei fachfremden Texten, wenn etwa ein Maschinenbauunternehmen einen Arbeitsvertrag übersetzen will, kann eine Engine, die auf Maschinenbautexte trainiert ist, unter Umständen schlechtere Texte produzieren als eine frei verfügbare Maschine. In einem solchen Fall empfehlen wir dann, mit einer generischen Engine zu arbeiten.

Das klingt sinnvoll. Wo endet dieses Vorgehen? Gibt es Grenzen?

Nesbigall: Auf jeden Fall. Ein Grenzfall sind zum Beispiel schlecht formatierte Text, aber die sind mir im Übersetzungsbereich eh ein Dorn im Auge, egal ob human oder maschinell übersetzt. Nicht selten steht in Textvorlagen nach jeder Zeile ein hard return, also ein Umbruch. Das sind oft Postscript-Fehler, die beim Kopieren aus PDF-Dateien entstehen. Derart umgebrochen, erkennt die Maschine dann zwei oder mehrere Sätze, obwohl es eigentlich ein einziger Satz ist, und versucht, aus jedem einzelnen Satzteil irgendetwas Sinnvolles zu übersetzen. Solche Ergebnisse sind dann wirklich unbrauchbar.

Die andere Grenze ziehen wir als Dienstleister mit der Machbarkeitsanalyse, denn Grundlage für uns ist immer die Wirtschaftlichkeit. Wir wollen durch die Maschine natürlich einen Zeit- und Kostenvorteil generieren, um diesen an unsere Kunden weiterzugeben. 

Den Grenzfall zur Unwirtschaftlichkeit sehe ich dann oft bei Kunden, die intern übersetzen und für alle Texte die maschinelle Übersetzung nutzen, mit dem Argument, dass dann zumindest schon mal was dasteht. Und dann wird geschaut, ob das passt oder ob es wieder gelöscht werden muss. Wir sehen das anders: Wenn das Ergebnis, auf gut Deutsch, Mist ist, dann muss der Übersetzer oder der Posteditor den Text erstmal lesen, dann entscheiden, dass große Teile nicht verwendet werden können, diese löschen und dann nochmal neu starten. Unterm Strich braucht das länger und ist teurer als die direkte Humanübersetzung.

Im Großen und Ganzen haben wir aber in allen Bereichen schon sehr gute Erfahrungen gemacht. Wir haben auch schon hervorragende Marketingtexte per MTPE übersetzt oder touristische Texte. Ganz aktuell zum Beispiel einen Wanderführer und für ein Museum in Stuttgart einige Objektbeschreibungen, beides ins Englische. Gerade in solch anspruchsvollen Fällen müssen wir vorab genau prüfen, wie rechercheintensiv und aufwändig das Posteditieren wird und ob sich durch MTPE Einsparungen ergeben können.

Die Machbarkeit von juristischen Texten hat mich jetzt überrascht. Gerade da hätte ich größere Risiken gesehen. Welche Risiken sehen Sie bei der maschinellen Übersetzung? Gibt es überhaupt welche, wenn das Post-Editing ordentlich gemacht wird?

Nesbigall: Also, schiefgehen kann auch bei einer Humanübersetzung etwas. Es ist menschliche Arbeit, und das ist beim Posteditieren nicht anders. Deshalb kommt es darauf an, wie viele Qualitäts- und Folgeschritte man macht. Phoenix Contact zum Beispiel setzt auch weiterhin auf das Posteditieren plus eine zusätzliche Revision. Also das klassische Vier-Augen-Prinzip.

Eines der größten Risiken ist die Versuchung, bei der Qualitäts- oder auch Risikoeinschätzung der Texte nachzulassen, wenn alles gut läuft. Phoenix Contact ist da ein schönes Gegenbeispiel: Hier besteht die Einstellung, die Zeit- und Kostenvorteile der neuen Technologie zu nutzen, wenn sich das anbietet. Aber eben nur, wenn der Qualitätsanspruch erfüllt wird. Andere verlassen sich einzig und allein auf den Posteditor. In dem Fall sind es allerdings bloß eine Maschine und zwei Augen, die da drüber geschaut haben. 

Den Qualitätsanspruch hochzuhalten, ist vor allem bei großen Textvolumen wichtig. Denn gerade dann eignet sich die Maschine. Bei einem 2-seitigen Flyer ist der Unterschied zur Humanübersetzung marginal. Beim Kundenmagazin von Phoenix Contact reden wir über mehr als 60 Seiten Text. Das hat früher circa zehn Tage gedauert und heute sind wir bei fünf bis sechs Tagen. 

Ein anderer kritischer Punkt ist die Datensicherheit, die in diesem Zusammenhang von vielen ignoriert oder unterschätzt wird. Denn in dem Moment, in dem ich einen Text zum Beispiel bei Google Translate oder DeepL eingebe, muss ich stark aufpassen, was ich da eingebe und was damit passieren kann. Der Text wird auf jeden Fall auf einem fremden Server gespeichert und für das Training der Maschine verwendet. 

Wir erleben immer wieder, dass auch hoch vertrauliche Inhalte, Forschungsergebnisse zum Beispiel, mal eben innerhalb der Unternehmen zum besseren Verständnis in solche Maschinen eingegeben werden. Gerade bei Dingen, an denen zum Beispiel auch Google forscht, wäre ich da sehr, sehr vorsichtig. Generell rate ich zur Vorsicht: Klar, den Speiseplan der Kantine, den kann man da durchaus übersetzen. Aber alles, was im Unternehmenskontext wichtig ist, würde ich nicht in frei verfügbare Maschinen eingeben. 

An dieser Stelle muss bei allen Mitarbeitern noch viel Aufklärungsarbeit geleistet werden, dass solche Texte im schlimmsten Fall anschließend irgendwo indexiert und verfügbar sein könnten.

Als Dienstleister arbeiten wir mit eigenen, gesicherten Systemen und wir garantieren unseren Kunden, dass deren Texte nicht anderweitig verwendet und gespeichert werden. 

Abschließend möchte ich Sie nochmal bitten, Herr Schröder, in die Zukunft zu blicken. Ihr Kundenmagazin erscheint aktuell in vier Sprachen. Sie sind in deutlich mehr Ländern aktiv. Werden Sie das nach und nach für alle anderen Länder ausrollen und MTPE weiter nutzen? Wie sind da Ihre Pläne?

Schröder: Es ist so, dass wir nicht jede Publikation in jede Sprache übersetzen, sondern uns nach den Anforderungen und Wünschen unserer Tochtergesellschaften richten. Hinzu kommt, dass für bestimmte Publikationen im Marketing Standardsprachen festgelegt sind.

Bei technischen Dokus halten wir uns an die Vorgaben, zum Beispiel durch die EU. Wenn ich ein Produkt in Europa verkaufen will, muss ich die Dokumentation entsprechend der Richtlinien dann in fast 20 Sprachen vorliegen haben. Auch da haben wir mit MTPE erste Erfahrungen gemacht. Wir werden diesen Weg auf jeden Fall weitergehen, allerdings mit Augenmaß. 

Wie Frau Nesbigall schon gesagt hat, bieten Maschinen nicht bei allen Texttypen und Sprachen die gleiche Qualität. Der Geschwindigkeitsvorteil von MTPE ist super. Den brauchen wir immer mehr und nehmen ihn gerne mit. Wir haben gute Erfahrungen gemacht, und wir gehen diesen Weg auf jeden Fall weiter – wohl wissend, dass bestimmte Dinge noch nicht funktionieren. Das ist wirklich eine ständige Neubewertung gemeinsam mit oneword.

Ein schöner Schlusssatz. Frau Nesbigall, Herr Schröder, danke für das Gespräch.




Jasmin Nesbigall ist Diplom-Übersetzerin und seit 2010 bei der oneword GmbH in Böblingen. Sie leitet den Fachbereich MTPE und Terminologiemanagement und betreut und berät Unternehmen, die Machine Translation für sich nutzen möchten.

Steffen Schröder studierte in Aachen und Großbritannien Betriebswirtschaftslehre, war in der Strategie- und Organisationsentwicklung verschiedener Konzerne tätig und leitet seit 2017 als Manager Translation Services das Übersetzungsmanagement bei Phoenix Contact. In dieser Position verantwortet er auch die Übersetzung des Kundenmagazins UPDATE.