KI trifft auf Kundenerwartungen
von Regina Seelos
Wissenschaft bestätigt eigene Erfahrungen:
MÜ, MT, KI oder AI ... halten uns Übersetzer und Dolmetscher auf Trab
Ja, die Maschinen sind besser geworden. Aber sie erreichen immer noch nicht das Niveau menschlicher Übersetzungen, u. a. weil das Verständnis fehlt. Und inhaltliches Verständnis des Ausgangstextes ist das A und O bei der Übersetzung wie auch beim Dolmetschen. Die Maschine kann im Gegensatz zum Menschen keine Zusammenhänge erfassen, denn sie versteht nicht. Bezüge, die mehrere Sätze zurückliegen, oder Zusammenhänge, die nur aus dem Text insgesamt oder dem Weltwissen des Übersetzers hervorgehen bzw. aus dem Briefing des Kunden, unter anderem für welche Zielgruppe ein Text bestimmt ist, können zwar zufällig stimmen, aber wer möchte sein Glück schon dem Zufall überlassen? Denn KI-basierte oder neuronale maschinelle Übersetzungen (MÜ oder MT) und auch Large-Language-Modelle (LLM) arbeiten, vereinfacht gesagt, mit statistischen Wahrscheinlichkeiten. Diese Wahrscheinlichkeiten basieren auf riesigen Datenmengen, die im großen weiten Internet zusammengesammelt wurden und werden (oft geklaut, manchmal wohl auch rechtmäßig erworben).
Aus diesem Grund hängt deren Qualität z. B. auch von der Sprachkombination ab. Je verbreiteter eine Sprache ist und je mehr Daten von hoher Qualität zur Verfügung stehen, desto besser. Im Umkehrschluss gilt, dass die Qualität des Outputs mit schlechterer Datenlage abnimmt. Was ich schon früh befürchtet habe, bestätigten die Wissenschaftler auf der ASTT-Tagung 2022 an der Universität Germersheim: nämlich, dass sich die Qualität des Outputs über die Zeit verschlechtern könnte. Die bisherigen Trainingsdaten stammen in der Regel von von Menschen erstellten Übersetzungen. Das heißt, die Qualität des Ausgangsmaterials ist im Moment noch gut. Gleiches gilt im Grunde für LLM wie ChatGPT, wo dieses Phänomen bereits sichtbar wird. Je mehr "Müll" eingesammelt und zum Training der MÜ oder KI verwendet wird, desto mehr wird die Qualität leiden und mehr Nacharbeit oder "Postediting" notwendig sein.
MÜ/MT oder KI nutzen, wo es passt
Im Rahmen der Tekom 2022 verkündete ein Unternehmen den Erfolg, dass nach langer Entwicklungs- und Terminologiearbeit 45 % des Textes kein Post-Editing mehr benötigen. 45 %! Nicht so deutlich ausgesprochen wurde die Schlussfolgerung: Die restlichen 55 % müssen aber noch bearbeitet werden. Um diese 55 % zu editieren, also zu lesen, zu bearbeiten und zu korrigieren, wird man sich auch die anderen 45 % anschauen müssen, um den Kontext zu kennen, in dem ein Satz steht. Das ist genau das, was die Maschine nicht kann. Und bei diesen Zahlen ging es vermutlich um eher technische Texte, bei denen die Sprache oft standardisiert ist und Sätze meist kürzer sind als z. B. im juristischen Bereich.
Es spricht einiges dafür, maschinelle Übersetzung gezielt dort einzusetzen, wo es passt. Ich arbeite inzwischen mit einer eigenen Engine für einen bestimmten Einsatzbereich, um dort rationeller und auch für Kunden kostengünstiger arbeiten zu können. Es ist aber kein Universalwerkzeug für jeden Auftrag. Denn MÜ/MT oder KI ist nur dort sinnvoll, wo es die Arbeit tatsächlich beschleunigt oder verbessert. Wenn weder das eine noch das andere auf ein Werkzeug oder einen Anwendungsbereich zutrifft, wird man besser davon absehen. Auch wenn es KI oder MÜ/MT ist und nach Hightech klingt.
Keine Abstriche bei Kundenerwartungen
"Postediting light" ist tot - lautete die Aussage auf der ASTT-Tagung 2022. Wer nur wissen möchte, was ungefähr in einem Dokument oder auf einer Website geschrieben steht, für den reicht die Maschinenqualität heute schon aus. Bei allem, was veröffentlicht wird oder rechtssicher sein soll, liegt der Fall anders. Hier ist eine gründliche und leider auch zeitintensive Nachbearbeitung (auch Postediting genannt) erforderlich. Die Anbieter von KI und MÜ haften nicht, wenn Dinge ungeprüft übernommen werden.
Diese Aussage zum Light Postediting bestätigt sich auch im Feedback von Kunden - die bei nur leichter Bearbeitung zur Beseitigung echter Fehler eine "wörtliche oder etwas steife Übersetzung" bemängeln. Wenn es authentisch klingen soll, muss auch stilistisch überarbeitet und umformuliert werden. Dies braucht Zeit und erhöht wieder den Aufwand, den man sich erhoffte mit der Maschinenübersetzung weitgehendst einsparen zu können. Es braucht daher definitiv mehr Aufklärung und Absprache dahin gehend, was vom Kunden erwartet wird, was MÜ leisten kann oder eben nicht. Wie stark soll in die von der Maschine gelieferte Übersetzung eingegriffen werden? Ab wann ist der Aufwand höher als bei herkömmlicher Übersetzung?
Einsparpotenzial oft geringer als erwartet
Das Einsparpotenzial wird oftmals geringer ausfallen, als viele zunächst erwarten. Wenn man eine maschinelle (und übrigens auch manuell erstellte) Übersetzung überprüft, müssen sowohl Ausgangs- als auch Zieltext gelesen werden - und nicht nur der Ausgangstext, wie es beim manuellen Übersetzen der Fall ist. Dann muss verglichen und beurteilt werden, ob Änderungen erforderlich sind, die dann gegebenenfalls noch eingearbeitet werden müssen. Diese unterschiedlichen Prozesse und Prozessschritte sind vielen nicht bewusst. Ein weiteres Problem ist, dass schon die Einspeisung in ein System zur maschinellen Übersetzung oder auch Modelle wie ChatGPT bearbeitbare, elektronisch verfügbare Texte erfordert. Ansonsten kommt zur Nachbearbeitung noch die Vor- oder Aufbereitung hinzu. Der zeitliche Aufwand dafür ist oft ebenso nicht gering.
Das heißt nicht, dass keine Einsparungen möglich sind. Sie fallen möglicherweise nur sehr viel geringer aus, als der Laie sich das gemeinhin vorstellt. Zumindest dann, wenn vergleichbare Qualität erwartet wird.
(Überarbeitet September 2024)