Maschinelle Übersetzung
Die maschinelle Übersetzung (kurz: MÜ) hat in den vergangenen Jahren eine rasante Entwicklung genommen und ist aus dem Standartrepertoire eines Übersetzungsbüros nicht mehr wegzudenken. Die Branche vermutet sogar, dass diese von einer KI ausgeführte Übersetzung bald die Qualität einer Humanübersetzung erreicht. Damit könnte selbst in der Fachübersetzung bald der Humanübersetzer verdrängt werden. Bis dahin kann das allerdings noch lange dauern, da rein maschinellen Übersetzungssysteme ohne die Unterstützung eines Menschen noch zu fehleranfällig sind. Wie wird derzeit also sinnvoll maschinell übersetzt?
Hier erfahren Sie, welche Vor- und Nachteile die verschiedenen vollautomatischen MÜ-Systeme haben und wie auch bei uns hochwertige maschinelle Übersetzungen mit einem eigens dafür entwickeltem Lektorat möglich sind.
Jetzt unverbindliches Angebot anfordern!
Wir helfen Ihnen gerne mit hochwertigen Übersetzungen, Ihre internationalen Geschäfte und Abläufe effizient und sicher zu gestalten. Dürfen wir Sie unterstützen? Dann fordern Sie jetzt ein unverbindliches Angebot an.
Was ist die maschinelle Übersetzung?
Bei der maschinellen Übersetzung wird ein Text mittels Computer (bzw. KI) ohne menschliche Interaktion übersetzt. Die hierfür verwendeten Tools sind sogenannte maschinelle Übersetzungssysteme, die sich in ihrer Funktionsweise teils stark unterscheiden. Unterteilt werden diese Systeme derzeit in drei verschiedene Ansätze des maschinellen Übersetzens: Der statistischen, der regelbasierten und der neuronalen maschinellen Übersetzung.
Regelbasierte MÜ-Systeme
Regelbasierte MÜ-Systeme funktionieren basierend auf einer Kombination aus Sprachalgorithmen, Grammatik sowie Wörterbüchern für allgemeines Vokabular. Sie analysieren diese Texte und bewerten diese selbstständig. Das System nutzt für die maschinelle Übersetzung somit Wörter nach festgelegten linguistischen Regeln – und orientiert sich dafür nicht an den statistisch am häufigsten eingesetzten Worten.
Regelbasierte Systeme können auch mit menschlich eingepflegter Terminologie und eigens festgelegten Regeln verbessert und weiterentwickelt werden. Hierzu gehört z.B. das Einpflegen spezifischer Wörterbücher für Fachvokabular. Das führt beim maschinellen Übersetzen mit regelbasierte Systemen in aller Regel zu konsistenten Übersetzungen mit exakter Terminologie. Allerdings zulasten des Text- und Leseflusses.
Statistische MÜ-Systeme
Statistische MÜ-Systeme müssen vor ihrer allerersten maschinellen Übersetzung mit großen Mengen Ausgangs- und Zieltext gefüllt werden. Erst dann können diese selbstständig arbeiten. Diese Voraussetzung kann sich bereits als erstes Manko herausstellen, falls diese Daten nicht vorliegen. Mit Hilfe dieser großen Datenmengen lernen diese Systeme das Übersetzen nach Wahrscheinlichkeit und Statistik. Es werden keine linguistischen Methoden verwendet, sondern lediglich ausgewertet, welche Übersetzung für ein Wort am häufigsten verwendet wird. Zusätzlich wird noch verglichen, wie es im Zusammenspiel mit anderen Worten (davor und danach) benutzt wird.
Meist liefern diese Systeme flüssigere, dafür aber weniger konsistente Übersetzungen ab. Gut geeignet ist das statistische maschinelle Übersetzen für allgemeinsprachliche Übersetzungen. Allerdings hat es aufgrund fehlender Konsistenz in Terminologie Schwächen in der Fachübersetzung, beispielsweise innerhalb der Technik oder Medizin.
Neuronale MÜ-Systeme
Neuronale MÜ-Systeme (auch: NMT für „Neural Machine Translation“) gehören zu den vielversprechendsten Entwicklungen in der maschinellen Übersetzung. Diese Systeme bauen auf Deep Learning auf – die Maschine lernt das Übersetzen mit Hilfe seines großen neuronalen Netzwerks und der Analyse einer großen Anzahl von bereits übersetzten Texten. Die Verarbeitungsgeräte und -algorithmen sind nach dem Vorbild des menschlichen Gehirnes aufgebaut. Das System versucht den Text zu verstehen und den gesamten Kontext des Satzes in die Zielsprache zu übermitteln, statt Wort für Wort zu übersetzen. Ein angelerntes MÜ-System erkennt problemlos Muster im Text und findet Kontexthinweise, die dann in eine passende Übersetzung münden.
Bei vielen Sprachenpaaren liefert das neuronale maschinelle Übersetzen mittlerweile deutlich bessere Ergebnisse als seine beiden Vorgänger, das regelbasierte und statistische maschinelle Übersetzen. Allerdings sind auch diese neueren Systeme nicht frei von Fehlern, sodass wir bei maschinell übersetzten Texten immer eine Nachbearbeitung durch einen Menschen empfehlen.
Was ist der Unterschied zu Translation Memory Systemen?
Bei einer maschinellen Übersetzung handelt es sich um eine vollautomatische Übersetzung mit Hilfe eines Übersetzungstools. Aus gegenwärtiger Sicht erreichen maschinell übersetzte Texte noch nicht die Qualität einer menschlichen Übersetzung. Aus diesem Grund folgt nach jeder maschinellen Übersetzung noch ein professionelles Lektorat bzw. ein sogenanntes Post-Editing, das ein Fachübersetzer ausführt.
Ein Translation Memory hingegen unterstützt den Übersetzer beim Übersetzungsprozess. Der Übersetzer bleibt der ursprüngliche Autor der Übersetzung und verwendet die Translation Memory nur als Hilfe. Das TM schlägt auf Grundlage der Daten aus vergangenen Projekten in die gleiche Sprache mögliche Übersetzungen vor, die der Übersetzer in seinem Zieltext übernehmen kann.
Expertenwissen zur maschinellen Übersetzung in unserem Übersetzer-Podcast
Die Voraussetzungen für hochwertige maschinelle Übersetzungen
Eine wesentliche Voraussetzung für ein hochwertiges Ergebnis der maschinellen Übersetzung ist die Qualität Ihres Ausgangstexts. Sind in diesem bereits zahlreiche Fehler, werden diese von der KI in der Zielsprache übernommen. Dabei geht es nicht nur um die richtige Grammatik, der fehlerfreien Rechtschreibung oder Zeichensetzung. Besonders hilfreich ist demnach das übersetzungsgerechte Schreiben, was manche Fehler bereits vor ihrer Entstehung verhindert. Dazu gehört auch ein gutes Terminologiemanagement innerhalb Ihres Unternehmens, welches ausführlich in einer Datenbank dokumentiert wird.
Während das übersetzungsgerechte Schreiben bereits in der Humanübersetzung ein wesentlicher Faktor für die Übersetzungsqualität ist, kommt dem bei der maschinellen Übersetzung eine noch größere Rolle zu. Je strukturierter und logischer ein Ausgangstext aufgebaut ist, desto weniger hat ein maschinelles Übersetzungssystem Probleme mit der korrekten Wiedergabe in der Zielsprache.
Die Machine Translation Engines: Wie Maschinen das Übersetzen lernen
Hochwertige Ausgangs- und Zieltexte sind außerdem von Vorteil, um dem System das Übersetzen überhaupt erst beizubringen. Ein neuronales maschinelles Übersetzungssystem benötigt bis zu 500.000 Sätze in der Ausgangs- und Zielsprache, um in der entsprechenden Sprachrichtung eine Engine einzurichten (bspw. Deutsch -> Englisch). Erst dann ist die vollautomatische maschinelle Übersetzung möglich. Gleichzeitig bedeutet das, dass Sie für die entgegengesetzte Sprachrichtung eine weitere angelernte Engine benötigen.
Die Grundregel zum Anlernen dieser Machine Translation Engines lautet, dass wenige hochwertige Daten mehr helfen als doppelt so viele von minderer Qualität. Doch selbst die besten Voraussetzungen garantieren keine fehlerfrei maschinell übersetzten Texte. Wir empfehlen, dass Sie jeder maschinellen Übersetzung ein Lektorat von einem Humanübersetzer anschließen – das sogenannte Post-Editing.
Maschinelle Übersetzung mit Post-Editing nach DIN EN ISO 18587
Post-Editing beschreibt die Überprüfung und Nachbearbeitung von maschinell übersetzten Texten. Hierbei korrigiert ein Humanübersetzer die stilistischen sowie sinnendstellenden Fehler in der Übersetzung. Dieses Verfahren ermöglicht es, viele der genannten Probleme von MÜ-Systemen aus dem Weg zu gehen. Ein Lektorat kann bei ordentlicher Überprüfung der maschinell übersetzten Texte jegliche Fehler erkennen und ausmerzen.
Spezielle Anforderungen an dieses Verfahren sind in der Norm DIN EN ISO 18587 vermerkt. Demnach muss ein qualifizierter Fachübersetzer das Lektorat bzw. Post-Editing durchführen. Hierfür hat er bestenfalls schon Erfahrungen als Lektor gesammelt und ist der maschinellen Übersetzung gegenüber unvoreingenommen. Eine detaillierte Auflistung aller Qualifikationen finden Sie in der Norm selbst.
Unterschieden wird unterdessen zwischen zwei Arten des Post-Editings: Dem Light und dem Full Post-Editing.
Light Post-Editing
Das „leichte“ Post-Editing beinhaltet ein schnelles Editieren und Korrigieren der maschinellen Übersetzung. Hierdurch erhalten Sie einen verständlichen und inhaltlich korrekten Text. Dieser kommt nicht unbedingt oder nur selten an die Qualität einer Humanübersetzung heran.
Stilistisch oder inhaltlich nimmt das Lektorat kaum Änderungen vor, solange sich der Text in einem verständlichen Rahmen bewegt. Diese Übersetzungen sind also eher nicht für die Augen ihrer Kunden bestimmt, sondern vor allem für die unternehmensinterne Verwendung vorgesehen.
- Lediglich sinnverfälschende Fehler werden überarbeitet.
- Grammatik-, Rechtschreib- und Zeichensetzungsfehler im tolerablen Bereich bleiben.
- Der Stil bleibt unberührt, solange hierbei ein verständlicher Text entsteht.
Full Post-Editing
Beim „vollen“ Post-Editing überprüft und korrigiert das Lektorat den maschinell übersetzten Text so umfangreich, dass dieser sich bestenfalls nicht mehr von einer Humanübersetzung unterscheidet. Dennoch bleiben große Teile der maschinellen Übersetzung unberührt. Der Arbeitsaufwand gegenüber einer normalen Humanübersetzung wäre sonst zu gering und nicht lohnenswert.
Das finale Ergebnis der maschinellen Übersetzung muss nach einem Full Post-Editing nicht nur verständlich, sondern ebenfalls stilistisch angemessen sein. Idealerweise kann der maschinell übersetzte Fachtext sich dann mit rein menschlichen Fachübersetzungen messen lassen. Derzeit gelingt es den MÜ-Systemen jedenfalls nicht alleine, in die Qualitäts-Regionen der Humanübersetzung vorzustoßen. Hierfür fehlen ihnen insbesondere die Fähigkeit, sprachliche Nuancen in der Zielsprache passend wiederzugeben. Das ist gleichzeitig auch der Grund, warum MÜ-Systeme selbst derzeit keine Option in der Marketing- oder Literatur-Übersetzung darstellen.
Das Wichtigste auf einem Blick:
- Übernahme großer Teile der maschinellen Übersetzung.
- Überprüfung auf Vollständigkeit der Inhalte und Informationen.
- Anpassung abweichender Inhalte und Umstellung von Sätzen bei Bedeutungsänderungen.
- Einhaltung allgemeiner grammatikalischer, syntaktischer und semantischer Regeln.
- Berücksichtigung kunden- und fachspezifischer Terminologie.
- Einhaltung von Rechtschreibungs-, Zeichensetzungs- und Silbentrennungsregeln.
- Verwendung eines angemessenen Stils, Redaktionsleitfaden etc.
- Anwendung von Formatierungsregeln und weiteren Vorgaben des Kunden.
Grenzen der maschinellen Übersetzung
Tatsächlich sind MÜ-Systeme inzwischen so weit entwickelt, dass das maschinelle Übersetzen allgemeinsprachlicher Ausgangstexte nahezu einwandfrei funktioniert. Grundvoraussetzung ist dabei, dass es sich um eine mit großen Datenmengen angelernte KI handelt. Doch selbst das beste MÜ-System bietet keine hundertprozentige Sicherheit, dass ein maschinell übersetzter Text fehlerfrei ist. In vielen Bereichen spielt der Faktor Mensch noch die größte Rolle. Denn gerade dann, wenn die Bedienenden des MÜ-Systems die Zielsprache wenig oder gar nicht beherrschen, sind Übersetzungsfehler sehr wahrscheinlich.
Fehlerquelle Homographen
Eine große Gefahr bei maschinell übersetzten Texten liegt in einem unscheinbaren Detail: Die Homographen. Das sind Wörter, welche die gleiche Schreibweise, aber unterschiedliche Bedeutungen haben. Viele regelbasierten und statistischen MÜ-Systeme können in solchen Fällen tatsächlich nicht die richtige Bedeutung eines Homographen deuten – ob richtig übersetzt wird, ist somit reiner Zufall. Hierzu einige Beispiele:
Wort | 1. Bedeutung | 2. Bedeutung |
übersetzen | in eine andere Sprache übertragen | ans andere Ufer fahren |
modern | zeitgemäß (Adj.) | faulen (Verb) |
sieben | Zahl | filtern, auslesen (Verb) |
Bug | Schiffsteil | Programmierfehler (eingedeutscht) |
Montage | Wochentag (Plural) | Zusammenbau (eingedeutscht) |
Eine Ausnahme für die Fehleranfälligkeit bei Homographen stellen die neuronalen MÜ-Systeme dar. Wenn diese im Vorfeld bereits mit großen Datenmengen gefüttert und angelernt wurden, können die neuronalen maschinellen Übersetzungssysteme problemlos zwischen den verschiedenen Bedeutungen eines Homographen unterscheiden. Sie schließen vom Kontext auf die passende Bedeutung und übersetzen anschließend in die richtige Entsprechung der Zielsprache.
Probleme und Chancen der MÜ-Systeme bei Fachübersetzungen
Generell ist das Risiko für schwerwiegende Fehler bei fachspezifischen Übersetzungen alleine aufgrund einer möglichen falschen Anwendung des MÜ-Systems erhöht. Zudem sind maschinelle Übersetzungen für Texte aus den Fachbereichen Marketing oder Literatur wenig sinnvoll, egal wie gut und erfahren der Bedienende der Maschine ist. Denn sprachliche Finessen, Redewendungen und Wortspiele kommen hierbei oftmals vollständig abhanden. Ein literarisches Meisterwerk in Japanisch kann im Deutschen dann zu einem emotionslosen Roman verkommen.
Das maschinelle Übersetzen juristischer, technischer oder medizinischer Texte hingegen ist möglich. Allerdings raten wir Ihnen davon ab, die maschinelle Übersetzung ohne ein darauffolgendes Lektorat durchzuführen: Mit hieraus resultierenden Übersetzungsfehlern tragen Sie ein hohes Risiko. Zudem bestehen im Bereich des maschinellen Übersetzens noch viele rechtliche Unklarheiten. Wer übernimmt zum Beispiel die Verantwortung und Haftung für entstehende Personen- oder Sachschäden, die auf einem Fehler in einem maschinell übersetzten Text zurückzuführen sind? Wenn Sie sich nicht auf dieses unsicher Feld begeben wollen, sollten Sie wohl besser auf die Dienste eines Humanübersetzers vertrauen.
In Hinblick auf die maschinelle Übersetzung lauert in vielen dieser speziellen Fachbereiche trotzdem ein riesiges Potential. Eine neuronale maschinelle Übersetzung mit anschließendem Post-Editing von einem fachspezifischen Übersetzer ist bereits heute eine mögliche und sinnvolle Alternative zur Humanübersetzung.