Wenn Google und Microsoft übersetzen

Im Internet findet man etliche Möglichkeiten der automatisierten Übersetzung von Webseiten. Auch Google oder Microsoft bieten Übersetzungen per Mausklick an. Das Ergebnis lässt jedoch allzuoft zu wünschen übrig: Die Übersetzung wirkt unbeholfen und manchmal auch komisch, wenn z. B. ‚Kugellager‚ als ‚Rundsofa‚ übersetzt wird. Es gilt die Regel: Je komplizierter das Original, desto schlechter die Übersetzung. Sprachstatistische Software sollte die Qualität der automatisierten Übersetzung verbessern.

Microsoft (Windows Live Translator) setzt auf die Technologie der Firma Systran, eines der ältesten Akteure auf dem Feld der Maschinenübersetzung. Ihre Philosophie besteht in der Erkennung der Wörter nach dem Kontext im Satz, der Satzstruktur sowie Wortfolge nach der grammatischen Struktur der Zielsprache.

Google geht bei seiner Online-Lösung (Google Translate) anders vor. Ausgegangen wird von den Forschungsergebnissen der Firma IBM, die vorgeschlagen hat, die Maschinenübersetzung über Vergleiche von sog. Paralleltexten, d. h. verschiedensprachigen Versionen derselben Texte, zu lösen. Das statistische Übersetzungsprogramm, das die zu übersetzenden Texte analysiert, sie mit den Paralleltexten in seiner Datenbank vergleicht und auf statistischer Basis Übersetzungen vorschlägt, kann lernen und immer bessere Ergebnisse liefern.

Die Voraussetzung der zweiten Methode ist also eine ständige Datenbankerweiterung. Computer lesen Bibelübersetzungen und mehrsprachige Texte der UNO ein. Anfang des Jahres bekam die Forschungsabteilung ein Übersetzungskorpus von mehr als einer Million Dokumenten in den 23 Amtssprachen der EU.

Es scheint, dass die Zukunft der Maschinenübersetzung gerade der statistischen Software gehören wird. Das US-amerikanische National Institute of Standards and Technology, das Übersetzungen von chinesischen und arabischen Texte testete, bescheinigte gerade dem Konzept von Google gute Noten: Auf einer Skala zwischen 0 und 1 erreichten die Übersetzungen von Google immerhin den Wert von 0,42.