Infoservice aus der Welt zwischen zwei Sprachen für unsere Kunden

Fünf neue Sprachen in Google Translate

Freitag, 14. 5. 2010| Radim Sochorek| Dauerlink | Kategorie: Welt der Sprachen
Radim Sochorek
Armenisch, Aserbaidschanisch, Baskisch, Georgisch und Urdu sind die neuesten Sprachen im Portfolio des Online-Übersetzers Google Translate. Neben dem europäischen Baskischen werden alle anderen in Asien gesprochen und haben zusammen um die 100 Millionen Sprecher. Die Gesamtanzahl der aktuell angebotenen Sprachen der Dienstleistung Google Translate erreicht damit 57.

Grundfakten über die neuen Sprachen

Armenisch

- Sprachcode ISO 639-1: hy (Hajeren)
- selbstständiger Zweig von indoeuropäischen Sprachen
- ca. 6,5 Mio. Sprecher, davon über 3 Mio. in Armenien
- Ostarmenisch Amtssprache in Armenien, Minderheiten in Iran; Westarmenisch ist eine Sprache von Minderheiten in der Türkei, im Libanon, Irak, in Syrien usw.
- agglutinierende Sprache mit 6 bzw. 7 grammatischen Fällen, Geschlecht wird nicht unterschieden
- keine Längenunterscheidung der Vokale
- Wortschatz beeinflusst vom Persischen, Griechischen, von kaukasischen Sprachen, dem Französischen und Russischen
- 5.–11. Jahrhundert älteste Literaturdenkmäler (Grabar – heute Kirchensprache)
- im 19. Jh. entsteht die neuere Schriftsprache Aschcharhabar
- Gestaltung der armenischen Schrift im Jahr 405–406, seit dem 12. Jh. auf 39 Zeichen erweitert
- 1922–1924 Rechtschreibreform

Aserbaidschanisch

- Sprachcode ISO 639-1: az (Aseri)
- oghusischer Zweig der Turksprachen
- die nördliche Variante von 7,5 Mio. Sprechern in Aserbaischan als Nationalsprache gesprochen (6,1 Mio., davon 4 Mio. monolingual), Iran, Minderheiten in Armenien und Georgien, 8 Mio. Sprecher als Zweitsprache; südliche 12,6 Mio. Sprecher, hauptsächlich im Iran (11,2 Mio.)
- Einfluss des Persischen, Arabischen, Mongolischen, Russischen
- vokalische Harmonie
- älteste Texte aus dem 14. Jh., damals noch als Türkisch – einheitliche Sprache des Osmanischen Reiches, 15.–16. Jh. Abspaltung, Einfluss des Tschagataischen
- bis zur 1. Hälfte des 19. Jh. Bestandteil von Persien – Zweisprachigkeit der schreib- und lesekundigen Aserbaidschaner, danach moderne Poesie
- vor dem Jahr 1917 Lingua franca in Transkaukasien
- die heutige (nördliche) Schriftsprache basiert auf der Sprache der Kulturmitarbeiter in Baku Anfang des 20. Jahrhunderts, dialektübergreifend, ohne Osmanismen
- 1923 wurde in der nördlichen Variante die arabische durch die lateinische Schrift ersetzt und seit dem Ende der 30er Jahre in der kyrillischen Schrift geschrieben, seit dem Jahr 1991 wieder die lateinische Schrift; die südliche Variante wird in lateinischer Schrift oder arabischer Schrift (Irak) bzw. kyrillischer Schrift (Afghanistan) geschrieben.

Baskisch

- Sprachcode ISO 639-1: eu (Euskara)
- isolierte Sprache unbekannter Herkunft
- 660 Tsd. Sprecher in Spanien (lokale Amtssprache in der Autonomen Gemeinschaft Baskenland) und Frankreich (Department Pyrénées-Atlantiques), ethnischer Herkunft sind 2,7 Mio. Personen
- agglutinierende Sprache, keine Genusunterscheidung
- Zahlen im Vigesimalsystem
- phonetische Orthografie in lateinischer Schrift
- Laute vom Spanischen bzw. Französischen beeinflusst, Wortschatz vom Latein, Arabischen, romanischen und keltischen Sprachen beeinflusst
- erste schriftliche Aufzeichnung aus dem 11. Jh., älteste Literaturdenkmäler aus dem 16. Jh.
- 1587 erste Grammatik
- bis zum 19. Jh. überwiegend religiöse Texte
- 1919 Akademie der baskischen Sprache gegründet, 1968 Standardisierung der Sprache (Euskara Batua)

Georgisch

- Sprachcode ISO 639-1: ka (Kartuli ena)
- südlicher Zweig der kaukasischen Sprachen
- über 4 Mio. Sprecher, absolute Mehrheit lebt in Georgien, des Weiteren in Aserbaidschan, Minderheiten im Iran und in der Türkei
- agglutinierende Sprache
- der Wortschatz wird durch die Zusammensetzung und Ableitung erweitert, Übernahmen aus dem Griechischen, Armenischen, Arabischen, Persischen, Russischen, aus europäischen Sprachen
- Zahlen im Vigesimalsystem
- die heutige von links nach rechts geschriebene phonologische Schrift Mchedruli mit 33 Buchstaben stabilisierte sich im 18. Jh., Großbuchstaben werden in der Regel nicht verwendet; knüpft an eine ältere Schrift an, die im 5. Jh. eingeführt wurde.
- 5.–12. Jh. altgeorgische Schriftsprache – umfangreiche Literatur, Höhepunkt Rustavelis Heldenepos
- seit dem 12. Jh. Neugeorgisch – hauptsächlich weltliche Literatur
- 19. Jh. Entstehung der heutigen Form des Georgischen

Urdu

- Sprachcode ISO 639-1: ur (Urdu)
- indoarische Sprache, "poetischere" Variante des Hindustanischen (Soziolekte Urdu und Hindi)
- 10,7 Mio. Muttersprachler in Pakistan (Amtssprache), 104 Mio. Pakistani sprechen Urdu als Nationalsprache; insgesamt 60,6 Mio. Muttersprachler weltweit, davon 48 Mio. in Indien (Amtssprache in 6 Bundesstaaten)
- starker Einfluss des Persischen und Arabischen, Entlehnungen aus dem Portugiesischen
- wird in angepasster arabischer Schrift geschrieben
- Literaturdenkmäler seit dem 14. Jh.
- 1952 Demonstration von Bengalen gegen Urdu als die einzige Amtssprache Pakistans

Alle 5 Sprachen sind noch in der Alpha-Version und können nur in der englischen Version von Google Translate übersetzt werden. Vor einigen Tagen wurde außerdem die Funktion Text-to-speech (Sprachausgabe der Übersetzung) auf insgesamt 34 Sprachen von Google Translate erweitert.

Alle Rechte vorbehalten. Copyright © Radim Sochorek, 2004–2015

Archiv des Informationsservices aus der Welt zwischen zwei Sprachen, der seit 2004 in deutscher und tschechischer Mutation vom professionellen Dolmetscher und Übersetzer Radim Sochorek aus Ostrava (dolmetscher-ostrava.eu) für seine Kunden herausgegeben wurde.

Anzahl Artikel in deutscher Sprache: 987