Infoservice aus der Welt zwischen zwei Sprachen für unsere Kunden

Konkordanzsoftware - eine gute Wörterbuchgrundlage

Samstag, 10. 12. 2005| Radim Sochorek| Dauerlink | Kategorie: Software
Radim Sochorek
Am Beispiel der französischen Open Source-Software TextStat wollen wir uns zeigen, was eine Konkordanzsoftware ist und wozu sie dienen kann.
Jeder Text besteht aus Buchstaben, Wörtern, Sätzen, Absätzen usw. TextStat kann Text- und HTML-Dateien analysieren und eine statistische Auswertung dieser Texteinheiten liefern sowie eine Liste aller im Dokument vorkommenden Wörter (Lexeme) mit ihren Frequenzangaben generieren, Konkordanz genannt. Die kann im weiteren Schritt zur Erstellung eines Wörterbuchs verwendet werden.

TextStat 3.0

Schritte zur Erstellung der Konkordanz:
1. File to stat - Hier wird das zu analysierende Ausgangsdokument ausgewählt.
2. File for results - Das Analyseergebnis wird in einer Datei gespeichert, die hier definiert wird.
3. TS - Die Icon startet den Analysevorgang. Im rechten Fenster erscheint das Ergebnis.

Einstellungsmöglichkeiten:
Word separators - Definition der Wortgrenzen
Sentences separators - Definition der Satzgrenzen
Ignore capital letters - In der Liste werden gleich lautende Wortformen mit kleinem und großem Anfangsbuchstaben als eine Einheit gezählt.
Ignore accent letters - In der Liste werden gleich lautende Wortformen mit und ohne Akzent als eine Einheit gezählt.

Die Wortliste aus der gespeicherten Ergebnisdatei im Textformat kann gut in einer Tabellenkalkulation wie Excel bearbeitet werden; die Lexeme und ihre Frequenzangaben sind voneinander durch einen Tabulator getrennt. Die gereinigte Liste mit ausgewählten Begriffen aus dem Dokument kann dann als das Grundgerüst eines neuen Wörterbuchs dienen.


Alle Rechte vorbehalten. Copyright © Radim Sochorek, 2004–2015

Archiv des Informationsservices aus der Welt zwischen zwei Sprachen, der seit 2004 in deutscher und tschechischer Mutation vom professionellen Dolmetscher und Übersetzer Radim Sochorek aus Ostrava (dolmetscher-ostrava.eu) für seine Kunden herausgegeben wurde.

Anzahl Artikel in deutscher Sprache: 987