Sie möchten mehr über Korpuslinguistik erfahren?
Sie möchten korpuslinguistische Werkzeuge kennen lernen?
Sie brauchen korpuslinguistische Unterstützung für Ihr Projekt?
Gegenstand der quantitativen Korpuslinguistik sind große Mengen von Texten, die anhand bestimmter Kriterien zusammengestellt wurden. Für die Vorverarbeitung und Analyse dieser Texte existieren zahlreiche – häufig frei verfügbare – elektronische Werkzeuge.
/semtracks/ besitzt langjährige Erfahrung im Umgang mit derartigen Werkzeugen. Dank ihrer Vertretung in wichtigen Forschungsinstitutionen in Deutschland, der Schweiz und Japan befinden sich die Mitarbeiter stets auf dem aktuellen Stand. /semtracks/ verfügt zudem über eine Sammlung eigener Korpora.
Gerne geben wir dieses Wissen in Einzel- oder Gruppenschulungen an Sie weiter. Unser Schulungsangebot besteht aus sieben Modulen, die Sie gemäß Ihren Wünschen kombinieren können.
Theoretische Grundlagen der Korpuslinguistik
- Was sind Korpora? Welche Typen von Korpora gibt es?
- Welchen erkenntnistheoretischen Stellenwert haben Korpora?
- Welche Fragen können mit Korpora beantwortet werden, welche nicht?
Theoretische Grundlagen der Diskursanalyse und Korpuspragmatik
- Wie hängen Diskurse, pragmatische Funktionen und die sprachliche Oberfläche zusammen?
- Was sind Sprachgebrauchsmuster und wie können sie gedeutet werden?
XML und Text-Encodings
- Standards für die Annotation von Metadaten: Text Encoding Initiative (TEI), Dublin Core Metadata Initiative
- Text-Encodings und -Formate
Statistische Grundlagen in der Korpuslinguistik
- Frequenzunterschiede und Verteilungen messen
- Assoziationsmaße (χ², Log-Likelihood, Mutual Information, t-Score) und Clusteranalysen
Korpuslinguistische Werkzeuge
In diesem Modul werden Werkzeuge zur Akquisition, Annotation, Verwaltung/Abfrage und linguistischen Analyse von Korpora vorgestellt. Am Anfang stehen Leitfragen, die die Wahl der Werkzeuge erleichtern sollen, etwa: In welchem Dateiformat liegen meine Daten vor/sollen meine Daten aufbereitet werden? Welche finanziellen Mittel stehen zur Verfügung? Welche Art von Benutzeroberfläche wird gewünscht? Daneben werden rechtliche Aspekte der Benutzung korpuslinguistischer Werkzeuge angesprochen.
Zu den Werkzeugen, die in diesem Modul vorgestellt werden, gehören: BootCat, WaC TK, TreeTagger, GATE, IMS Open Corpus Workbench (CWB), Ngram Statistics Package (NSP), compareNGramLists, kfNgram, AntConcDatengeleitete Korpusanalyse bei /semtracks/
- Komplexe N-Gramm-Analyse: N-Gramme aus Kombinationen von Wortformen und Wortarten-Tags
- Beispiel-Analysen: Präsidentschaftswahlen USA 2008, Bundestagswahl DE 2009
Werkzeuge zur Visualisierung von Ergebnissen
