Dienstag 08:30 – 10:00
IT-Pool (GB 03/149)
Stephen Berman
E-mail: stephen.berman@rub.de
Homepage: http://homepage.rub.de/Stephen.Berman/Korpuslinguistik
Im SM und als freie Veranstaltung: Teilnahmeschein (3 Credit Points) für regelmäßige Teilnahme sowie die Bearbeitung der Übungsaufgaben (unbenotet).
Im VM: entweder Teilnahmeschein (3 CP, s.o.) oder
Leistungsnachweis.
Für den LN mit 4 CP gilt: regelmäßige
Teilnahme, die Bearbeitung der Übungsaufgaben (unbenotet), sowie eine
Klausur in der letzten Sitzung (benotet).
Für den LN mit 5,5 CP
gilt: regelmäßige Teilnahme, die Bearbeitung der Übungsaufgaben
(unbenotet), sowie eine Hausarbeit (benotet).
Ein Korpus ist eine Sammlung von sprachlichen Daten, die nach linguistischen Kriterien zusammengestellt und meist annotiert sind, d.h. sie sind mit Informationen wie Wortart und Flexionsmerkmalen versehen. Manche Korpora – so genannte Baumbanken – enthalten darüber hinaus Annotationen zu syntaktischer Struktur und Funktion. Für viele Korpora gibt es eigene Suchmaschinen, mit denen man unter Verwendung spezieller Anfragesprachen gezielt nach Annotationen und anderen linguististisch interessanten Eigenschaften in den Korpora suchen kann.
Dieses Proseminar stellt die Suchmaschinen COSMAS II, DWDS und TIGERSearch und die dazugehörigen Korpora und Anfragesprachen vor und führt anhand vieler teils einfacherer teils anspruchvollerer Übungsaufgaben in die linguistische Recherche mit diesen Werkzeugen ein. Die Korpora des IDS (für COSMAS II) und des Projekts DWDS stellen die größten morphosyntaktisch annotierten deutschsprachigen Korpussammlungen dar, die im Internet frei verfügbar sind. Das TIGER-Korpus ist eine der größten deutschsprachigen Baumbanken.