Proseminar: Korpuslinguistik (050395), SS 2012

Module

B.A.: SM Grammatik und Pragmatik
B.A.: VM Sprachgebrauch
B.A.: VM Sprachsystem

Organisatorisches

Zeit

Dienstag 08:30 – 10:00

Raum

IT-Pool (GB 03/149)

Dozent

Stephen Berman
E-mail: stephen.berman@rub.de
Homepage: http://homepage.rub.de/Stephen.Berman/Korpuslinguistik

Scheinerwerb

Im SM und als freie Veranstaltung: Teilnahmeschein (3 Credit Points) für regelmäßige Teilnahme sowie die Bearbeitung der Übungsaufgaben (unbenotet).

Im VM: entweder Teilnahmeschein (3 CP, s.o.) oder Leistungsnachweis.
Für den LN mit 4 CP gilt: regelmäßige Teilnahme, die Bearbeitung der Übungsaufgaben (unbenotet), sowie eine Klausur in der letzten Sitzung (benotet).
Für den LN mit 5,5 CP gilt: regelmäßige Teilnahme, die Bearbeitung der Übungsaufgaben (unbenotet), sowie eine Hausarbeit (benotet).

Inhalt

Ein Korpus ist eine Sammlung von sprachlichen Daten, die nach linguistischen Kriterien zusammengestellt und meist annotiert sind, d.h. sie sind mit Informationen wie Wortart und Flexionsmerkmalen versehen. Manche Korpora – so genannte Baumbanken – enthalten darüber hinaus Annotationen zu syntaktischer Struktur und Funktion. Für viele Korpora gibt es eigene Suchmaschinen, mit denen man unter Verwendung spezieller Anfragesprachen gezielt nach Annotationen und anderen linguististisch interessanten Eigenschaften in den Korpora suchen kann.

Dieses Proseminar stellt die Suchmaschinen COSMAS II, DWDS und TIGERSearch und die dazugehörigen Korpora und Anfragesprachen vor und führt anhand vieler teils einfacherer teils anspruchvollerer Übungsaufgaben in die linguistische Recherche mit diesen Werkzeugen ein. Die Korpora des IDS (für COSMAS II) und des Projekts DWDS stellen die größten morphosyntaktisch annotierten deutschsprachigen Korpussammlungen dar, die im Internet frei verfügbar sind. Das TIGER-Korpus ist eine der größten deutschsprachigen Baumbanken.

Sitemap Allgemeine Begriffe