Vorlesungs­verzeichnis

Proseminar Sprachwissenschaft: Quantitative Analyse lexikalischer Daten

100221 PS 2026S

Ansicht in u:find »

Moodle

Vortragende:

Nächster Termin

Montag, 27.04.2026 11:30-13:00 Seminarraum 3 Hauptgebäude, Tiefparterre Stiege 9 Hof 5

 

Ziele, Inhalte und Methode der Lehrveranstaltung

Häufige Wörter werden früher gelernt als seltene; Wortlänge, -art und -bedeutung beeinflussen den Zeitpunkt, zu dem ein Wort erworben wird, ebenso. Aber wie misst man eigentlich solche Zusammenhänge? Dieses Proseminar bietet eine Einführung in die quantitative Analyse von lexikalischen Daten (unter Zuhilfenahme der Skriptsprache R) in der sprachwissenschaftlichen Forschung mit Fokus auf psycholinguistischen Charakteristika von Wörtern und Spracherwerb.

Besprochen werden zunächst Grundlagen zu Datenstrukturen, deskriptiver Statistik, Inferenzstatistik sowie zum Messen von Zusammenhängen zweier Variablen (statistische Signifikanz, Effektstärken). Darüber hinaus werden digitale Werkzeuge für die linguistische Textanalyse vorgestellt und Grundlagen des wissenschaftlichen Arbeitens mit Fokus auf dem Erarbeiten von Analysen und Berichten mit quantitativen und datenbasierten Inhalten sowie der Umgang mit Daten, Code und großen Sprachmodellen (generative AI) in der wissenschaftlichen Praxis vermittelt. Im Rahmen einer eingeschränkten empirisch-datenbasierten Studie zur Lexik wenden Studierende die erlernten Methoden an und berichten ihre Ergebnisse im Rahmen einer Proseminararbeit.

Für statistische Analysen und Datenmanipulation wird die Scriptsprache R gemeinsam mit dem Frontend RStudio verwendet. Programmierkenntnisse sind keine Voraussetzung und werden im Laufe der Lehrveranstaltung vermittelt. Aufgrund der quantitativen Inhalte der Lehrveranstaltung werden allerdings gewissen mathematische Grundkenntnisse vorausgesetzt (Brüche, Wahrscheinlichkeiten,...).

Dieses Proseminar ergänzt und vertieft Inhalte der Vorlesung "Quantitative Methoden in den Digital Humanities" (und umgekehrt). Die Vorlesung ist allerdings keine Voraussetzung für das Belegen des Proseminars.

 

Art der Leistungskontrolle und erlaubte Hilfsmittel

Mitarbeit, Präsentation, Kurzexposé und Proseminararbeit. Generative AI darf unter in der Lehrveranstaltung angegebenen Voraussetzungen gebraucht werden, sofern Verwendungen transparent dokumentiert und Ergebnisse kritisch hinterfragt werden.

Schriftliche Beiträge aller Lehrveranstaltungstypen der SPL 10 können einer automatischen Plagiatsprüfung unterzogen werden; dazu zählen insbesondere Arbeiten der Pro-, Bachelor- und Masterseminarstufe, aber auch Lehrveranstaltungsprüfungen (z.B. Vorlesungsprüfung) und Teilprüfungen (z.B. Zwischentest, 'Hausübungen').

 

Literatur

Butler, C. (1985). Statistics in Linguistics. Oxford: Blackwell.
Jannidis, F., Kohle, H., & Rehbein, M. (2017). Digital Humanities. JB Metzler.
Meibauer, J., Demske, U., Geilfuß-Wolfgang, J., Pafel, J., Ramers, K. H., Rothweiler, M., & Steinbach, M. (2015). Einführung in die germanistische Linguistik. Springer-Verlag.

 

Prüfungsstoff

Alle in der Lehrveranstaltung durchgenommenen Inhalte und Werkzeuge.

 

Mindestanforderungen und Beurteilungsmaßstab

Die Gesamtnote ergibt sich aus den Noten der Einzelleistungen, die jeweils mit Noten von 1 bis 5 bewertet und folgendermaßen gewichtet werden:
- Mitarbeit 20%
- Präsentation 15%
- Kurzexposé 5%
- Proseminararbeit 60%

Prüfungsimmanente Lehrveranstaltungen aus dem Angebot der SPL10 sind grundsätzlich anwesenheitspflichtig.
Studierende, die der ersten Einheit unentschuldigt fern bleiben, verlieren ihren Platz in der Lehrveranstaltung.
Maximal zweimaliges Fehlen ist erlaubt. Eine konsequenzlose Abmeldung ist bei wöchentlichen Lehrveranstaltungen bis vor der dritten LV-Einheit möglich, bei 14-tägigen Lehrveranstaltungen und Blöcken bis vor dem zweiten Termin.

Umfang der Abschlussarbeiten: Proseminararbeiten 15 Seiten Haupttext
Das Hauptgewicht der Beurteilung liegt auf der schriftlichen Proseminararbeit.