Proseminar Sprachwissenschaft: Quantitative Analyse lexikalischer Daten
100221 PS 2026S
Vortragende:
Nächster Termin
Montag, 27.04.2026 11:30-13:00 Seminarraum 3 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
Ziele, Inhalte und Methode der Lehrveranstaltung
Häufige Wörter werden früher gelernt als seltene; Wortlänge, -art und -bedeutung beeinflussen den Zeitpunkt, zu dem ein Wort erworben wird, ebenso. Aber wie misst man eigentlich solche Zusammenhänge? Dieses Proseminar bietet eine Einführung in die quantitative Analyse von lexikalischen Daten (unter Zuhilfenahme der Skriptsprache R) in der sprachwissenschaftlichen Forschung mit Fokus auf psycholinguistischen Charakteristika von Wörtern und Spracherwerb.
Besprochen werden zunächst Grundlagen zu Datenstrukturen, deskriptiver Statistik, Inferenzstatistik sowie zum Messen von Zusammenhängen zweier Variablen (statistische Signifikanz, Effektstärken). Darüber hinaus werden digitale Werkzeuge für die linguistische Textanalyse vorgestellt und Grundlagen des wissenschaftlichen Arbeitens mit Fokus auf dem Erarbeiten von Analysen und Berichten mit quantitativen und datenbasierten Inhalten sowie der Umgang mit Daten, Code und großen Sprachmodellen (generative AI) in der wissenschaftlichen Praxis vermittelt. Im Rahmen einer eingeschränkten empirisch-datenbasierten Studie zur Lexik wenden Studierende die erlernten Methoden an und berichten ihre Ergebnisse im Rahmen einer Proseminararbeit.Für statistische Analysen und Datenmanipulation wird die Scriptsprache R gemeinsam mit dem Frontend RStudio verwendet. Programmierkenntnisse sind keine Voraussetzung und werden im Laufe der Lehrveranstaltung vermittelt. Aufgrund der quantitativen Inhalte der Lehrveranstaltung werden allerdings gewissen mathematische Grundkenntnisse vorausgesetzt (Brüche, Wahrscheinlichkeiten,...).Dieses Proseminar ergänzt und vertieft Inhalte der Vorlesung "Quantitative Methoden in den Digital Humanities" (und umgekehrt). Die Vorlesung ist allerdings keine Voraussetzung für das Belegen des Proseminars.
Art der Leistungskontrolle und erlaubte Hilfsmittel
Mitarbeit, Präsentation, Kurzexposé und Proseminararbeit. Generative AI darf unter in der Lehrveranstaltung angegebenen Voraussetzungen gebraucht werden, sofern Verwendungen transparent dokumentiert und Ergebnisse kritisch hinterfragt werden.
Schriftliche Beiträge aller Lehrveranstaltungstypen der SPL 10 können einer automatischen Plagiatsprüfung unterzogen werden; dazu zählen insbesondere Arbeiten der Pro-, Bachelor- und Masterseminarstufe, aber auch Lehrveranstaltungsprüfungen (z.B. Vorlesungsprüfung) und Teilprüfungen (z.B. Zwischentest, 'Hausübungen').
Literatur
Butler, C. (1985). Statistics in Linguistics. Oxford: Blackwell.
Jannidis, F., Kohle, H., & Rehbein, M. (2017). Digital Humanities. JB Metzler.
Meibauer, J., Demske, U., Geilfuß-Wolfgang, J., Pafel, J., Ramers, K. H., Rothweiler, M., & Steinbach, M. (2015). Einführung in die germanistische Linguistik. Springer-Verlag.
Prüfungsstoff
Alle in der Lehrveranstaltung durchgenommenen Inhalte und Werkzeuge.
Mindestanforderungen und Beurteilungsmaßstab
Die Gesamtnote ergibt sich aus den Noten der Einzelleistungen, die jeweils mit Noten von 1 bis 5 bewertet und folgendermaßen gewichtet werden:
- Mitarbeit 20%
- Präsentation 15%
- Kurzexposé 5%
- Proseminararbeit 60%
Studierende, die der ersten Einheit unentschuldigt fern bleiben, verlieren ihren Platz in der Lehrveranstaltung.
Maximal zweimaliges Fehlen ist erlaubt. Eine konsequenzlose Abmeldung ist bei wöchentlichen Lehrveranstaltungen bis vor der dritten LV-Einheit möglich, bei 14-tägigen Lehrveranstaltungen und Blöcken bis vor dem zweiten Termin.Umfang der Abschlussarbeiten: Proseminararbeiten 15 Seiten Haupttext
Das Hauptgewicht der Beurteilung liegt auf der schriftlichen Proseminararbeit.
Abkürzungen: ÄdL: Ältere deutsche Sprache und Literatur – DaF/Z: Deutsch als Fremd- und Zweitsprache – FD: Fachdidaktik Deutsch – NdL: Neuere deutsche Literatur – SpraWi: Sprachwissenschaft
