Proseminar Sprachwissenschaft
Digitale Linguistik: Einführung in die Datenanalyse
100118 PS 2024W
Vortragende:
Nächster Termin
Dienstag, 28.01.2025 09:45-11:15 Seminarraum 5 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
Ziele, Inhalte und Methode der Lehrveranstaltung
Dieses Proseminar bietet eine Einführung in die quantitative Datenanalyse (unter Zuhilfenahme der Skriptsprache R) in der sprachwissenschaftlichen Forschung. Besprochen werden zunächst Grundlagen zu Datenstrukturen, deskriptiver Statistik, Inferenzstatistik sowie zum Messen von Zusammenhängen zweier Variablen (statistische Signifikanz, Effektstärken). Darüber hinaus werden digitale Werkzeuge für die linguistische Textanalyse vorgestellt und Grundlagen des wissenschaftlichen Arbeitens mit Fokus auf dem Erarbeiten von Analysen und Berichten mit quantitativen und datenbasierten Inhalten sowie der Umgang mit Daten und Code vermittelt. Im Rahmen einer eingeschränkten empirisch-datenbasierten Studie wenden Studierende die erlernten Methoden an und berichten ihre Ergebnisse im Rahmen einer Proseminararbeit.
Für statistische Analysen und Datenmanipulation wird die Scriptsprache R gemeinsam mit dem Frontend RStudio verwendet. Programmierkenntnisse sind keine Voraussetzung und werden im Laufe der Lehrveranstaltung vermittelt. Aufgrund der quantitativen Inhalte der Lehrveranstaltung werden allerdings gewissen mathematische Grundkenntnisse vorausgesetzt (insb. Brüche, Wahrscheinlichkeiten, Funktionen, Vektoren; Maturaniveau).Dieses Proseminar ergänzt und vertieft Inhalte der Vorlesung "SpraWi: Quantitative Methoden in den Digital Humanities" aus dem Sommersemester (und umgekehrt). Die Vorlesung ist allerdings keine Voraussetzung für das Belegen des Proseminars.
Art der Leistungskontrolle und erlaubte Hilfsmittel
Mitarbeit, Präsentation von Übungsaufgaben, Kurzexposé und Proseminararbeit. Generative AI darf unter in der Lehrveranstaltung angegebenen Voraussetzungen gebraucht werden, sofern Verwendungen transparent dokumentiert und Ergebnisse kritisch hinterfragt werden.
Schriftliche Beiträge aller Lehrveranstaltungstypen der SPL 10 können einer automatischen Plagiatsprüfung unterzogen werden; dazu zählen insbesondere Arbeiten der Pro-, Bachelor- und Masterseminarstufe, aber auch Lehrveranstaltungsprüfungen (z.B. Vorlesungsprüfung) und Teilprüfungen (z.B. Zwischentest, 'Hausübungen').
Literatur
Butler, C. (1985). Statistics in Linguistics. Oxford: Blackwell.
Nakagawa, S., & Cuthill, I. C. (2007). Effect size, confidence interval and statistical significance: a practical guide for biologists. Biological reviews, 82(4), 591-605.
Jannidis, F., Kohle, H., & Rehbein, M. (2017). Digital Humanities. JB Metzler.
Prüfungsstoff
Alle in der Lehrveranstaltung durchgenommenen Inhalte und Werkzeuge.
Mindestanforderungen und Beurteilungsmaßstab
Die Gesamtnote ergibt sich aus den Noten der Einzelleistungen, die jeweils mit Noten von 1 bis 5 bewertet und folgendermaßen gewichtet werden:
- Mitarbeit 20%
- Präsentation von Übungsaufgaben 15%
- Kurzexposé 5%
- Proseminararbeit 60%
Das Hauptgewicht der Beurteilung liegt auf der schriftlichen Proseminararbeit.
Abkürzungen: ÄdL: Ältere deutsche Sprache und Literatur – DaF/Z: Deutsch als Fremd- und Zweitsprache – FD: Fachdidaktik Deutsch – NdL: Neuere deutsche Literatur – SpraWi: Sprachwissenschaft