Vorlesungs­verzeichnis

Proseminar Sprachwissenschaft

Digitale Linguistik: Einführung in die Datenanalyse

100118 PS 2024W

Ansicht in u:find »

Moodle

Vortragende:

Nächster Termin

Dienstag, 28.01.2025 09:45-11:15 Seminarraum 5 Hauptgebäude, Tiefparterre Stiege 9 Hof 5

 

Ziele, Inhalte und Methode der Lehrveranstaltung

Dieses Proseminar bietet eine Einführung in die quantitative Datenanalyse (unter Zuhilfenahme der Skriptsprache R) in der sprachwissenschaftlichen Forschung. Besprochen werden zunächst Grundlagen zu Datenstrukturen, deskriptiver Statistik, Inferenzstatistik sowie zum Messen von Zusammenhängen zweier Variablen (statistische Signifikanz, Effektstärken). Darüber hinaus werden digitale Werkzeuge für die linguistische Textanalyse vorgestellt und Grundlagen des wissenschaftlichen Arbeitens mit Fokus auf dem Erarbeiten von Analysen und Berichten mit quantitativen und datenbasierten Inhalten sowie der Umgang mit Daten und Code vermittelt. Im Rahmen einer eingeschränkten empirisch-datenbasierten Studie wenden Studierende die erlernten Methoden an und berichten ihre Ergebnisse im Rahmen einer Proseminararbeit.

Für statistische Analysen und Datenmanipulation wird die Scriptsprache R gemeinsam mit dem Frontend RStudio verwendet. Programmierkenntnisse sind keine Voraussetzung und werden im Laufe der Lehrveranstaltung vermittelt. Aufgrund der quantitativen Inhalte der Lehrveranstaltung werden allerdings gewissen mathematische Grundkenntnisse vorausgesetzt (insb. Brüche, Wahrscheinlichkeiten, Funktionen, Vektoren; Maturaniveau).

Dieses Proseminar ergänzt und vertieft Inhalte der Vorlesung "SpraWi: Quantitative Methoden in den Digital Humanities" aus dem Sommersemester (und umgekehrt). Die Vorlesung ist allerdings keine Voraussetzung für das Belegen des Proseminars.

 

Art der Leistungskontrolle und erlaubte Hilfsmittel

Mitarbeit, Präsentation von Übungsaufgaben, Kurzexposé und Proseminararbeit. Generative AI darf unter in der Lehrveranstaltung angegebenen Voraussetzungen gebraucht werden, sofern Verwendungen transparent dokumentiert und Ergebnisse kritisch hinterfragt werden.

Schriftliche Beiträge aller Lehrveranstaltungstypen der SPL 10 können einer automatischen Plagiatsprüfung unterzogen werden; dazu zählen insbesondere Arbeiten der Pro-, Bachelor- und Masterseminarstufe, aber auch Lehrveranstaltungsprüfungen (z.B. Vorlesungsprüfung) und Teilprüfungen (z.B. Zwischentest, 'Hausübungen').

 

Literatur

Butler, C. (1985). Statistics in Linguistics. Oxford: Blackwell.
Nakagawa, S., & Cuthill, I. C. (2007). Effect size, confidence interval and statistical significance: a practical guide for biologists. Biological reviews, 82(4), 591-605.
Jannidis, F., Kohle, H., & Rehbein, M. (2017). Digital Humanities. JB Metzler.

 

Prüfungsstoff

Alle in der Lehrveranstaltung durchgenommenen Inhalte und Werkzeuge.

 

Mindestanforderungen und Beurteilungsmaßstab

Die Gesamtnote ergibt sich aus den Noten der Einzelleistungen, die jeweils mit Noten von 1 bis 5 bewertet und folgendermaßen gewichtet werden:
- Mitarbeit 20%
- Präsentation von Übungsaufgaben 15%
- Kurzexposé 5%
- Proseminararbeit 60%

Prüfungsimmanente Lehrveranstaltungen aus dem Angebot der SPL10 sind grundsätzlich anwesenheitspflichtig. Maximal zweimaliges Fehlen ist erlaubt. Eine konsequenzlose Abmeldung ist bei wöchentlichen Lehrveranstaltungen bis vor der dritten LV-Einheit möglich, bei 14-tägigen Lehrveranstaltungen und Blöcken bis vor dem zweiten Termin.

Umfang der Abschlussarbeiten: Proseminararbeiten 15 Seiten Haupttext
Das Hauptgewicht der Beurteilung liegt auf der schriftlichen Proseminararbeit.