SpraWi: Digitale Linguistik - Datenbanken in der sprachwissenschaftlichen Forschung
100145 SE-B 2024S
Vortragende:
Ziele, Inhalte und Methode der Lehrveranstaltung
Digitale Datenbanken spielen eine zunehmende Rolle in der sprachwissenschaftlichen Forschung. Die Entitäten, die in solchen Datenbanken gesammelt werden, und die Merkmale, die man ihnen zuordnet können unterschiedlichster Natur sein: In der Psycholinguistik etwa werden für die Verarbeitung von Wörtern relevante Kennzahlen gesammelt (z.B. MRC Psycholinguistic Database), der World Atlas of Language Structures sammelt strukturelle Informationen von Sprachen und Datenbanken wie das Irvine Phonotactic Online Dictionary bieten phonologische Informationen, etwa zur Erstellung von Pseudowortlisten. All diese Datenbanken haben gemeinsam, dass sie Information aus mehreren Datenquellen zusammen führen.
Dieses Seminar bietet eine Einführung in das Arbeiten mit linguistischen relationalen Datenbanken, deren Struktur und Abfragemethoden. Mit Hilfe der Script- bzw. Abfragesprachen R und SQL (und der Entwicklungsumgebung RStudio) werden SQLite-Datenbanken erstellt und manipuliert, um Eigenschaften von Daten zueinander in Beziehung zu setzen.Im Rahmen der Bachelorarbeit soll eine eigene neue Datenbank erstellt werden, die Informationen aus mehreren Quellen zusammen führt. Die schriftliche Bachelorarbeit an sich umfasst eine detaillierte Motivation und Beschreibung der Datenbank sowie ein Anwendungsbeispiel.Die quantitativen Inhalte des Seminars setzen ein dahingehendes Grundverständnis voraus (Prozentrechnen, Wahrscheinlichkeiten, etc.; Matura-Niveau). Erfahrung mit R oder SQL wird nicht vorausgesetzt. Die begleitende Mitbelegung der Vorlesung "Quantitative Methoden in den Digital Humanities" wird in dieser Hinsicht empfohlen, ist aber keine Voraussetzung für das Seminar.
Art der Leistungskontrolle und erlaubte Hilfsmittel
Mitarbeit und Beteiligung an Diskussionen zur verlangten Lektüre, Erstellung einer Projektskizze, Durchführung eines BA-Projektes und dessen Dokumentation im Rahmen einer schriftlichen Bachalorarbeit, Gruppenreferat zu einer sprachwissenschaftlichen digitalen Datenbank. Gewichtung nach folgendem Schlüssel:
- Mitarbeit und kleine Übungen (15%)- Projektskizze (5%)
- Referat (20%)
- Arbeit (60%)Die Zuhilfenahme generativer AI ist per se nicht untersagt, muss aber exakt und nachvollziehbar in einem separaten Anhang dokumentiert werden (siehe ‘Living guidelines for responsible use of generative AI in research’: https://www.nature.com/articles/d41586-023-03266-1).Schriftliche Beiträge aller Lehrveranstaltungstypen der SPL 10 können einer automatischen Plagiatsprüfung unterzogen werden; dazu zählen insbesondere Arbeiten der Pro-, Bachelor- und Masterseminarstufe, aber auch Lehrveranstaltungsprüfungen (z.B. Vorlesungsprüfung) und Teilprüfungen (z.B. Zwischentest, 'Hausübungen').
Literatur
Wird auf Moodle bekannt gegeben.
Prüfungsstoff
In der Lehrveranstaltung durchgenommene Inhalte (inkl. Literatur).
Mindestanforderungen und Beurteilungsmaßstab
- 90-100%: Sehr gut
- 80-89%: Gut
- 70-79%: Befriedigend
- 60-69%: Genügend
- <60%: Nicht genügend
Abkürzungen: ÄdL: Ältere deutsche Sprache und Literatur – DaF/Z: Deutsch als Fremd- und Zweitsprache – FD: Fachdidaktik Deutsch – NdL: Neuere deutsche Literatur – SpraWi: Sprachwissenschaft