Add to watchlist
Back

 

55668-01 - Seminar: Korpusanalyse von Sprache und Kontext. Eine Einführung in Grundlagen und digitale Werkzeuge 3 CP

Semester fall semester 2019
Course frequency Once only
Lecturers Berenike Herrmann (berenike.herrmann@unibas.ch, Assessor)
Content Korpora sind Sammlungen sprachlicher Daten, die für linguistische Untersuchungen aufbereitet wurden. Die Bandbreite erstreckt sich hier von transkribierten Gesprächen und Lernertexten über Publikationen in journalistischen, wissenschaftlichen und Unterhaltungsdiskursen bis hin zu den vielfältigen Sprachäusserungen des Netzes und der sozialen Medien. Dabei variiert der Umfang linguistischer Korpora zwischen wenigen Tausend und Milliarden Wörtern. Doch enthalten Korpora nie nur das sprachliche Material, sondern modellieren aussersprachliche Diskursvariablen wie TeilnehmerInnen, Geokoordinaten und Zeit, aber auch Register und Genre gleich mit. Gleichzeitig können bestimmte sprachliche Muster immer nur in Bezug auf einen sprachlichen Kontext modelliert werden – und hier bieten Big Data-Analysen ganz neue Möglichkeiten. Aus gebrauchsbasierter Perspektive ist die Dimension des «Kontexts» also nicht nur in Pragmatik und Lexikographie, sondern auch in Syntax und Semantik wichtig. Doch wie setzt man solche Korpora systematisch und anschlussfähig auf?

Ausgehend von den durch Data Science und Text Mining erweiterten Möglichkeiten der korpusbasierten Textwissenschaft führt unser Kurs in einen empirischen Zugang der datengetriebenen Geisteswissenschaften ein. Themen sind (a) die repräsentative und balancierte Modellierung von Korpora in Abhängigkeit von Forschungsfragen, (b) Standards von Datenbanken, Dateiformaten, Metadaten und Annotation, (c) Quellen und Textvorverarbeitung, (d) Methoden und Tools der Datenanalyse. Die Analysemethoden umfassen vor allem einfache und kontrastive Frequenzanalyse (Konkordanzen, Kollokations- und Keywordanalyse, Wortarten- und Named Entity Tagging) und automatische Inhaltsanalyse (bes. Sentimentanalyse), sowie Einblicke in klassifikatorische Methoden des Machine Learnings.

Der Fokus des Kurses wird auf einer angewandten Auseinandersetzung mit den Forschungsmethoden liegen. Im ersten Teil wird in theoretische und methodische Grundlagen der Korpuswissenschaft auch anhand von best practices eingeführt. Im zweiten Teil werden wir den Forschungsprozess von der Forschungsidee über die Konzeption und Implementierung des Korpus und das Einlesen von Datenmatrizen bis hin zur Analyse und Auswertung mittels der open source/open access Software R in praktischen Übungen umsetzen. Der Kurs schliesst mit der Präsentation kleinerer studentischer Forschungsprojekte ab.
Learning objectives Die Studierenden erlernen grundlegende Methoden und Konzepte der korpusbasierten Textwissenschaft, insbesondere der digitalen Linguistik und Korpuslinguistik, mit Schwerpunkt auf die praktische Konzeption linguistischer Korpora und Frequenzanalyse. Sie können forschungsrelevante Analysen eines selbst verfertigten digitalen Korpus mit der Software R durchführen, wobei sie die theoretische und praktische Dimension von Kontextualisierung berücksichtigen. Sie können die Ergebnisse ihrer Analysen auf theoretische Konzepte und weitere empirische Befunde in unterschiedlichen Diskursdomänen beziehen.
Bibliography Eine vollständige Literaturliste und Sitzungsplan werden in der ersten Sitzung ausgegeben. Hier einige Literaturhinweise:
Biber, D. (1993). Representativeness in Corpus Design. Literary and Linguistic Computing, 8(4), 243–257.
Bubenhofer, N. (2006, 2019). Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. http://www.bubenhofer.com/korpuslinguistik/
Lemnitzer, L., & Zinsmeister, H. (2015). Korpuslinguistik. Eine Einführung (3. Auflage). Narr Francke Attempto.
Mehler, A., & Wolff, C. (2005). Einleitung: Perspektiven und Positionen des Text Mining. LDV-Forum, 20(1). https://pub.uni-bielefeld.de/record/1773642
Müller, M. (2011). Vom Wort zur Gesellschaft: Kontexte in Korpora. Ein Beitrag zur Methodologie der Korpuspragmatik. In E. Felder, M. Müller, & F. Vogel (Eds.), Korpuspragmatik. Thematische Korpora als Basis diskurslinguistischer Analysen (pp. 33–82).
Yarkoni, T., & Westfall, J. (2017). Choosing Prediction Over Explanation in Psychology: Lessons From Machine Learning. Perspectives on Psychological Science: A Journal of the Association for Psychological Science, 12(6), 1100–1122.

 

Admission requirements Erfolgreich absolvierte Einführungsmodule; die Teilnehmerzahl ist auf 30 beschränkt (es gilt die Reihenfolge der Anmeldung).
Language of instruction German
Use of digital media No specific media used
Course auditors welcome

 

Interval Weekday Time Room

No dates available. Please contact the lecturer.

Modules Modul: Aufbaustudium Deutsche Sprachwissenschaft (Bachelor's degree subject: German Language and Literature)
Modul: Digital Humanities, Culture and Society (Master's degree subject: Digital Humanities)
Modul: Disziplinäre Vertiefung (Bachelor's degree subject: German Language and Literature)
Modul: Forschungspraxis und Vertiefung (Master's degree program: Language and Communication)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor's degree subject: English)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor's degree subject: German Language and Literature)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor's degree subject: French Language and Literature)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor's degree subject: Spanish Language and Literature)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor's degree subject: Italian Language and Literature)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor's degree subject: Nordic Philology)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: Slavic Studies)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: English)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: German Language and Literature)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: French Language and Literature)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: Spanish Language and Literature)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: Italian Language and Literature)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: Latin Philology)
Modul: Interphilologie: Sprachwissenschaft MA (Master's degree subject: Nordic Philology)
Wahlbereich Master Deutsche Philologie: Empfehlungen (Master's degree subject: German Language and Literature)
Assessment format continuous assessment
Assessment details Mehrere kleinere schriftliche und mündliche Beiträge, u.a. die Dokumentation der Analysen. Es wird die Bereitschaft erwartet, sich teils angeleitet, teils selbständig in die Datenanalyse mit R einzuarbeiten um eigenständig eigene Forschungsaufträge ausführen zu können. Ebenso wird die Bereitschaft vorausgesetzt, englische Fachliteratur zu rezipieren.
Assessment registration/deregistration Reg.: course registration; dereg.: not required
Repeat examination no repeat examination
Scale Pass / Fail
Repeated registration no repetition
Responsible faculty Faculty of Humanities and Social Sciences, studadmin-philhist@unibas.ch
Offered by Fachbereich Deutsche Sprach- und Literaturwissenschaft

Back