Zurück
Semester | Herbstsemester 2020 |
Angebotsmuster | einmalig |
Dozierende | John Nerbonne (john.nerbonne@unibas.ch, BeurteilerIn) |
Inhalt | Die Computerlinguistik (CL) ist das Forschungsgebiet, das sich auf die rechnergestützte Sprachverarbeitung konzentriert. Sie umfasst Theorie, Experiment und Anwendung, wobei das Interesse – Zeitschriftenartikeln und Konferenzberichten der letzten 10-20 Jahre nach zu urteilen – hauptsächlich auf den Anwendungen liegt (z.B. Informationssuche, maschinelle Übersetzung, Sprachsteuerung von Geräten, automatische Korrektur von Rechtschreibung und Grammatik, Hilfe für Behinderte und automatische Zusammenfassung). Das Interesse an Anwendungen wird von einer großen Aufmerksamkeit für zentrale Aufgaben begleitet wie Tokenisierung, String-basierte Suche, PoS Tagging, Parsing (Satzzergliederung), Alignment (‚Abgleichen‘), String-basierte Suche oder Sentiment detection (‚Erkennung der Einstellung des Autoren‘). Ausgehend von einem Überblick über die Arbeiten und Fortschritte in der CL in den letzten 30 Jahren, konzentriert sich dieser Kurs auf Bereiche, in denen Methoden und Ansätze der CL für spezifisch sprachwissenschaftliche Fragestellungen angewandt wurden, insbesondere in den Bereichen Grammatik (Syntax), (Erst-)Spracherwerb, Zweitsprachenlernen, Dialektologie und Soziolinguistik, historische Linguistik und Sprachkontakt. Besonderes Augenmerk legen wir auf Fragen zur Eignung der Sprachtechnologie (LT) in der Sprachwissenschaft, zu relevanten Wahlmöglichkeiten (Parametern) für bestimmte Aufgaben und zu den Möglichkeiten für weitere Forschungsarbeiten, die gleiche oder ähnliche LT gebrauchen könnten. |
Lernziele | Nach diesem Kurs sollten die Studierenden in der Lage sein, sprachwissenschaftliche Forschungsarbeiten zu rezipieren, die auf Computertechniken basieren, sowie zu wissen, welche kritischen Fragen zu ihrer Angemessenheit und ihrer Gültigkeit in der theoretischen und deskriptiven Linguistik zu stellen sind, und neuartige Anwendungen der rechnergestützten Verarbeitung in diesen Bereichen in Betracht ziehen zu können. |
Literatur | Von den Studierenden wird nicht erwartet, dass sie das gesamte unten aufgeführte Material lesen. Einige Titel sind aus Gründen der Quellenangabe beigefügt. Genauere Aufgaben werden während des Kurses zur Verfügung stehen. Wissenschaftliche Publikationen, die ich mitverfasst habe, sind verfügbar unter http://www.let.rug.nl/nerbonne/papers.html. Die Grundlagen der Computerlinguistik werden von Jurafsky und Martin zur Verfügung gestellt. Die Rohverfassung der 3. Aufl. ist verfügbar unter https://web.stanford.edu/~jurafsky/slp3/ und wird unten als SLP bezeichnet. Einige von Jurafskys Vorlesungen sind abrufbar unter https://www.youtube.com/channel/UC_48v322owNVtORXuMeRmpA. Bastiaanse, Roelien, Gosse Bouma, & Wendy Post. (2009) "Linguistic complexity and frequency in agrammatic speech production." Brain and Language 109.1: 18-28. Chomsky, Noam. (1957) Syntactic structures. The Hague: De Gruyter. Cöltekin, Cagri (2011) Catching words in a stream of speech: Computational simulations of segmenting transcribed child-directed speech. Ph.D. Diss., Groningen. Avail. at http://hdl.handle.net/11370/bb37ac1c-41ce-48d9-aca7-a26453546726 Foltz, Peter W., Darrell Laham, and Thomas K. Landauer. (1999) "Automated essay scoring: Applications to educational technology." EdMedia+ innovate learning. Association for the Advancement of Computing in Education. http://www.psych.nmsu.edu/~pfoltz/reprints/Edmedia99.html Jurafsky, Daniel & James Martin (in prog.) Speech and Language Processing. Pearson: London. 3rd ed. See above. Lauttamus, Timo, John Nerbonne, & Wybo Wiersma. (2007) "Detecting syntactic contamination in emigrants: the English of Finnish Australians." SKY Journal of Linguistics 20: 273-307. Nerbonne, John (2009) Data-Driven Dialectology Language and Linguistics Compass 3(1): 175-198. DOI: 10.1111/j.1749-818x2008.00114. Nerbonne, John (2018) "Vaulting Ambition" In: Eric Fuß, Marek Konopka, Beata Trawinski & Ulrich Waßner (eds.) Grammar and Corpora. Heidelberg University Press. 445-468. Tirosh, Ofer (2020) What the Data is Telling Us About Machine Translation. Are Software Algorithms Overtaking Human Linguists? Toward Data Science (blog). towardsdatascience.com/what-the-data-is-telling-us-about-machine-translation-ea987742403c Toral, Antonio (2020, to appear) Reassessing Claims of Human Parity and Super-Human Performance in Machine Translation at WMT 2019. Proc. European Association for Machine Translation. Wieling, Martijn, Jelke Bloem, Kaitlin Mignella, Mona Timmermeister, & John Nerbonne (2014) Automatically measuring foreign accent strength in English. Validating Levenshtein Distance as a measure.. Language Dynamics and Change 4(2): 253-269. Wiersma, Wybo, John Nerbonne, and Timo Lauttamus (2011) "Automatically extracting typical syntactic differences from corpora." Literary and Linguistic Computing 26.1: 107-124. Wilcox, Ethan, et al. (2018) "What do RNN Language Models Learn about Filler-Gap Dependencies?" In: Proc. 2018 EMNLP Workshop BlackboxNLP. Avail. at www.aclweb.org/anthology/W18-5423. |
Unterrichtssprache | Deutsch |
Einsatz digitaler Medien | Online-Veranstaltung |
HörerInnen willkommen |
Intervall | Wochentag | Zeit | Raum |
---|
Keine Einzeltermine verfügbar, bitte informieren Sie sich direkt bei den Dozierenden.
Module |
Modul: Aufbaustudium Deutsche Sprachwissenschaft (Bachelor Studienfach: Deutsche Philologie) Modul: Disziplinäre Vertiefung (Bachelor Studienfach: Deutsche Philologie) Modul: Forschungspraxis und Vertiefung (Master Studiengang: Sprache und Kommunikation) Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Italianistik) Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Nordistik) Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Deutsche Philologie) Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Englisch) Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Hispanistik) Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Französistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Italianistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Französistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Slavistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Hispanistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Deutsche Philologie) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Nordistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Latinistik) Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Englisch) Modul: Sprache als Prozess (Master Studiengang: Sprache und Kommunikation) Modul: Sprache als System (Master Studiengang: Sprache und Kommunikation) Wahlbereich Master Deutsche Philologie: Empfehlungen (Master Studienfach: Deutsche Philologie) |
Leistungsüberprüfung | Lehrveranst.-begleitend |
Hinweise zur Leistungsüberprüfung | Der Kurs wird als Seminar abgehalten, wobei die Diskussionsteilnahme von Studierenden unerlässlich ist. Die vergebenen Noten werden die Teilnahme widerspiegeln. Zusätzlich werden Übungen zur Förderung des aktiven Engagements durchgeführt. Die Studierenden werden auch eine Pilot-Literaturstudie (vorzugsweise in Gruppen von 2-3) zu einem Thema durchführen, wo CL-Methoden zur Untersuchung einer sprachwissenschaftlichen Fragestellung angewandt werden (könnten). Im Zusammenhang mit der Literaturstudie ist ein kurzes mündliches Referat (15-20 Min.) und eine schriftliche Arbeit erforderlich. |
An-/Abmeldung zur Leistungsüberprüfung | Anmelden: Belegen; Abmelden: nicht erforderlich |
Wiederholungsprüfung | keine Wiederholungsprüfung |
Skala | Pass / Fail |
Wiederholtes Belegen | nicht wiederholbar |
Zuständige Fakultät | Philosophisch-Historische Fakultät, studadmin-philhist@unibas.ch |
Anbietende Organisationseinheit | Fachbereich Deutsche Sprach- und Literaturwissenschaft |