Zur Merkliste hinzufügen
Zurück

 

59877-01 - Seminar: Computerlinguistik 3 KP

Semester Herbstsemester 2020
Angebotsmuster einmalig
Dozierende John Nerbonne (john.nerbonne@unibas.ch, BeurteilerIn)
Inhalt Die Computerlinguistik (CL) ist das Forschungsgebiet, das sich auf die rechnergestützte Sprachverarbeitung konzentriert. Sie umfasst Theorie, Experiment und Anwendung, wobei das Interesse – Zeitschriftenartikeln und Konferenzberichten der letzten 10-20 Jahre nach zu urteilen – hauptsächlich auf den Anwendungen liegt (z.B. Informationssuche, maschinelle Übersetzung, Sprachsteuerung von Geräten, automatische Korrektur von Rechtschreibung und Grammatik, Hilfe für Behinderte und automatische Zusammenfassung). Das Interesse an Anwendungen wird von einer großen Aufmerksamkeit für zentrale Aufgaben begleitet wie Tokenisierung, String-basierte Suche, PoS Tagging, Parsing (Satzzergliederung), Alignment (‚Abgleichen‘), String-basierte Suche oder Sentiment detection (‚Erkennung der Einstellung des Autoren‘). Ausgehend von einem Überblick über die Arbeiten und Fortschritte in der CL in den letzten 30 Jahren, konzentriert sich dieser Kurs auf Bereiche, in denen Methoden und Ansätze der CL für spezifisch sprachwissenschaftliche Fragestellungen angewandt wurden, insbesondere in den Bereichen Grammatik (Syntax), (Erst-)Spracherwerb, Zweitsprachenlernen, Dialektologie und Soziolinguistik, historische Linguistik und Sprachkontakt.
Besonderes Augenmerk legen wir auf Fragen zur Eignung der Sprachtechnologie (LT) in der Sprachwissenschaft, zu relevanten Wahlmöglichkeiten (Parametern) für bestimmte Aufgaben und zu den Möglichkeiten für weitere Forschungsarbeiten, die gleiche oder ähnliche LT gebrauchen könnten.
Lernziele Nach diesem Kurs sollten die Studierenden in der Lage sein, sprachwissenschaftliche Forschungsarbeiten zu rezipieren, die auf Computertechniken basieren, sowie zu wissen, welche kritischen Fragen zu ihrer Angemessenheit und ihrer Gültigkeit in der theoretischen und deskriptiven Linguistik zu stellen sind, und neuartige Anwendungen der rechnergestützten Verarbeitung in diesen Bereichen in Betracht ziehen zu können.
Literatur Von den Studierenden wird nicht erwartet, dass sie das gesamte unten aufgeführte Material lesen. Einige Titel sind aus Gründen der Quellenangabe beigefügt. Genauere Aufgaben werden während des Kurses zur Verfügung stehen.
Wissenschaftliche Publikationen, die ich mitverfasst habe, sind verfügbar unter http://www.let.rug.nl/nerbonne/papers.html. Die Grundlagen der Computerlinguistik werden von Jurafsky und Martin zur Verfügung gestellt. Die Rohverfassung der 3. Aufl. ist verfügbar unter https://web.stanford.edu/~jurafsky/slp3/ und wird unten als SLP bezeichnet. Einige von Jurafskys Vorlesungen sind abrufbar unter https://www.youtube.com/channel/UC_48v322owNVtORXuMeRmpA.
Bastiaanse, Roelien, Gosse Bouma, & Wendy Post. (2009) "Linguistic complexity and frequency in agrammatic speech production." Brain and Language 109.1: 18-28.
Chomsky, Noam. (1957) Syntactic structures. The Hague: De Gruyter.
Cöltekin, Cagri (2011) Catching words in a stream of speech: Computational simulations of segmenting transcribed child-directed speech. Ph.D. Diss., Groningen. Avail. at http://hdl.handle.net/11370/bb37ac1c-41ce-48d9-aca7-a26453546726
Foltz, Peter W., Darrell Laham, and Thomas K. Landauer. (1999) "Automated essay scoring: Applications to educational technology." EdMedia+ innovate learning. Association for the Advancement of Computing in Education. http://www.psych.nmsu.edu/~pfoltz/reprints/Edmedia99.html
Jurafsky, Daniel & James Martin (in prog.) Speech and Language Processing. Pearson: London. 3rd ed. See above.
Lauttamus, Timo, John Nerbonne, & Wybo Wiersma. (2007) "Detecting syntactic contamination in emigrants: the English of Finnish Australians." SKY Journal of Linguistics 20: 273-307.
Nerbonne, John (2009) Data-Driven Dialectology Language and Linguistics Compass 3(1): 175-198. DOI: 10.1111/j.1749-818x2008.00114.
Nerbonne, John (2018) "Vaulting Ambition" In: Eric Fuß, Marek Konopka, Beata Trawinski & Ulrich Waßner (eds.) Grammar and Corpora. Heidelberg University Press. 445-468.
Tirosh, Ofer (2020) What the Data is Telling Us About Machine Translation. Are Software Algorithms Overtaking Human Linguists? Toward Data Science (blog). towardsdatascience.com/what-the-data-is-telling-us-about-machine-translation-ea987742403c
Toral, Antonio (2020, to appear) Reassessing Claims of Human Parity and Super-Human Performance in Machine Translation at WMT 2019. Proc. European Association for Machine Translation.
Wieling, Martijn, Jelke Bloem, Kaitlin Mignella, Mona Timmermeister, & John Nerbonne (2014)
Automatically measuring foreign accent strength in English. Validating Levenshtein Distance as a measure.. Language Dynamics and Change 4(2): 253-269.
Wiersma, Wybo, John Nerbonne, and Timo Lauttamus (2011) "Automatically extracting typical syntactic differences from corpora." Literary and Linguistic Computing 26.1: 107-124.
Wilcox, Ethan, et al. (2018) "What do RNN Language Models Learn about Filler-Gap Dependencies?" In: Proc. 2018 EMNLP Workshop BlackboxNLP. Avail. at www.aclweb.org/anthology/W18-5423.

 

Unterrichtssprache Deutsch
Einsatz digitaler Medien Online-Veranstaltung
HörerInnen willkommen

 

Intervall Wochentag Zeit Raum

Keine Einzeltermine verfügbar, bitte informieren Sie sich direkt bei den Dozierenden.

Module Modul: Aufbaustudium Deutsche Sprachwissenschaft (Bachelor Studienfach: Deutsche Philologie)
Modul: Disziplinäre Vertiefung (Bachelor Studienfach: Deutsche Philologie)
Modul: Forschungspraxis und Vertiefung (Master Studiengang: Sprache und Kommunikation)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Italianistik)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Nordistik)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Deutsche Philologie)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Englisch)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Hispanistik)
Modul: Interphilologie: Sprachwissenschaft BA (Bachelor Studienfach: Französistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Italianistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Französistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Slavistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Hispanistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Deutsche Philologie)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Nordistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Latinistik)
Modul: Interphilologie: Sprachwissenschaft MA (Master Studienfach: Englisch)
Modul: Sprache als Prozess (Master Studiengang: Sprache und Kommunikation)
Modul: Sprache als System (Master Studiengang: Sprache und Kommunikation)
Wahlbereich Master Deutsche Philologie: Empfehlungen (Master Studienfach: Deutsche Philologie)
Leistungsüberprüfung Lehrveranst.-begleitend
Hinweise zur Leistungsüberprüfung Der Kurs wird als Seminar abgehalten, wobei die Diskussionsteilnahme von Studierenden unerlässlich ist. Die vergebenen Noten werden die Teilnahme widerspiegeln. Zusätzlich werden Übungen zur Förderung des aktiven Engagements durchgeführt. Die Studierenden werden auch eine Pilot-Literaturstudie (vorzugsweise in Gruppen von 2-3) zu einem Thema durchführen, wo CL-Methoden zur Untersuchung einer sprachwissenschaftlichen Fragestellung angewandt werden (könnten). Im Zusammenhang mit der Literaturstudie ist ein kurzes mündliches Referat (15-20 Min.) und eine schriftliche Arbeit erforderlich.
An-/Abmeldung zur Leistungsüberprüfung Anmelden: Belegen; Abmelden: nicht erforderlich
Wiederholungsprüfung keine Wiederholungsprüfung
Skala Pass / Fail
Wiederholtes Belegen nicht wiederholbar
Zuständige Fakultät Philosophisch-Historische Fakultät, studadmin-philhist@unibas.ch
Anbietende Organisationseinheit Fachbereich Deutsche Sprach- und Literaturwissenschaft

Zurück