Module Import 04CV1005 - Introduction to Computational Linguistics

Status: Published
Workload3 ECTS = 90 hrs
Credits, Weight3 ECTS, (n.s.)
Language of Instruction German
Semester (n.s.)
Duration1 Sem.
M/E Elective
Courses
Course No. Type Name MA/EL Workload Credits Contact Hours Selfstudy Group Size
04CV1005-1 Lecture Einführung in die Computerlinguistik EL 3 ECTS = 90 hrs 3 ECTS 2 hrs/week = 30 hrs 60 hrs 30
04CV1005-2 Exercise Einführung in die Computerlinguistik EL 3 ECTS = 90 hrs 3 ECTS 2 hrs/week = 30 hrs 60 hrs 30
Learning Outcomes

Einsatzpotential und –grenzen von natürlichsprachlichen Komponenten sollen selbstständig erkennbar werden. Falls bei verfügbaren Produkten die Anwendungsdomäne angepasst werden muss, so erlauben die Konzepte aus den beiden Vorlesungen, dies adäquat zu tun.

Content

In Einführung in die Computerlinguistik (ECL) I werden wissensbasierte Ansätze in der Sprachverarbeitung vorgestellt:

- Pattern Matching,

  • Morphologische Analyse und Generierung,
  • Syntaxanalyse,
  • Wortsemantik,
  • Satzsemantik,
  • pragmatische Konzepte, sowie
  • natürlichsprachliche Generierung.

In ECL II werden statistische Methoden vorgestellt:

- Definition grundlegende Begriffe,

- Problem des Part-Of-Speech-Taggings mittels Hidden Markov Models,

- Probabilistische Kontext-freie Grammatiken für Parsing bzw. Chunking,

- Informationstheorie nach Shannon zur Denition von Perplexity, Cross Entropy, und Noisy Channel,

- Spell Checking mittels Noisy Channel Modellierung,

- Sentiment Analyse mittels Naive Bayes und Maximum Entropy,

- Clustering allgemein und in der Sentiment Analyse,

- Weitere Methoden in der Text Categorization, sowie

- Deep Learning allgemein und in der Sentiment Analyse und im Parsing.

Teaching Methods

(not specified)

Prerequisites

(not specified)

Examination Methods

Wird zu Beginn der Vorlesung jeweils festgelegt.

Credit Requirements

(not specified)

References

J. Allen. 1995.
Natural Language Understanding.
Second Edition, The Benjamin/Cummings Publishing Company, Menlo Park, CA, USA.

D. Jurafsk & J.H. Martin (2000). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Prentice Hall, Upper Saddle River, NJ, USA. Weitere spezielle Literatur wird in der Vorlesung kapitelweise angegeben.

C. Manning and H. Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999 bzw. verschiedene neue Auflagen (siehe http://nlp.stanford.edu/fsnlp/)

P. Jackson and I. Moulinier. 2002.Natural Language Processing for Online Applications: Text Retrieval,Extraction and Categorization John Benjamins, Amsterdam, NL/Philadelphia, PA, USA. (inzwischen auch in neuer Auflage erhältlich).

S. Jekat, R. Klabunde, H. Langer. Computerlinguistik und Sprachtechnologie: Eine Einführung, 2., überarbeitete Auflage, Elsevier, München, 2004. 

Responsible / Organizational Unit
Harbusch, Karin / Institute for Computational Visualistics
Additional Information

ECL I und II können unabhängig von einander, sowie in beliebiger Reihenfolge gehört werden, da die notwendige Nomenklatur jeweils eingeführt wird. Die dabei auftretenden Redundanzen sind sehr gering.

Literatur zu ECLI

J. Allen (1997). Natural Language Understanding. 2nd Edition, Benjamin Cummings, Menlo Park, CA/USA.

S. Bird, E. Klein, and E. Loper (2009). Natural Language Processing with Python. O’Reilly, Gravenstein, CA/USA.

K.-U. Carstensen, C. Ebert, C. Ebert, S. Jekat, R. Klabunde, und H. Langer (Hrsg.) (2009). Computerlinguistik und Sprachtechnologie - Eine Einführung., Zweite-Auflage , Spektrum Akademischer Verlag,

P. Eisenberg (2013). Grundriss der deutschen Grammatik: Band 1: Das Wort., 4-te Auflage, Springer, Berlin/etc.

Literatur zu ECLII

C.D. Manning. and H. Schütze (2003).

Foundations of Statistical Natural Language Processing. 6h edition. MIT Press, Cambridge, MA/USA.(First edition:

http://ics.upjs.sk/~pero/web/documents/pillar/Manning_Schuetze_StatisticalNLP.pdf

I. Goodfellow, Y. Bengio, and A. Courville (2016). Deep Learning. MIT Press, Cambridge, MA/USA (see http://www.deeplearningbook.org).

D.Jurafsky, and J.H. Martin (2009). Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. , Second Edition, Prentice Hall, Eaglewood Cliffs, NJ/USA (Draft of third edition (2018): https://web.stanford.edu/~jurafsky/slp3/wird in der Vorlesung benutzt).

Last change
Apr 24, 2018 by Frey, Johannes
Last Change Module
Jul 9, 2018 by Frey, Johannes