UPPSALA UNIVERSITET : Inst. f. lingvistik och filologi : STP
Uppsala universitet
Hoppa över länkar


Schema
Innehåll
Examination
Tentamen
Laborationer
Litteratur
Kursvärderingar


Introduktion till språkteknologi

Poäng: 7,5 hp
Kursplan: 5LN424
Teachers: Joakim Nivre, Mats Dahllöf, Beáta Megyesi

Nyheter

Schema

Datum Tid Sal Innehåll Litteratur
F1
12/11
10-12
16-0043
Inledning

F2
19/11
10-12
16-0043
Skrivstöd
L&C 2
F3
21/11
10-12
2-1024
Språkinlärning (MD)
L&C 3
L4
26/11
10-12, 13-15
Chomsky
Lab 1: Ord och n-gram

F5
28/11
12-14
16-0041
Informationssökning
L&C 4
L6
3/12
10-12, 13-15
Chomsky
Lab 2: Ordklasstaggning

F7
5/12
10-12
2-0024
Textklassificering (BM)
L&C 5
L8
10/12
10-12, 13-15
Chomsky
Lab 3: Sentimentanalys

F9
12/12
10-12
16-0054
Dialogsystem
L&C 6
F10
17/12
10-12
6-0022
Maskinöversättning
L&C 7

20/12
8-12
Bergsbrunnagatan
Tentamen


10/1
8-12
Bergsbrunnagatan
Omtentamen

OBS: Chomsky = 9-2043

Innehåll

Kursen ger en introduktion till språkteknologi med fokus på tillämpningar såsom skrivstöd, datorstödd språkinlärning, informationssökning, textklassificering, dialogsystem och maskinöversättning. Förutom föreläsningar ingår laborationer som introducerar grundläggande tekniker såsom n-gram-modeller, sekvenstaggning och dokumentklassificering.

Examination

Kursen examineras genom skriftlig tentamen och laborationer. För betyget godkänt (G) krävs godkänt på tentamen och samtliga laborationer. För betyget väl godkänt (VG) krävs dessutom väl godkänt på tentamen.

Tentamen

Den skriftliga tentamen behandlar språkteknologiska tillämpningsområden, så som de beskrivs i kursboken och föreläsningsanteckningarna. De flesta frågor kommer att behandla sådant som vi gått igenom på föreläsningarna, och att klara dessa frågor räcker för att bli godkänd. Ett mindre antal frågor kan behandla sådant som står i boken men inte tagits upp på föreläsningarna. Följande avsnitt i boken kommer dock inte att examineras: hela kapitel 1, sektion 2.4-2.5, hela kapitel 8, samt alla Under-the-Hood-avsnitt.

Exempel på möjliga tentamensfrågor:

  1. Beskriv två metoder som kan användas för att detektera stavfel som resulterar i icke-ord. (Svaret bör innehålla en kortfattad beskrivning av lexikonbaserad metoder och n-gram-metoder, gärna med oskådliga exempel.)

  2. Förklara idén bakom PageRank, dvs. den metod som används av Google och andra sökmotorer för att bedöma webbsidors popularitet/trovärdighet. (Svaret bör förklara att bedömningen beror dels på hur många inkommande länkar en sida har - ju fler desto bättre - och dels på hur många utgående länkar de länkande sidorna har - ju färre desto bättre. Ett exempel är bra även här.)

  3. Vad innebär länkning (eng alignment) i samband med maskinöversättning? (Svaret bör förklara både menings- och ordlänkning i parallella korpusar.)

Laborationer

  1. Ord och n-gram
  2. Ordklasstaggning
  3. Sentimentanalys

Litteratur

Dessutom tillkommer material i samband med laborationerna.

Course Evaluations

Mittkursvärdering

Slutkursvärdering