Metoder och tillämpningar inom språkteknologin HT 2005
Schema och planering
| 04/10 [tisdag, v. 40] | 10-12 | 2-0024 | Introd. (MD/EP) [OH, nedan] |
| 05/10 [onsdag, v. 40] | 14-16 | 7-0042 | Grammatikanalys (MD) [ant., nedan] |
| 06/10 [torsdag, v. 40] | 13-15 | lab/F | Talteknologi (Frid, LU, distans) |
| 07/10 [fredag, v. 40] | 14-16 | 16-0043 | Textgranskning (PC) [OH, nedan] |
| 11/10 [tisdag, v. 41] | 13-15 | lab | (L1) Grammatikanalys (MD/EP) Gr. 1. |
| 11/10 [tisdag, v. 41] | 15-17 | lab | dito (MD/EP) Gr. 2. |
| 13/10 [torsdag, v. 41] | 13-15 | lab | forts. (EP) Båda gr. |
| 14/10 [fredag, v. 41] | 10-12 | 2-0024 | Taggning och tokenisering (EP) [Church] |
| 18/10 [tisdag, v. 42] | 13-15 | lab | (L2) Taggning och tokenisering (EP) Gr. 1. |
| 18/10 [tisdag, v. 42] | 15-17 | lab | dito (EP) Gr. 2. |
| 19/10 [onsdag, v. 42] | 15-17 | lab | forts. (EP) Båda gr. |
| 21/10 [fredag, v. 42] | 10-12 | 2-0024 | Korpuslingvistik (SGC) [Cermak] |
| 24/10 [m\fffd\ndag, v. 43] | 13-15 | lab | (L3) Korpusbehandling i Linux (EP) Gr. 1. |
| 24/10 [m\fffd\ndag, v. 43] | 15-17 | lab | dito (EP) Gr. 2. |
| 25/10 [tisdag, v. 43] | 13-15 | lab/F | Dialogsystem (Jonsson, GU, distans). Gör mittkursutvärdering! |
| 27/10 [torsdag, v. 43] | 10-12 | lab | forts. (EP) Båda gr. |
| 28/10 [fredag, v. 43] | 10-12 | 2-0024 | Maskinöversättning (EP/PW) [Arnold] |
| 01/11 [tisdag, v. 44] | 10-12 | lab | (L4) Maskinöversättning, värdering (EP) Gr. 1. |
| 01/11 [tisdag, v. 44] | 13-15 | lab | dito (EP) Gr. 2. |
| 03/11 [torsdag, v. 44] | 10-12 | lab | forts. (EP) Båda gr. |
| 03/11 [torsdag, v. 44] | 14-16 | 6-0031 | Maskinöversättning. Film: Sågvall Hein |
| 04/11 [fredag, v. 44] | 10-12 | 16-0042 | Informationssökning (JK) [Karlgren, Robertson & Spärck Jones] |
| 24/11 [torsdag, v. 47] | 14-16 | 2-1024 | Talteknologi (LC) [Cerrato, Dutoit (kursiv)] |
| 29/11 [tisdag, v. 48] | 14-16 | 16-0042 | forts. (LC) |
| 06/12 [tisdag, v. 49] | 10-12 | 2-0024 | Dialogsystem (MW) [Gustafsson, McTear] |
| 13/12 [tisdag, v. 50] | 10-12 | 2-0024 | Automatisk sammanfattning. Små skärmar. (EF/GÖ) [Maybury & Mani, Spärck Jones] |
| 10/01 [tisdag, v. 3] | 10-12 (ändrad tid!) | 16-0042 | Kursavslutning (MD/EP) |
Examination: 5 st. inlämningsuppgifter. U/G/VG sätts per uppgift. G på kursen minst G på alla. VG på kursen förutsätter VG på minst tre uppgifter.
Lärare: Mats Dahllöf (MD, kursansvarig), Eva Pettersson (EP, laborationshandledare), samt inbjudna föreläsare: Peter Cedermark (PC), Sofia Gustafson-Capkova (SGC), Jussi Karlgren (JK), Loredana Cerrato (LC), Mats Wirén (MW), Eva Forsbom (EF), Gustav Öqvist (GÖ), Per Weijnitz (PW).
Distansföreläsningar (6/10, 25/10): Dessa tillfällen är försök med distansföreläsningar.
Föreläsningsmaterial
- Föreläsning 1: OH (051004, MD, EP)
- Föreläsning 2: ant. (051005, MD)
- Föreläsning om Scania Checker (051007, Peter Cedermark)
- Taggning och tokenisering (051014, EP)
- Maskinöversättning (051028, EP)
- Talsyntes (051124, LC)
- Taligenkänning (051129, LC). Tips (från Loredana): Språket i P1 handlade häromdagen om tal- (och språk-) teknologi. Där kunde man bland annat höra Björn Gambäck från Sics och Björn Granström från KTH prata om taligenkänning, olika talsvarsystem och dialogsystem. Det går att ladda hem en realaudiofil från P1s hemsida: rm.
- Avslutande gång: OH (060110, MD, EP)
Examinationsuppgifter
- Uppgift (labb) 1
- Uppgift (labb) 2
- Uppgift (labb) 3
- Uppgift (labb) 4
- Uppgift 5 (Denna mindre essäuppgift har på allmän begäran lagts ut redan nu.) Lite mer info från Eva!
Kursvärderingar
Mittkursvärdering och kursvärdering har gjorts med deadlines 28/10 och 16/1.
Kurslitteratur
Ej slutgiltig lista. Vissa artiklar är relativt svåra, och kan läsas kursivt.
D. Arnold, Why Translation is Difficult for Computers
Cermak, F., 2003. Today's Corpus Linguistics: Some Open Questions. International Journal of Corpus Linguistics 7(2) 265-282. [rtf]
Cerrato, L., 2005, Föreläsningsanteckningar.
K. W. Church, Unix for Poets
T. Dutoit, A Short Introduction to Text-to-Speech Synthesis, Faculté Polytechnique de Mons.
Gustafson, J. (2002). Developing Multimodal Spoken Dialogue Systems. Empirical Studies of Spoken Human--Computer Interactions, PhD thesis, KTH, Stockholm. Kapitel 2--3 (sidan 5--36) pdf.
J. Karlgren, The Basics of Information Retrieval: Statistics and Linguistics, Stockholm: Swedish Institute of Computer Science.
McTear, M.F. (2002). Spoken dialogue technology: enabling the conversational interface. ACM Computing Surveys, Volume 34, Issue 1 (March 2002), pp. 90--169 (länk 1, länk 2).
Maybury, M. T. and Mani, I., 2001, Automatic Summarization. Tutorial Notes. ACL/EACL'01.
S.E. Robertson, K. Spärck Jones, 1997, Simple, proven approaches to text retrieval, University of Cambridge.
Spärck Jones, K. 1999, Automatic Summarization: Factors and Directions, i Mani, I. och Maybury, M. T., Advances in Automatic Text Summarization Cambridge, Massachusetts: MIT Press, 1-12.
A. Sågvall Hein, 2002, Introduktion till språkteknologi.
Ytterligare material tillkommer.
Länkar
- SweSum-demo (svensk sammanfattare).
