Uppsala universitet - Lingvistik
UPPSALA UNIVERSITET
Institutionen för lingvistik och filologi
Jörg Tiedemann
joerg@stp.ling.uu.se

MASKINÖVERSÄTTNING OCH SPRÅKGRANSKNING vt 2004

Nyheter

  • senaste ändring:
  • 2004-05-07: oh-bilder för F6
  • 2004-05-10: seminarie-anvisningar finns på kurssidan
  • 2004-05-11: MATS-lab är on-line
  • 2004-05-16: Lab 6 finns
  • 2004-06-02: Kursutvärdering

Schema

LektionDatumTidSal ÄmneLitteraturLärare
F1 Må 19/4 10-12 16-0041 Kursintroduktion [OH] JT
F2 On 21/4 10-12 4-4005 Språkgranskning: stavningskontroll [ML] [JM5] EG
F3 On 28/4 10-12 4-4005 Språkgranskning: grammatikkontroll [JHMR] OK
F4 Ti 4/5 10-12 16-0041 Introduktion till UCP [TO04] KO
L1 Ti 4/5 13-15 Introduktion till UCP. Parsning med UCP KO, PS
L2 On 5/5 9-12 Parsning med UCP (forts) KO, PS
F5 To 6/5 14-16 16-0041 Grundläggande strategier inom maskinöversättning
[Slides (ppt)]
[JM][DA] ASH
L3 Fr 7/5 9-12 Grammatikkontroll med UCP KO, PS
L4 Må 10/5 13-16 Grammatikkontroll med UCP (forts) KO, PS
F6 Ti 11/5 10-12 16-0041 MATS-systemet. En introduktion. [OH]
[Slides (pdf)] [Slides (ppt)]
[LREC][MTS] PW
L5 Ti 11/5 13-16 En första bekantskap med MATS-systemet. PW, EF
L6 Må 17/5 13-16 Den lexikala databasen, ordlänkning, termextraktion. [OH] [JT02] JT
F7 Ti 18/5 10-12 16-0041 Unifieringsbaserad transfer och generering med MULTRA [BB][MULTRA] PW
L7 Ti 18/5 13-16 Transfer och generering med MULTRA i MATS-systemet PW, EG/EP
L8 On 19/5 9-12 Transfer och generering med MULTRA i MATS-systemet EG, EP
F8 On 19/5 14-16 16-0041 Seminarium: studentpresentationer ASH, JT, EG, EF, EP
F9 On 2/6 10-12 4-4005 Seminarium: studentpresentationer ASH, JT, EG, EF, EP
L9 To 3/6 9-12 Laborationshandledning efter behov EG, EP, EF
L10 To 3/6 13-16 Laborationshandledning efter behov EG, EP, EF

Lärare

Anna Sågvall Hein, ASH
Kristina Ohlander, KO
Per Starbäck, PS
Per Weijnitz, PW
Ebba Gustavii, EG
Eva Pettersson, EP
Eva Forsbom, EF
Ola Knutsson, OK
Jörg Tiedemann, JT (kursansvarig)

Kurskrav

Aktivt deltagande i undervisningen, en presentation (F8, F9) samt genomförande av laborationsuppgifter med skriftlig rapportering.
Kursen består av 2 delar som betygsättas som följande:

Språkgranskning:

  • Laborationsuppgift (1,5 poäng)
  • Teoretisk fråga (0,5 poäng)
Maskinöversättning
  • Laborationsuppgift (1,5 poäng)
  • Teoretisk fråga (0,5 poäng)
  • Presentation + diskussion (1 poäng)
Laborationerna utförs individuella (inga grupparbeten). Seminariepresentationen kan utföras i grupp (max 3 personer). Dessutom skall varje grupp förbereda frågor till en annan presentation. Presentationerna ska handla om olika forskningsområden inom språkgranskning och maskinöversättning och förbereds med hjälp av given litteratur.

Betyget bestäms enligt följande: För att blir godkänt i kursen krävs det godkänt i alla delar. VG får man om alla delar är godkända och man har fått VG på minst 3,5 av poängen (t.ex. 1 labb VG + VG på båda teorifrågor eller VG på båda labbar och minst en VG på en av teorifrågorna)

Laborationsuppgifter

http://stp.ling.uu.se/~kroh/mosg04/ucplab2004.html

Litteratur

Uppfriskningslitteratur

Sågvall Hein, Anna, 1997. Introduktion till språkteknologi. Reviderad 990825. Uppsala universitet. Institutionen för lingvistik.

Föreläsning 2

[ML] Roger Mitton, Longman 1996, kapitel 7
English Spelling and the Computer
[JM5] Daniel Jurafsky and James H. Martin, kapitel 5 fram till avsnitt 5.6
An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition
Information om boken: http://www.cs.colorado.edu/~martin/slp.html
[KK] Kukich, K. (1992).
Techniques for automatically correcting words in text, ACM Computing Surveys 24(4).
http://portal.acm.org/citation.cfm?id=146380&dl=ACM&coll=portal

Föreläsning 3

[JHMR] K. Jensen; G. E. Heidorn; L. A. Miller; Y. Ravin
Parse Fitting and Prose Fixing: Getting a Hold on Ill-formedness, American Journal of Computational Linguistics, Volume 9, Number 3-4, July-December 1983.
http://acl.ldc.upenn.edu/J/J83/J83-3002.pdf
[MB] Lidia Mangu and Eric Brill; ICML 1997.
Automatic Rule Acquisition For Spelling Correction
http://www.cs.jhu.edu/~brill/ICML97.ps
[IUSI] Emi Izumi, Kiyotaka Uchimito, Thepchai Supnithi, and Hitoshi Isahara, 2003
Automatic error detection in the Japanese learners' English spoken data (2003). Companion Volume to the Porceedings of ACL '03, pages 145-148, Sapporo, Japan.
http://acl.eldoc.ub.rug.nl/mirror/P/P03/P03-2026.pdf
[B00] Birn, J. 2000.
Detecting grammar errors with Lingsoft's Swedish grammar checker. In Nordgård, T. (ed.) Nodalida '99 Proceedings from the 12th Nordiske datalingvistikkdager, Department of Linguistics, University of Trondheim, p. 28-40.
[BK] Bigert, J & Knutsson, O. (2002).
Robust Error Detection: A Hybrid Approach Combining Unsupervised Error Detection and Linguistic Knowledge. In the Proceedings of Romand02, 2nd Workshop on RObust Methods in Analysis of Natural language Data , Frascati, Italy. pp. 10-19.
http://www.nada.kth.se/~johnny/docs/BigertKnutsson02hybrid.pdf

Föreläsning 4

[TO04] Ohlander, Tina, 2004.
Översikt över UCP-kommandon.
http://stp.ling.uu.se/~kroh/mosg04/ucpkommandon.ps

Föreläsning 5

[JM] Daniel Jurafsky and James H. Martin
An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Part V: Multilingual Processing, Chapter 21 Machine Translation
Information om boken: http://www.cs.colorado.edu/~martin/slp.html
[DA] Doug Arnold
Why Translation is Difficult for Computers. In Computers and Translation, kapitel 2, [ps] [doc]

Föreläsning 6

[LREC] Sågvall Hein, Anna, Eva Forsbom, Jörg Tiedemann, Per Weijnitz, Leif-Jöran Olsson, Sten Thaning, Ingrid Almqvist, 2002,
Scaling up an MT prototype for Industrial Use. Databases and Data Flow. Submission to LREC2000.
http://stp.ling.uu.se/educa/kurssidor/mosg/lrec02.ps
[MTS] Anna Sågvall Hein, Per Weijnitz, Eva Forsbom, Jörg Tiedemann, Ebba Gustavii (2003)
MATS - A Glass Box Machine Translation System In Proceedings of the Ninth Machine Translation Summit, pp. 491-493, New Orleans, USA.
http://stp.ling.uu.se/~perweij/papers/MATS_MtSummitIX.rtf

Föreläsning 7

[BB] Beskow, Björn, 1993.
Unification-Based Transfer in Machine Translation. RUUL 24. Uppsala University. Department of Linguistics. Beskow, Björn. 1997.
[MULTRA] Generation in Multra.
Uppsala University. Department of Linguistics.
http://stp.ling.uu.se/~starback/multra/generate.ps

Lab 6

[JT02] Tiedemann, Jörg, 2002,
MatsLex - a Multilingual Lexical Database for Machine Translation. Submission to LREC2002.
http://stp.ling.uu.se/educa/kurssidor/mosg/lrec2002e.pdf

Referenslitteratur

Somers, Harold (ed.)
Computers and Translation: A Handbook. Prefinal draft.
Kapitel 1 | Kapitel 2 | Kapitel 3 | Kapitel 4 | Kapitel 5
Kapitel 6 | Kapitel 7 | Kapitel 8 inte klart ännu | Kapitel 9 | Kapitel 10
Kapitel 11 | Kapitel 12 | Kapitel 13 | Kapitel 14 | Kapitel 15
D.J. Arnold, Lorna Balkan, Siety Meijer, R.Lee Humphreys and Louisa Sadler, 1994
Machine Translation: an Introductory Guide, Blackwells-NCC, London, 1994, ISBN: 1855542-17x
http://www.essex.ac.uk/linguistics/clmt/MTbook/PostScript/

Länkar