Uppsala universitet - Lingvistik
UPPSALA UNIVERSITET
Institutionen för lingvistik och filologi
Jörg Tiedemann
joerg@stp.ling.uu.se

Korpuslingvistik VT04

Nyheter

 • senaste ändring:
 • 040127: mejla förslag på fördjupningsuppgiften till <joerg@stp.ling.uu.se> (senast 2002-01-30)
 • 040127: lab-uppgifterna för lab 2 (deadline: 2004-02-12)
 • 040127: Mittkursutvärdering (tor 05 feb, L3)
 • 040127: lab-uppgifterna för lab 3 (deadline: 2004-02-19)
 • 040128: OH-bilderna för F1-F4 finns
 • 040128: lab-uppgifterna för lab 4
 • 040204: uppgifterna i lab 5 stryks (handledning av fördjupningsuppgiften istället)
 • 040217: OH-bilder från F5-F8 finns
 • 040217: korrigerade deadlines för projektuppgifterna
  presentationer: 09/03!
  inlämning av rapporten: 19/03!
 • 040217: Kursutvärdering (tor 04 mar, L7)
 • 040224: Föreläsning F11 stryks och ersätts med en extralaborationstillfälle för att jobba med fördjupninguppgiften!
 • 040315: ny inlämningsdeadline för slutrapporten: 2004-03-26

Schema

När Var Vad Litteratur
tis 20 jan, 14-16 16-0041 F1: Introduktion CL kap.1
tor 22 jan, 10-12 9-1016 F2: Korpustyper, datainsamling CL kap. 2 & 3
tor 22 jan, 14-16 L1: Översikt om fördjupningsuppgifterna
tis 27 jan, 10-12 16-0041 F3: Korpuskodering, grundläggande textverktyg CL kap. 2
tis 27 jan, 14-16 16-0041 F4: Korpusannotering, SGML, XML, Tipster, XML-verktyg CL kap. 2, TEI, IBR
tor 29 jan, 14-16 L2: GNU textverktyg och annat
tis 03 feb, 14-16 16-0041 F5: Kvalitativa & kvantitativa analyser CL kap. 3 & 6
tor 05 feb, 14-16 L3: Konkordansverktyg, korpussökning (Mittkursutvärdering)
tis 10 feb, 10-12 16-0041 F6: Spåkvetenskaplig korpuslingvistik CL kap. 4
tis 10 jan, 14-16 16-0041 F7: Språkteknologisk korpuslingvistik CL kap. 5, AB, MS 4, 10, 16
tor 12 feb, 14-16 L4: XML-verktyg
tis 17 feb, 10-12 16-0041 F8: Maskininlärning, data-drivna metoder CL 5, MS 10, 16
tor 19 feb, 14-16 L5: Fördjupningsuppgift: handledning
tis 24 feb, 10-12 16-0041 F9: Översättning och parallella korpusar CL 5.7, MS 13
tis 24 feb, 14-16 16-0041 F10: Fördjupningsuppgift: framsteg och diskussion
tor 26 jan, 14-16 L6: Fördjupningsuppgift: handledning
tis 02 mar, 10-12 16-0041 Extralab: Fördjupningsuppgift: handledning
tor 04 mar, 14-16 L7: Fördjupningsuppgift: handledning (Kursutvärdering)
tis 09 mar, 10-12 16-0041 F12: Fördjupningsuppgift: presentationer
tis 09 mar, 14-16 16-0041 F13: Fördjupningsuppgift: presentationer

Examination

Examination sker genom inlämning av labbrapporter, en muntlig presentation av en lämplig fördjupningsuppgift vid en av de sista 2 föreläsningar och en rapport som beskriva fördjupningsuppgiften.

Samtliga labbrapporter måste vara godkända. Betyget bestäms av den muntliga presentationen (40%) och den skriftliga rapporten om fördjupningsuppgiften (60%). Fördjupningsuppgiften är skräddarsydda för att bearbeta i gruppor (se instruktionerna). Det måste vara tydligt vem som har gjort vad. Alla i gruppen bör också ha en del i den muntliga presentationen.

tidpersonertema
10:15-10:55Terese, Marie, Magdalena, Annicadatorstödd språkinlärning med korpusmaterial
11:15-11:35Yoko, Matthiasandraspråksinlärning för ryska och japanska
11:40-11:50Annettefelsägningsdatabas
14:15-14:45Filip, Fredrik, Adame-post filtrering
15:00-15:40Johann, Patrik, Johannes, Stefan ordpredicering för chat-språk

Kurslitteratur

[CL] McEnery, Tony & Andrew Wilson, 2001
Corpus linguistics, 2nd edition. Edinburgh: Edinburgh University Press.

Kompletterande litteratur och läsrekommendationer

[AB] Abney, Steven, 1996.
Statistical methods and linguistics. The balancing act. Combining symbolic andd statistical approaches to language, utg. av J.L. Klavans & P. Resnik. Cambridge, Mass.: MIT Press. 1-26. Nås även via: http://www.vinartus.net/spa/95c.pdf.
[GJM] Ghani, Rayid, Rosie Jones & Dunja Mladenic, 2001.
Using the web to create minority language corpora. 10th International Conference on Information and Knowledge Management (CIKM-2001). Nås via: http://www.cs.cmu.edu/~TextLearning/corpusbuilder/papers/cikm2001.pdf.
[IBR] Ide, Nancy, Patrice Bonhomme & Laurent Romary, 2000.
XCES: an XML-based encoding standard for linguistic corpora. LREC 2000. Second international conference on language resources and evaluation. Athens: ELRA. 825-830. Nås även via: http://www.cs.vassar.edu/~ide/papers/xces-lrec00.ps.
[MS] Manning, Christopher D. and Schütze, Hinrich (1999)
Foundations of Statistical Natural Language Processing, Mit Press, May 1999, http://www-nlp.stanford.edu/fsnlp/promo/
[MV] Volk, Martin, 2002.
Using the web as corpus for linguistic research. In: Renate Pajusalu and Tiit Hennoste (eds.): Tähendusepüüdja. Catcher of the Meaning. A Festschrift for Professor Haldur Õim. Publications of the Department of General Linguistics 3. University of Tartu. Nås via: http://www.ifi.unizh.ch/cl/volk/papers/Oim_Festschrift_2002.pdf.
[TEI] Text Encoding Initiative, 2002
A Gentle Introduction to XML

Länkar