Den lexikala komponenten i en språkbeskrivning till UCP består av tre
delar: ett antal morflexikon (stam- och affixlexikon), en
lemma- och en lexembas.
Morflexikonen innehåller morfer (stammar, böjningsmorfer eller oböjliga
ord) till vilka en UCP-sats knutits. När en teckensträng återfunnits i
ett morflexikon evalueras denna sats. Morflexikonen representerar därmed
den aktiva delen av lexikonet.
Lemma- och lexembasen utgör den
deklarativt formulerade delen av lexikonet. Som ett exempel på
de olika lexikonkomponenternas användning kan vi se på den
lexikala information som finns knuten till verbet förklara.
Detta verb har en regelbunden böjning och tillhör den första
konjugationen. I LPS-0's språkbeskrivning motsvaras denna av
böjningsmönstret pattern.älska. Denna information knyts till
verbets stam, som i detta fall är förklara och läggs i
stamlexikonet sve.dic:
(define sve.dic förklara #u pattern.älska;)
Till lemmat FÖRKLARA.VB knyts information om vilka lexem som
ingår i lemmat. Detta anges sålunda i lemmabasen:
(define lemma FÖRKLARA.VB (LEX FÖRKLARA.VB.1) (LEX2 FÖRKLARA.VB.2))
Den teknik som uttnyttjas för att knyta flera lexem till ett lemma är att det första lexemet knyts till attributet LEX, det andra till LEX2 o.s.v. För verblexemen anges vilka verbaktionsregler som är förknippade med dem:
(define lexeme FÖRKLARA.VB.1 (VERBACTION va.plundra))
(define lexeme FÖRKLARA.VB.1 (VERBACTION va.antyda))
I LPS-0 används lemmabasen endast för att lagra information om vilka lexem som tillhör ett visst lemma, utom ifråga om verblexem, till vilka även särdragen PASS och DEPON samt attributet VERBCOMP knyts. (Ett särdrag antar något av värdena + och NIL.) PASS anger att verbet kan förekomma i passiv form och DEPON anger att det är fråga om ett deponensverb. Särdragen PASS och DEPON är aktuella endast vid den morfologiska analysen. Inga detaljer kommer därför att ges här om deras användning. VERBCOMP-attributet anger vilken verbkompositionsregel som knyts till lemmat.
I lexembasen finns fler slag av information än i lemmabasen. Till substantiv och proprier knyts särdragen TEMP, LOC, och STUFF. TEMP anger att ordet kan vara huvudord i en nominalfras som refererar till en tidpunkt. LOC anger att ordet kan vara huvudord i en nominalfras som refererar till en plats. Särdraget STUFF ges åt substantiv som tillhör klassen dividua, d.v.s. ämnesnamn och en del andra ord. Till adverb knyts särdragen TRUTH, ATTITUDE, CONJ, TEMP, LOC. Deras innebörd och användning beskrivs närmre i avsnitt 3.5.7. Till verblexem knyts, vilket visats ovan, information om dess valens iform av en verbaktionsregel (under attributet VERBACTION). Till subjunktioner knyts särdraget EXPL, som anger att de kan fungera som bisatsinledare i en explikativ bisats.
För vissa attribut i lemma- och lexembasen har defaultvärden givits. Om ett attribut inte definierats vare sig för det aktuella lemmat eller lexemet eller bland defaultvärdena, har det värdet NIL, som ifråga om särdrag tolkas som ett negativt värde. Defaultvärdena har i språkbeskrivningen definierats med satsen:
(define default-values
(DLEX (apply-function gen-lex))
(PASS +)
(VERBCOMP vc.ta))
För ord som tillhör vissa ordklasser, för vilka det inte varit meningsfullt, åtminstone i språkbeskrivningens nuvarande utvecklingsskede, att urskilja olika betydelser, har i den föreliggande språkbeskrivningen en en-till-entydig korrespondens mellan lemma och lexem upprätthållits. De aktuella ordklasserna är proprier, pronomen, relativpronomen, adverb, konjunktioner, subjunktioner, och prepositioner. Eftersom lexemet i dessa fall lätt kan genereras ur lemmanamnet har detta definierats som ett defaultvärde till attributet DLEX (Default LEXem) som (apply-function gen-lex). Detta innebär att när man accessar attributet DLEX hos ett lemma så returneras det värde som erhålls då lispfunktionen gen-lex appliceras på lemmanamnet. Detta värde utgörs av den atom som bildas om man appenderar .1 till lemmanamnet och bildar således namnet på det första (och i de här fallen enda) lexemet under lemmat ifråga. Om lemmat exempelvis är ATT.SN så är motsvarande lexem (det värde som gen-lex returnerar) ATT.SN.1. De övriga två defaultdefinierade attributen är särdraget PASS, som ges positivt värde (eftersom de flesta verb kan passiveras) och VERBCOMP, vars defaultvärde är vc.ta.
Innehållet i det minimala lexikon som ingår LPS-0's språkbeskrivning är för alla ordklasser utom verben tämligen trivialt.
Vad gäller verben har den lemma- och lexemindelning som görs i Svensk ordbok (1986) behållits. I många fall har dock inte alla lexem tagits upp i LPS-0's lexikon. De verbaktionsregler som knutits till verblexemen svarar mot en typisk konstruktion eller ett antal typiska konstruktioner i vilket lexemet brukar förekomma, men inte nödvändigtvis alla. Eftersom ett omfattande och systematiskt arbete med framtagandet av lexikon pågår inom LPS-projektet och eftersom det föreliggande arbetets syfte främst varit att utveckla en grammatisk beskrivning och lexikonet endast tjänat som ett underlag för testning av denna, har ingen större möda ägnats formuleringen av detta.
Som illustration till LPS-0 ges här trettiotre
exempel på analyser som genererats
av denna parser.
1) KALLE SPRINGER.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = SPRINGA.VB.1)
TENSE = PRES
SEP = .))
Detta exempel visar den enklaste typen av deklarativ huvudsats, vilken
består av ett subjekt och ett predikat, som utgörs av ett intransitivt
verb. I analysen anges fraskategori (PHR.CAT) som sats (CL; clause),
satstyp (TYPE) som huvudsats (MAIN) och modus (MODE) som deklarativt
(DECL). Fundamentet (FUND) utgörs av nominalfrasen Kalle, som också är
subjekt (SUBJ) i satsen. Fundamentet och subjektet är alltså identiska.
För predikatet (PRED) anges lexemtillhörighet (LEX). Tempus (TENSE) är
presens (PRES). Det avslutande skiljetecknet (SEP; separator) utgörs av
en punkt (.).
2) KALLE HAR SPRUNGIT.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = SPRINGA.VB.1)
TENSE = PERF
SEP = .))
Detta exempel visar att sammansatta tempus hanteras på samma sätt som
enkla: Det enda som skiljer denna analys från exempel 1), är att tempus
här angivits som perfekt (PERF).
3) LISA HÅLLER AV KALLE.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = HALLA.VB+AV.PL.1)
TENSE = PRES
OBJ.DIR = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SEP = .))
Detta exempel är avsett att demonstrera hanteringen av partikelverb.
Analysen av en sats där predikatet utgörs av ett sådant får samma
struktur som i de fall predikatet är ett enkelt verb.
Partikelverbslemmat (HÅLLA.AV+AV.PL) genereras genom att verblemmat
(HÅLLA.VB) och verbpartikellemmat (AV.PL) och ett mellanliggande
plustecken konkateneras. Predikatet tillhör det första (och enda)
lexemet (HÅLLA.VB+AV.PL.1) under detta lemma. Detta predikat tar förutom
subjekt också ett direkt objekt (OBJ.DIR) som argument.
4) SOLDATERNA PLUNDRADE STADEN.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = PLUR
HEAD = (WORD.CAT = NOUN
LEX = SOLDAT.NN.1)
SPEC = <* FUND FORM>
REF = +)
SUBJ = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = STAD.NN.1)
SPEC = <* SUBJ FORM>
REF = +)
PRED = (LEX = PLUNDRA.VB.1)
TENSE = PRET
OBJ.DIR = <* FUND>
SEP = .))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = PLUR
HEAD = (WORD.CAT = NOUN
LEX = SOLDAT.NN.1)
SPEC = <* FUND FORM>
REF = +)
SUBJ = <* FUND>
PRED = (LEX = PLUNDRA.VB.1)
TENSE = PRET
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = STAD.NN.1)
SPEC = <* OBJ.DIR FORM>
REF = +)
SEP = .))
När ett enkelt verb tar både subjekt och direkt objekt uppstår en
tvetydighet: Den första läsningen svarar mot fallet att det direkta
objektet är topikaliserat och den andra, som är den ordinära läsningen,
att subjektet står i fundamentsposition. I den första analysen är
således staden subjekt och soldaterna direkt objekt. Eftersom
plundra normalt kräver ett animat subjekt kunde ett utnyttjande av
selektionsrestriktioner vid analysen utesluta denna läsning. I den andra
analysen är soldaterna subjekt och staden direkt objekt, viket
naturligtvis motsvarar den semantiskt sett mest sannolika läsningen.
5) LISA PRENUMERERAR PÅ GÖTEBORGS-POSTEN.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = PRENUMERERA.VB.1)
TENSE = PRES
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = PA.PP.1)
RECT = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = GOTEBORGS-POSTEN.PM.1
WORD.CAT = NOUN)
REF = +))
SEP = .))
Exemplet visar en analys av en mening där prediktet tagit ett
prepositionsobjekt (OBJ.PREP) som argument. Detta utgörs av en
prepositionsfras: på Göteborgs-Posten.
6) PÅ GÖTEBORGS-POSTEN PRENUMERERAR LISA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = PP
PREP = (LEX = PA.PP.1)
RECT = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = GOTEBORGS-POSTEN.PM.1
WORD.CAT = NOUN)
REF = +))
SUBJ = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
PRED = (LEX = PRENUMERERA.VB.1)
TENSE = PRES
OBJ.PREP = <* FUND>
SEP = .))
Ett prepositionsobjekt kan topikaliseras.
7) GÖTEBORGS-POSTEN PRENUMERERAR LISA PÅ.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = GOTEBORGS-POSTEN.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
PRED = (LEX = PRENUMERERA.VB.1)
TENSE = PRES
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = PA.PP.1)
RECT = <* FUND>)
SEP = .))
Exemplet visar analysen av en mening där prepositionsobjektet splittrats
på så sätt att prepositionen står på prepositionsobjektets normala
plats, medan dess rektion topikaliserats.
8) MANNEN TAR PÅ HATTEN.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
SPEC = <* FUND FORM>
REF = +)
SUBJ = <* FUND>
PRED = (LEX = TA.VB.4)
TENSE = PRES
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = PA.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HATT.NN.1)
SPEC = <* OBJ.PREP RECT FORM>
REF = +)
SEP = .))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
SPEC = <* FUND FORM>
REF = +)
SUBJ = <* FUND>
PRED = (LEX = TA.VB+PA.PL.1)
TENSE = PRES
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HATT.NN.1)
SPEC = <* OBJ.DIR FORM>
REF = +)
SEP = .))
Denna mening exemplifierar en typ av ambiguitet som kan uppstå då ett
ord kan tolkas både som preposition och verbpartikel. I första analysen
är det det enkla verbet (TA.VB.4) som är predikat. Det tar ett
prepositionsobjekt, här på hatten, som argument och på fungerar
sålunda som preposition. Den andra analysen motsvarar fallet att på
fungerar som verbpartikel. Predikatet utgörs då av partikelverbet
(TA.VB+PÅ.PL.1), som tar ett direkt objekt hatten. Denna ambiguitet är
egentligen möjlig bara i skriven svenska. I talat språk skiljs de båda
läsningarna åt genom prosodin: En preposition är normalt obetonad medan
en verbpartikel betonas ganska kraftigt.
9) KALLE GAV LISA BOKEN.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
PRED = (LEX = GE.VB.1)
TENSE = PRET
OBJ.INDIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* OBJ.INDIR FORM>
REF = +)
OBJ.DIR = <* FUND>
SEP = .))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
PRED = (LEX = GE.VB.1)
TENSE = PRET
OBJ.INDIR = <* FUND>
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* OBJ.DIR FORM>
REF = +)
SEP = .))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = GE.VB.1)
TENSE = PRET
OBJ.INDIR = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* OBJ.DIR FORM>
REF = +)
SEP = .))
Detta är ett exempel på en trefaldig ambiguitet. Denna uppstår eftersom
verbet tar tre argument (subjekt, direkt objekt och indirekt objekt) och
eftersom grammatiken tillåter att vart och ett av dessa topikaliseras.
En ytterligare förutsättning är att nominalfraserna som står i de
aktuella funktionerna inte är markerade för kasus, i vilket fall
tretydigheten reduceras till tve- eller entydighet. I första analysen är
Lisa subjekt, boken indirekt objekt (OBJ.INDIR), och Kalle direkt
objekt. Denna läsning skulle givetvis kunna uteslutas (åtminstone så
gott som) på semantiska grunder. Den andra analysen svarar mot en
läsning där Lisa är subjekt, Kalle är indirekt objekt, och boken
är direkt objekt. Denna läsning är naturligtvis helt acceptabel ur
semantisk synvinkel, ehuru den fördenskull knappast är särskilt
sannolik. Den läsning som man i de allra flesta fall skulle ge åt
meningen representeras av den tredje och sista analysen, där Kalle är
subjekt, Lisa indirekt objekt och boken direkt objekt.
10) KALLE GAV BOKEN TILL LISA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* SUBJ FORM>
REF = +)
PRED = (LEX = GE.VB.1)
TENSE = PRET
OBJ.DIR = <* FUND>
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = TILL.PP.1)
RECT = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +))
SEP = .))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = GE.VB.1)
TENSE = PRET
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* OBJ.DIR FORM>
REF = +)
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = TILL.PP.1)
RECT = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +))
SEP = .))
Med avseende på de i normala fall föredragna läsningarna är denna mening
och den föregående synonyma. Eftersom prepositionsfrasen här har samma
relation, semantiskt sett, som det indirekta objektet har till verbet,
klassificerar många grammatiker en sådan prepositionsfras som ett
indirekt objekt, så t.ex. Thorell (1973). I den här presenterade
grammatiken har dock en mer ytinriktat synsätt valts, enligt vilket
prepositionsfrasen analyseras som ett prepositionsobjekt.
11) DET BÖRJAR NU.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
CASE = BASIC
GENDER = NEUTR
NUMB = SING
REF = +
HEAD = (LEX = DEN.PN.1
WORD.CAT = PRON))
SUBJ = <* FUND>
PRED = (LEX = BORJA.VB.1)
TENSE = PRES
OBJ.TEMP = (PHR.CAT = ADVP
HEAD = (LEX = NU.AB.1))
SEP = .))
Meningen ger exempel på ett temporalobjekt OBJ.TEMP, som utgörs av ett
nu.
12) NU BÖRJAR DET.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = ADVP
HEAD = (LEX = NU.AB.1))
SUBJ = (PHR.CAT = NP
CASE = BASIC
GENDER = NEUTR
NUMB = SING
REF = +
HEAD = (LEX = DEN.PN.1
WORD.CAT = PRON))
PRED = (LEX = BORJA.VB.1)
TENSE = PRES
OBJ.TEMP = <* FUND>
SEP = .))
Ett temporalobjekt kan, som de flesta typer av verbargument, placeras i
fundamentsposition.
13) ELVATIDEN BÖRJAR DET VID.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = ELVATID.NN.1)
SPEC = <* FUND FORM>
REF = +)
SUBJ = (PHR.CAT = NP
CASE = BASIC
GENDER = NEUTR
NUMB = SING
REF = +
HEAD = (LEX = DEN.PN.1
WORD.CAT = PRON))
PRED = (LEX = BORJA.VB.1)
TENSE = PRES
OBJ.TEMP = (PHR.CAT = PP
PREP = (LEX = VID.PP.1)
RECT = <* FUND>)
SEP = .))
Ett temporalobjekt kan realiseras som en prepositionsfras. Denna kan,
som i denna mening, splittras på samma sätt som ett prepositionsobjekt.
14) EN MAN BOR I HUSET.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = INDEF
GENDER = UTR
NUMB = SING
SPEC = INDEF
DETER = (LEX = EN.AL.1)
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = BO.VB.1)
TENSE = PRES
OBJ.LOC = (PHR.CAT = PP
PREP = (LEX = I.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = NEUTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HUS.NN.1)
SPEC = <* OBJ.LOC RECT FORM>
REF = +))
SEP = .))
Meningen ger exempel på ett lokationsobjekt (OBJ.LOC). Detta utgörs här
av en sammanhållen prepositionsfras i huset.
15) HÄR BOR KALLE.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = ADVP
HEAD = (LEX = HAR.AB.1))
SUBJ = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
PRED = (LEX = BO.VB.1)
TENSE = PRES
OBJ.LOC = <* FUND>
SEP = .))
Lokationsobjekt kan även utgöras av adverbfraser och topikaliseras.
16) DET BOR EN MAN I HUSET.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
HEAD = (LEX = DET.PN.1))
SUBJ.FORM = <* FUND>
PRED = (LEX = BO.VB.1)
TENSE = PRES
SUBJ.PROPER = (PHR.CAT = NP
FORM = INDEF
GENDER = UTR
NUMB = SING
SPEC = INDEF
DETER = (LEX = EN.AL.1)
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
REF = +)
OBJ.LOC = (PHR.CAT = PP
PREP = (LEX = I.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = NEUTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HUS.NN.1)
SPEC = <* OBJ.LOC RECT FORM>
REF = +))
SEP = .))
Vissa verb, exempelvis sådana som betecknar något slag av befintlighet,
kan, istället för att förekomma med vanligt subjekt,
ingå i en konstruktion med ett
formellt subjekt (SUBJ.FORM) plus ett egentligt subjekt (SUBJ.PROPER). Ett
formellt subjekt utgörs alltid av ett platshållande det. Det egentliga
subjektet är alltid en nominalfras i obestämd form. Ett formellt subjekt
förekommer alltid tillsammans med ett egentligt subjekt, och vice versa.
17) LISA ANTYDER ATT MANNEN HAR TAGIT PENGARNA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = LISA.PM.1
WORD.CAT = NOUN)
REF = +)
SUBJ = <* FUND>
PRED = (LEX = ANTYDA.VB.2)
TENSE = PRES
OBJ.EXPL = (PHR.CAT = CL
TYPE = SUBORD
SUBTYPE = EXPL
INTROD = (LEX = ATT.SN.1)
SUBJ = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
SPEC = <* OBJ.EXPL SUBJ FORM>
REF = +)
PRED = (LEX = TA.VB.1)
TENSE = PERF
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = PLUR
HEAD = (WORD.CAT = NOUN
LEX = PENG.NN.1)
SPEC = <* OBJ.EXPL OBJ.DIR FORM>
REF = +))
SEP = .))
Verblexemet ANTYDA.VB.2 konstrueras med ett explikativobjekt (OBJ.EXPL).
Detta består av en explikativ (SUBTYPE=EXPL) bisats (PHR.CAT=CL och
TYPE=SUBORD; subordinate). Dess bisatsinledare (INTROD; introducer)
består av ett att.
18) HAN BÖRJAR SJUNGA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
SUBJ = <* FUND>
PRED = (LEX = BORJA.VB.2)
TENSE = PRES
OBJ.INF = (SUBJ = <* FUND>
PHR.CAT = CL
TYPE = INF
PRED = (LEX = SJUNGA.VB.1))
SEP = .))
Verbet tar i detta exempel ett infinitivobjekt som argument. Detta
utgörs av en infinitivfras (PHR.CAT=CL och TYPE=INF). Subjektet i den
överordnade satsen blir också subjekt i den underordnade
infinitivfrasen.
19) HON TVINGADE HONOM ATT SJUNGA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HON.PN.1
WORD.CAT = PRON))
SUBJ = <* FUND>
PRED = (LEX = TVINGA.VB.1)
TENSE = PRET
OBJ.DIR = (PHR.CAT = NP
CASE = OBL
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
OBJ.INF = (SUBJ = <* OBJ.DIR>
PHR.CAT = CL
TYPE = INF
INF.MARK = ATT.SN.1
PRED = (LEX = SJUNGA.VB.1))
SEP = .))
I detta fall, där verbet tvinga är predikat i den överordnade satsen,
förmedlas det direkta objektet i denna som subjekt i den underordnade
infinitivfrasen. I denna är infinitivmärket (INF.MARK) utsatt.
20) BOKEN FINNS ATT LÄSA I BIBLIOTEKET.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* FUND FORM>
REF = +)
SUBJ = <* FUND>
PRED = (LEX = FINNAS.VB.1)
TENSE = PRES
OBJ.INF = (OBJ.DIR = <* FUND>
PHR.CAT = CL
TYPE = INF
INF.MARK = ATT.SN.1
PRED = (LEX = LASA.VB.1))
OBJ.LOC = (PHR.CAT = PP
PREP = (LEX = I.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = NEUTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BIBLIOTEK.NN.1)
SPEC = <* OBJ.LOC RECT FORM>
REF = +))
SEP = .))
Meningen ger exempel på ett fall där ett subjekt i en överordnad sats
förmedlas som direkt objekt i en infinitivfras.
21) STADEN PLUNDRADES AV SOLDATERNA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = STAD.NN.1)
SPEC = <* FUND FORM>
REF = +)
PASS = +
SUBJ = <* FUND>
PRED = (LEX = PLUNDRA.VB.1)
TENSE = PRET
AGENT = (PHR.CAT = PP
PREP = (LEX = AV.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = PLUR
HEAD = (WORD.CAT = NOUN
LEX = SOLDAT.NN.1)
SPEC = <* AGENT RECT FORM>
REF = +))
SEP = .))
Detta är den passiverade varianten av exempel 4) (i dess normala
läsning). Passiv diates anges i analysen med särdraget PASS. I en normal
passiv sats motsvarar agenten (AGENT) subjektet vid aktiv diates och
subjektet motsvarar det direkta objektet vid aktiv diates.
22) MANNEN ANTYDS HA TAGIT PENGARNA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
SPEC = <* FUND FORM>
REF = +)
PASS = +
SUBJ = <* FUND>
PRED = (LEX = ANTYDA.VB.2)
TENSE = PRES
OBJ.INF = (SUBJ = <* FUND>
PHR.CAT = CL
TYPE = INF
PRED = (LEX = TA.VB.1)
TENSE = PERF.INF
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = PLUR
HEAD = (WORD.CAT = NOUN
LEX = PENG.NN.1)
SPEC = <* OBJ.INF OBJ.DIR FORM>
REF = +))
SEP = .))
Om vi uppfattar denna mening som en passiv variant av 17), så har vi här
ett exempel på en avvikande typ av passivering, där ett explikativt
objekt vid aktiv diates splittrats vid passiveringen i ett subjekt och
ett infinitivobjekt, vars subjekt är identiskt med subjektet i den
överordnade satsen.
23) KALLE AVSATTES FRÅN STATSRÅDSPOSTEN.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
PASS = +
SUBJ = <* FUND>
PRED = (LEX = AVSATTA.VB.1)
TENSE = PRET
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = FRAN.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = STATSRADSPOST.NN.1)
SPEC = <* OBJ.PREP RECT FORM>
REF = +))
SEP = .))
Ett prepositionsobjekt påverkas normalt inte vid passivering.
24) KALLE TVINGADES ATT SPRINGA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
GENDER = UTR
NUMB = SING
PROPR = +
HEAD = (LEX = KALLE.PM.1
WORD.CAT = NOUN)
REF = +)
PASS = +
SUBJ = <* FUND>
PRED = (LEX = TVINGA.VB.1)
TENSE = PRET
OBJ.INF = (SUBJ = <* FUND>
PHR.CAT = CL
TYPE = INF
INF.MARK = ATT.SN.1
PRED = (LEX = SPRINGA.VB.1))
SEP = .))
När verbet tvinga konstrueras med direkt objekt och infinitivobjekt i
aktiv diates, som i exempel 19), förmedlas det direkta objektet som
subjekt i infinitivfrasen. Vid passiv diates är, följdriktigt, subjekten
i den överordnade satsen och infinitivfrasen identiska.
25) HAN KUNDE TYVÄRR INTE SJUNGA IGÅR.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
SUBJ = <* FUND>
ADV.ATTITUDE11 = (PHR.CAT = ADVP
HEAD = (LEX = TYVARR.AB.1))
ADV.TRUTH11 = (PHR.CAT = ADVP
HEAD = (LEX = INTE.AB.1))
PRED = (LEX = KUNNA.VB.1)
TENSE = PRET
OBJ.INF = (SUBJ = <* FUND>
PHR.CAT = CL
TYPE = INF
PRED = (LEX = SJUNGA.VB.1)
ADV.TEMP21 = (PHR.CAT = ADVP
HEAD = (LEX = IGAR.AB.1)))
SEP = .))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
SUBJ = <* FUND>
ADV.ATTITUDE11 = (PHR.CAT = ADVP
HEAD = (LEX = TYVARR.AB.1))
ADV.TRUTH11 = (PHR.CAT = ADVP
HEAD = (LEX = INTE.AB.1))
PRED = (LEX = KUNNA.VB.1)
TENSE = PRET
OBJ.INF = (SUBJ = <* FUND>
PHR.CAT = CL
TYPE = INF
PRED = (LEX = SJUNGA.VB.1))
ADV.TEMP21 = (PHR.CAT = ADVP
HEAD = (LEX = IGAR.AB.1))
SEP = .))
Denna mening innehåller tre adverbial. Ett talarattitydsadverbial
(ADV.ATTITUDE11) tyvärr och ett sanningsvärdesadverbial (ADV.TRUTH11)
inte står i huvudsatsens första adverbialsgrupp. Det tredje
adverbialet, ett tidsadverbial igår, ger upphov till en ambiguitet
eftersom det kan tolkas som hörande till antingen infinitivfrasen eller
huvudsatsen. I båda fallen står det i den andra (finala)
adverbialsgruppen och för således namnet ADV.TEMP21.
26) UTAN ATT HON MÄRKTE DET BÖRJADE HAN SJUNGA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = PP
PREP = (LEX = UTAN.PP.1)
RECT = (PHR.CAT = CL
TYPE = SUBORD
SUBTYPE = EXPL
INTROD = (LEX = ATT.SN.1)
SUBJ = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HON.PN.1
WORD.CAT = PRON))
PRED = (LEX = MARKA.VB.3)
TENSE = PRET
OBJ.DIR = (PHR.CAT = NP
CASE = BASIC
GENDER = NEUTR
NUMB = SING
REF = +
HEAD = (LEX = DEN.PN.1
WORD.CAT = PRON))))
SUBJ = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
PRED = (LEX = BORJA.VB.2)
TENSE = PRET
OBJ.INF = (SUBJ = <* SUBJ>
PHR.CAT = CL
TYPE = INF
PRED = (LEX = SJUNGA.VB.1))
ADV.CIRC = <* FUND>
SEP = .))
I ovanstående mening analyseras Utan att hon märkte det som en
prepositionsfras där prepositionen styr en explikativ bisats. (Thorell
(1973) tolkar utan att som en sammansatt subjunktion. Han skulle
sålunda kalla den fras som här analyserats som en prepositionsfras för
en bisats.) Den tilldelas funktionen omständighetsadverbial (ADV.CIRC;
circumstance).
27) SPRING!
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = IMP
PRED = (LEX = SPRINGA.VB.1)))
En imperativ (MODE=IMP) huvudsats. Analysen visar vilka lättlästa
och lättöverskådliga analyser LPS-0 genererar.
28) TA INTE PÅ HATTEN!
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = IMP
ADV.TRUTH11 = (PHR.CAT = ADVP
HEAD = (LEX = INTE.AB.1))
PRED = (LEX = TA.VB.4)
OBJ.PREP = (PHR.CAT = PP
PREP = (LEX = PA.PP.1)
RECT = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HATT.NN.1)
SPEC = <* OBJ.PREP RECT FORM>
REF = +))))
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = IMP
ADV.TRUTH11 = (PHR.CAT = ADVP
HEAD = (LEX = INTE.AB.1))
PRED = (LEX = TA.VB+PA.PL.1)
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HATT.NN.1)
SPEC = <* OBJ.DIR FORM>
REF = +)))
Samma ambiguitet som i exempel 8), fast i imperativ version.
29) BOR DET EN MAN HÄR?
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = INTERR
QUESTIONTYPE = YES-NO
SUBJ.FORM = (PHR.CAT = NP
HEAD = (LEX = DET.PN.1))
PRED = (LEX = BO.VB.1)
TENSE = PRES
SUBJ.PROPER = (PHR.CAT = NP
FORM = INDEF
GENDER = UTR
NUMB = SING
SPEC = INDEF
DETER = (LEX = EN.AL.1)
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
REF = +)
OBJ.LOC = (PHR.CAT = ADVP
HEAD = (LEX = HAR.AB.1))))
Ett exempel på en ja-nej-fråga (MODE=INTERR och QUESTIONTYPE=YES-NO).
30) FÖRBJÖD HON HONOM ATT LÄSA BOKEN?
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = INTERR
QUESTIONTYPE = YES-NO
SUBJ = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HON.PN.1
WORD.CAT = PRON))
PRED = (LEX = FORBJUDA.VB.2)
TENSE = PRET
OBJ.DIR = (PHR.CAT = NP
CASE = OBL
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
OBJ.INF = (SUBJ = <* OBJ.DIR>
PHR.CAT = CL
TYPE = INF
INF.MARK = ATT.SN.1
PRED = (LEX = LASA.VB.1)
OBJ.DIR = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* OBJ.INF OBJ.DIR FORM>
REF = +))))
Ytterligare en ja-nej-fråga.
31) MANNEN SOM FÖRSER HENNE MED BÖCKER BOR I FINLAND.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = UTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = MAN.NN.1)
SPEC = <* FUND FORM>
REF = +
ATTR.REL = (CORR = (PHR.CAT = <* FUND PHR.CAT>
HEAD = <* FUND HEAD>
FORM = <* FUND FORM>
GENDER = <* FUND GENDER>
NUMB = <* FUND NUMB>
REF = <* FUND REF>)
PHR.CAT = CL
TYPE = SUBORD
SUBTYPE = REL
INTROD = SOM.RP.1
SUBJ = <* FUND ATTR.REL CORR>
PRED = (LEX = FORSE.VB.1)
TENSE = PRES
OBJ.DIR = (PHR.CAT = NP
CASE = OBL
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HON.PN.1
WORD.CAT = PRON))
OBJ.PREP =
(PHR.CAT = PP
PREP = (LEX = MED.PP.1)
RECT = (PHR.CAT = NP
FORM = INDEF
GENDER = UTR
NUMB = PLUR
HEAD = (WORD.CAT = NOUN
LEX = BOK.NN.1)
SPEC = <* FUND ATTR.REL
OBJ.PREP RECT FORM>
REF = +))))
SUBJ = <* FUND>
PRED = (LEX = BO.VB.1)
TENSE = PRES
OBJ.LOC = (PHR.CAT = PP
PREP = (LEX = I.PP.1)
RECT = (PHR.CAT = NP
GENDER = NEUTR
NUMB = SING
PROPR = +
HEAD = (LEX = FINLAND.PM.1
WORD.CAT = NOUN)
REF = +))
SEP = .))
I denna analys visas hur relativa (SUBTYPE=REL) bisatser hanteras.
Relativsatsen fungerar här som ett attribut (REL.ATTR) till den
nominalfras som står i fundamentspositionen. Korrelatet (CORR) till
relativsatsen utgör ett utsnitt av den nominalfras den modifierar. Detta
utsnitt ärver de grammatiska dragen samt huvudordet, och bildar i sig en
nominalfras. Detta korrelat tilldelas en funktion i relativsatsen. I
detta fall är det subjekt. Enligt den traditionella synen bland
grammatiker, som exempelvis representeras av Torell (1973), är det dock
relativpronomenet som i detta fall skulle tolkas som subjekt. Här har
alltså en annan analys valts.
32) HUSET SOM HAN BOR I PLUNDRADES IGÅR.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
FORM = DEF
GENDER = NEUTR
NUMB = SING
HEAD = (WORD.CAT = NOUN
LEX = HUS.NN.1)
SPEC = <* FUND FORM>
REF = +
ATTR.REL = (CORR = (PHR.CAT = <* FUND PHR.CAT>
HEAD = <* FUND HEAD>
FORM = <* FUND FORM>
GENDER = <* FUND GENDER>
NUMB = <* FUND NUMB>
REF = <* FUND REF>)
PHR.CAT = CL
TYPE = SUBORD
SUBTYPE = REL
INTROD = SOM.RP.1
SUBJ = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HAN.PN.1
WORD.CAT = PRON))
PRED = (LEX = BO.VB.1)
TENSE = PRES
OBJ.LOC = (PHR.CAT = PP
PREP = (LEX = I.PP.1)
RECT = <* FUND ATTR.REL CORR>)))
PASS = +
SUBJ = <* FUND>
PRED = (LEX = PLUNDRA.VB.1)
TENSE = PRET
ADV.TEMP21 = (PHR.CAT = ADVP
HEAD = (LEX = IGAR.AB.1))
SEP = .))
I ovanstående mening har en prepositionsfras som till funktionen är ett
lokationsobjekt splittrats på så vis att prepositionens rektion utgörs
av korrelatet.
33) HON HAR EN HUND SOM KAN SJUNGA.
(* = (PHR.CAT = CL
TYPE = MAIN
MODE = DECL
FUND = (PHR.CAT = NP
CASE = NOM
GENDER = UTR
NUMB = SING
REF = +
HEAD = (LEX = HON.PN.1
WORD.CAT = PRON))
SUBJ = <* FUND>
PRED = (LEX = HA.VB.1)
TENSE = PRES
OBJ.DIR = (PHR.CAT = NP
FORM = INDEF
GENDER = UTR
NUMB = SING
SPEC = INDEF
DETER = (LEX = EN.AL.1)
HEAD = (WORD.CAT = NOUN
LEX = HUND.NN.1)
REF = +
ATTR.REL = (CORR = (PHR.CAT = <* OBJ.DIR PHR.CAT>
HEAD = <* OBJ.DIR HEAD>
FORM = <* OBJ.DIR FORM>
GENDER = <* OBJ.DIR GENDER>
NUMB = <* OBJ.DIR NUMB>
REF = <* OBJ.DIR REF>)
PHR.CAT = CL
TYPE = SUBORD
SUBTYPE = REL
INTROD = SOM.RP.1
SUBJ = <* OBJ.DIR ATTR.REL CORR>
PRED = (LEX = KUNNA.VB.1)
TENSE = PRES
OBJ.INF = (SUBJ = <* OBJ.DIR ATTR.REL CORR>
PHR.CAT = CL
TYPE = INF
PRED = (LEX = SJUNGA.VB.1))))
SEP = .))
I denna mening agerar korrelatet subjekt både i relativsatsen och
infinitivfrasen.
En av de mest intressanta egenskaperna vid bedömningen av en parser är givetvis dess täckningsgrad, d.v.s. hur stor del av språket (av en viss typ, stil eller inom en given domän) den potentiellt har förmåga att analysera. Vid utvecklingen av LPS-0 har ambitionen varit att endast utveckla grammatiska regler för analysen av svenskans satstyper. Vid utvärderingen av denna parser skall därför här bortses från de fall då parsern inte klarar av att analysera en sats p.g.a. den ofullständiga behandlingen av övriga frastyper eller p.g.a. brister i lexikonet. Den intressanta frågan är alltså: Hur långt skulle satsreglerna i LPS-0 räcka, om lexikonet var fullständigt och grammatiken utan undantag kunde analysera övriga frastyper?
LPS-0's språkbeskrivning täcker in följande satstyper: deklarativa huvudsatser, imperativa satser, ja-nej-frågor, två typer av bisatser och infinitivfraser. Satser av dessa typer analyseras i mer eller mindre fullständig omfattning av LPS-0. För att en deklarativ huvudsats skall klaras av måste den överensstämma med följande satsschema (som är av diderichsenliknande typ):
| FUND1 | FIN2 | SUBJ3 | ADV14 | INFIN5 | PART6 | ARG7 | ADV28 |
|---|---|---|---|---|---|---|---|
| Kalle | sjöng | igår | |||||
| Igår | hade | hon | inte | tagit | den | ||
| Han | håller | av | henne |
En majoritet av de huvudsatser som förekommer i normal sakprosa torde överensstämma med detta schema. Undantag utgör exempelvis vissa meningar med det besvärliga ordet kanske, som Han kanske sjunger., liksom fall där ett argument till verbet, annat än subjektet, hamnar före verbet, som i Lantbruksstyrelsen har av tullen begärt att få hjälp med namnen på djurägarna.. Imperativa satser kan analyseras av LPS-0 om de överensstämmer med detta schema:
| IMP1 | ADV1 | PART2 | ARG3 | ADV2 |
|---|---|---|---|---|
| Spring | ||||
| Ta | inte | på4 | hatten | nu |
| Ge | boken till henne |
Undantag från detta schema torde vara sällsyntare än undantag från LPS-0's huvudsatsschema. Även schemat för ja-nej-frågor torde vara mycket vältäckande och stämma överens med de allra flesta ja-nej-frågor:
| FIN | SUBJ | ADV1 | INFIN | PART | ARG | ADV2 |
|---|---|---|---|---|---|---|
| Har | du | sjungit |
Ifråga om bisatser är grammatikens potentiella teckningsgrad betydligt sämre. Regler har implementerats för endast två typer. Den första av dessa är relativsatser, som skall överensstämma med följande schema för att kunna analyseras av LPS-0:
| REL1 | SUBJ2 | ADV1 | FIN | INFIN | PART | ARG3 | ADV2 |
|---|---|---|---|---|---|---|---|
| som | han | inte | har | bott | i | ||
| han | höll | av |
Även om det kan förmodas att de flesta relativsatser är formade enligt detta schema är undantag från det ganska vanliga. Exempelvis har ingenting gjorts i grammatiken för att hantera fall där en preposition styr relativpronomenet, som i Sjukdomen i vilken hunden insjuknade var rabies.. Explikativa bisatser, den andra kategorin av bisatser som tagits med i LPS-0's grammatik, är inte lika problematiska och kan analyseras om de överensstämmer med detta schema:
| INL1 | SUBJ | ADV1 | FIN | INFIN | PART | ARG | ADV2 |
|---|---|---|---|---|---|---|---|
| att | hon | hade | tagit | boken |
Undantag från detta torde vara av samma slag som undantagen från LPS-0's huvudsatsschema. Även dess infinitivfrasschema torde vara tämligen vältäckande:
| INFM1 | ADV12 | INF3 | INFIN | PART | ARG | ADV2 |
|---|---|---|---|---|---|---|
| att | springa | idag |
Grammatiken kan hantera partikelverb och sammansatta tempus på ett tillfredsställande sätt. Ingenting har dock gjorts för att ta hand om reflexiva verb. Både aktiv och passiv diates är möjlig. Ifråga om de typer av verbargument som kan hanteras är grammatiken ofullständig. Arbetet inom LPS-projektet med ett verbvalenslexikon ger vid handen att ett trettiotal typer kan behövas. I den föreliggande grammatiken har elva definierats: subjekt, formellt subjekt, egentligt subjekt, indirekt objekt, direkt objekt, prepositionsobjekt, lokationsobjekt, temporalobjekt, explikationsobjekt, infinitivobjekt, och agent. Endast en begränsad uppsättning verbvalensregler (verbaktionsregler) har definierats. Lexikonet kan dock betraktas som deras logiska hemvist. LPS-0's kompetens vad gäller adverbial är endast fragmentarisk.
Möjligheten att samordna satser har helt ignorerats i LPS-0's grammatik. De ovannämnda fenomen som språkbeskrivningen inte klarar av kan relativt lätt inkorporeras i den. I samband med samordningar uppstår dock problem vars lösning inte ges någon antydan i LPS-0's grammatik. Jag tänker då på det fenomen som brukar kallas dubbelsyftning, och som består i att ett led som är utsatt i endast en av två eller flera satser i en samordning i själva verket har en funktion i flera dessa, som i exempel som: Han spelar och sjunger. och Kalle gav boken åt Lisa och hon pengarna åt honom..
En parsers egenskaper bestäms i hög grad av det underliggande parsingmaskineriet. Många drag hos LPS-0 är sålunda en direkt konsekvens av UCP's konstruktion. Även om UCP är ett kraftfullt och ofta väl fungerande redskap för analys av naturligt språk, är den dock behäftad med ett antal svagheter, som huvudsakligen beror UCP-formalismens utpräglat procedurella karaktär. Dessa bör nämnas innan de specifika egenskaperna hos LPS-0 diskuteras.
Utmärkande för UCP är att hela kontrollen av vad som sker i charten under parsingprocessens förlopp ligger i grammatikskrivarens händer. Sålunda måste avancemang av aktiva bågar, ansättning av regler, lagring av resultat etc. begäras explicit i de regler som utgör språkbeskrivningen. Motiven till att på detta sätt överlämna alla parsingstrategiska beslut till grammatikskrivaren, har främst varit att att denne därmed skall ges möjlighet att formulera grammatiken på ett sätt som svarar mot ett från ekonomisk synpunkt optimalt beteende hos parsern. Det finns dock ett antal nackdelar med språkbeskrivningar som på detta sätt är procedurella. Detta har lett till att man inom datalingvistiken mer och mer övergivit procedurellt formulerade språkbeskrivningar till förmån för deklarativa grammatiker. Problemen med procedurella språkbeskrivningar kommer sig till största delen av att den innehåller två vitt skilda slag av information: dels fakta om språkliga uttrycks uppbyggnad, dels parsingtekniska instruktioner. Därmed får den som skriver språkbeskrivningen en svårare uppgift: Han har både att specificera lingvistiska fakta och parsingteknisk information. För att kunna göra detta måste han vara väl insatt i det bakomliggande parsingmaskineriets verkningssätt och hela tiden beakta dess beteende. För att kunna utnyttja de fördelar det procedurella skrivsättet ger måste han också, gång på gång, göra parsingstrategiska överväganden. Hans uppgift är därmed betydligt mer krävande än dens som skriver en parsergrammatik i en deklarativ formalism, där man kan bortse från allt parsingtekniskt.
En annan nackdel, av mer teknisk art, med procedurella språkbeskrivningar, är att de är specialdesignade för ett visst slag av parsingmaskineri, som inte tillåter några större modifikationer. En deklarativt formulerad parsinggrammatik kan däremot användas ihop med varje tänkbar tillräckligt kraftfull parsingteknik. Arbetar man med deklarativa grammatiker är man alltså fri att övergå till en bättre parsingmetod, om en sådan blir tillgänglig, vilket man med största sannolikhet inte kan göra om man arbetar med en procedurell språkbeskrivning (annat än med stora svårigheter).
Deklarativa språkbeskrivningar har också den fördelen framför procedurella att de är meningsfulla i sig själva -- i någon mening -- och förståeliga utan referens till ett visst slag av parsingmaskineri. En grammatik till en parser representerar ett vetenskapligt resultat och ett sådant bör vara presenterat på ett så rent och så allmänt tillgängligt sätt som möjligt och utan att vara låst till en viss tillämpning. Procedurella språkbeskrivningar motsvarar i mindre grad dessa krav än deklarativa.
UCP har, förutom de ovannämnda nackdelarna med en procedurell formalism, ett antal mer specifika egenskaper som försvårar grammatikskrivarens uppgift. Den kanske mest framträdande av dessa är den begränsning av möjligheterna att organisera språkbeskrivningen i ett antal modulära enheter som blir följden om man vill ha en så ekonomiskt effektiv språkbeskrivning som möjligt. Detta är en konsekvens av det sätt varpå nya aktiva bågar initieras i UCP: I LPS-0's språkbeskrivning ansätts exempelvis prepositionsfrasregeln sedan en preposition känts igen (d.v.s. parsingprocessen försiggår i detta fall bottom-up), och instruktionen om detta måste finnas i den regel som lagrar analysen av en preposition. Detta innebär att det inte varit möjligt att fördela arbetet så att en person tog hand om analysen av ord och en annan ansvarade för de syntaktiska komponenterna, utan att den senare var tvungen att lägga sig i vad morfologen gjorde. Detta försvårar givetvis det praktiska arbetet med UCP.
Även bristen på bra tracerutiner gör UCP svår att arbeta med. De tracerutiner som finns är alltför primitiva för att ge grammatikskrivaren något mer användbart stöd. Anledningen till detta är att man under trace får information om allt som händer i parsern, morfologi och syntax omvartannat. Man kan välja vilka slag av operationer som skall anges i trace-utskriften och man kan välja att hoppa över evalueringen av ett antal bearbetningssteg, men det finns ingen möjlighet att ange vad man är intresserad av i lingvistiska termer. Anlysen av en normallång mening kan omfatta några tusen operationer. Det är således långt ifrån lätt att i en trace hitta det som för tillfället är relevant. Arbetet med UCP skulle underlättas avsevärt om den utrustades med tracerutiner där man exempelvis kunde begära att få se evalueringen av en viss regel, analysen av fraser av en viss kategori, eller alla försök att finna subjektet till en sats. De nämnda bristerna hos de nuvarande tracerutinerna är knappast en svaghet hos UCP som sådan, utan snarare hos den nuvarande UCP-implementationen.
Av det som ovan sagts bör man inte dra slutsatsen att UCP skulle vara ett särskilt dåligt parsingsystem, tvärtom bör det betonas att många syntaktiska konstruktioner kan analyseras på ett mycket övertygande sätt i UCP. Man bör också komma ihåg att många föregivet deklarativa lingvistiska formalismer i realiteten har många procedurella drag, varför ovanstående argument inte talar med full styrka till deras fördel. UCP's har den goda egenskapen att vara speciellt lämpad för implementering av grammatiska principer som är formulerade i enighet med traditionell (pre-chomskyansk) grammatikteori. Ett betydelsefullt exempel på detta är den naturlighet varmed diderichsenska satsscheman låter sig formuleras i UCP-formalismen. Ett system som är otvivelaktigt överlägset UCP i att utföra traditionell satslösning och generera den typ av analyser som LPS-0 arbetar med är förmodligen inte lätt att hitta. Icke desto mindre vill jag hävda att många av de ovannämnda dragen hos UCP är otillfredsställande, och att vissa genomgripande förändringar behövs för att systemet ska kunna fungera väl.
För en parser är givetvis egenskaperna hos dess språkbeskrivning minst lika avgörande som de hos dess parsingmaskineri. Låt mig därför sammanfatta och diskutera de specifika dragen hos grammatiken till LPS-0. Det viktigaste av dessa är givetvis det slag av grammatisk analys som produceras. Denna anger i detta fall den grammatiska funktionsstrukturen i de analyserade satserna (och övriga frastyper). En sådan analys är mer semantiskt orienterad än en rent frasstrukturell analys. Typiskt för LPS-0 är att frasstrukturen analyseras parallellt med att den funktionella strukturen byggs upp. Ett alternativ till detta arbetssätt är att dela upp analysprocessen i två steg, varav det första utför en analys av frasstrukturen och det andra ur det genererade frasstrukturträdet beräknar den grammatiska funktionsstrukturen. I det senare fallet möjliggörs en separering av frasstrukturella fakta från grammatiskt funktionell information i språkbeskrivningen. I LPS-0's språkbeskrivning förekommer dessa två slag av fakta sida vid sida i reglerna. Detta överensstämmer väl med valet av Diderichsens (1966) modell som utgångspunkt för analysen av olika satstyper. Denna har i LPS-0 kombinerats med en valensteoretiskt grundat tillvägagångssätt för analysen av de argument som knyts till verb. Härvid används s.k. verbaktionregler, i vilka det anges vilka argument förutom subjekt eller formellt subjekt verbet konstrueras med. Vid formuleringen av dessa regler utnyttjas inga procedurella drag hos UCP-formalismen. De är alltså, i denna mening, deklarativa till sitt väsen och lätta att formulera. Detta är en viktig fördel, eftersom det kan förutses att grammatiken måste kompletteras med ett betydande antal verbaktionsregler när den byggs ut. I LPS-0 knyts endast en verbaktionsregel till varje lexem. Detta leder i de fall där ett verb kan förekomma i flera olika konstruktioner till antingen att verbaktionsregeln blir komplicerad (eftersom den innehåller många alternativ) eller att verbets valens blir ofullständigt beskriven. Detta problem kan enkelt lösas genom att fler verbaktionsregler tillåts för varje lexem. Argumenten till ett verb anges i verbaktionsreglerna explicit både för aktiv och passiv diates. Detta leder till en viss redundan i språkbeskrivningen, eftersom ett verbs konstruktion vid passiv diates ofta lätt kan härledas ur dess konstruktion vid aktiv diates. Detta är dock svårt att undvika emedan verbaktionsreglerna är procedurella såtillvida att de består av direkta anrop till argumentidentifieringsregler. Vid formuleringen av dessa har däremot en betydande generalisering kunnat göras genom det uniforma hanterandet av fundamentet i en deklarativ huvudsats och korrelatet till en deklarativ bisats.
Semantisk information uttnyttjas i ringa omfattning i språkbeskrivningen. I verbens valensangivelser (d.v.s. i verbaktionsreglerna) finns sålunda inga selektionsrestriktioner angivna. Detta leder till att LPS-0 för vissa meningar genererar analyser som från semantisk synpunkt är absurda. Många av de ambiguiteter som parsern finner, är således att betrakta som artefakter. Verbaktionsreglerna är dock formulerade på ett sådant sätt att de utan svårigheter kan kompletteras med selektionsrestriktioner.
Den parser som här presenterats, LPS-0, lämnar inte tillräckligt underlag för en slutgiltig och mer precis bedömning av de principer varpå den vilar; Därtill är dess språkbeskrivning alltför begränsad till sin omfattning. Det kan dock förmodas att många av de tekniker som utnyttjats vid dess konstruktion även i framtiden kommer att spela en stor roll i parsingsammanhang. Det underliggande parsingmaskineriet, chartparsingsystemet UCP, representerar en effektiv och kraftfull algoritm för analys av naturligt språk. Bruket av valensorienterade språkbeskrivningar -- i en eller annan form -- torde vara en förutsättnig för varje mer framgångsrikt parsingsystem. De kanske två största problemen med valens i parsingsammanhang, om man bortser från bristen på valenslexikon, är dels att avgöra hur detaljerad, hur semantiskt orienterad valensbeskrivningen skall vara, dels att finna en lämplig form för representation av valensinformationen. LPS-0 är inte mer än ett trevande försök att använda valensinformation, och dessa problem har här endast givits primitiva lösningar. LPS-0 är således bara en första approximation till en på valensteoretiska principer grundad parser för svenska.
Carlsson, Mats (1981).
Uppsala Chart Parser version 2 (UCP-2) System Documentation.
Centrum för datorlingvistik, Uppsala universitet.
Diderichsen, Paul (1966).
Elementær dansk Grammatik.
Köpenhamn: Gyldendal.
Schieber, Stuart M. (1986).
Introduction to Unification-Based Approaches to Grammar.
Stanford: CSLI.
Somers, H. L. (1987).
Valency and Case in Computational Linguistics.
Edinburgh: Edinburgh University Press.
Svensk Ordbok (1986).
Stockholm: Esselte studium.
Sågvall Hein, Anna (1987).
Parsing by means of Uppsala Chart Processor (UCP).
i L. Bolc (ed), Natural Language Parsing Systems.
Berlin & Heidelberg: Springer Verlag.
Sågvall Hein, Anna (1987a).
Forskningsprogram för projektet EN
LEXIKONORIENTERAD PARSER FÖR SVENSKA.
Språkdata, Göteborgs Universitet (dupl.)
Sågvall Hein, Anna (1988).
The LPS Inflectional Grammar. A listing of the rules.
Språkdata, Göteborgs Universitet (dupl.)
Sågvall Hein, Anna & Ahrenberg, Lars (1985).
A Parser for Swedish. Status Report for SVE.UCP June 1985.
Centrum för datorlingvistik, Uppsala universitet.
Thorell, Olof (1973).
Svensk grammatik.
Stockholm: Esselte studium.
Toporowska-Gronostaj, Maria (1987).
Om verben i LPS-projektets lexikon.
Språkdata, Göteborgs universitet.