Post on 19-Mar-2016
description
Cours 7
Grammaires algébriquesConstituants syntaxiques
Syntaxe
Je vais fermer l'autre porte* autre fermer je l'porte vaisComment les mots se combinent-ils en phrases qui ont un
sens ?Dans quel ordre ?Quelles combinaisons sont possibles ?
Constituants syntaxiquesCertaines suites de mots dans une phrase forment des
constituantsExemple : groupes nominaux
vingt autres journauxl'Indel'offreune seconde section d'équilibristesl'un des meilleurs bâtiments à voile de la compagnie
Exemple de propriété commune à ces groupesPeuvent être suivis d'un verbe dans une phrase
Constituants syntaxiquesvingt autres journaux titrent...l'Inde est...l'offre parvient à...une seconde section d'équilibristes arrival'un des meilleurs bâtiments à voile de la compagnie peut...
ce n'est pas vrai de n'importe quelle séquence de mots* journaux titrent...* l'parvient à...* seconde d'équilibristes arrivaOn doit donc pouvoir spécifier "un groupe nominal peut être suivi d'un
verbe"
Constituants syntaxiquesExemple : groupes nominaux prépositionnels
depuis quelques moisDéplacement de ce groupe
Depuis quelques mois la situation évolueLa situation depuis quelques mois évolueLa situation évolue depuis quelques mois
ce n'est pas vrai de n'importe quelle séquence de mots* Depuis mois la situation quelques évolue* La depuis situation quelques mois évolue* La situation mois évolue depuis quelques
Grammaires algébriquesContext-free grammarsOutil de manipulation des constituants syntaxiquesRègles indiquent la combinaison et l'ordre des éléments
GN --> Det N GAdjGN --> NprGAdj --> GAdv AdjGAdv --> GAdv AdvGAdv --> Adv
Lexique Liste des mots (symboles terminaux)Liste des symboles non terminaux GN GAdj GAdv Det...
Grammaires algébriquesLes règles peuvent comporter des mots dans le membre droit
Npr --> LucDet --> unN --> bâtiment à voileAdj --> réputéAdv --> assezGN --> Det offre de GN
Membre gauche : obligatoirement un non-terminalMembre droit : séquence de symboles terminaux ou non
terminaux
DérivationRéécriture utilisant les règles
GN --> Det N GAdj (règle)--> Det N GAdv Adj (règle GAdj --> GAdv Adj )--> Det N Adv Adj (règle GAdv --> Adv )--> un N Adv Adj (règle Det --> un )--> un bâtiment à voile Adv Adj (règle N --> bâtiment à voile )--> un bâtiment à voile assez Adj (règle Adv --> assez )--> un bâtiment à voile assez réputé (règle Adj --> réputé )
On peut dériver un bâtiment à voile assez réputé de GN
Arbre de dérivationGN
DetN
GAdj
AdjGAdv
Adv
un bâtiment à voile assez réputé
AxiomeLe langage formel engendré par la grammaire est l'ensemble
des séquences de terminaux dérivables à partir de l'axiome Axiomeun des non-terminauxSi la grammaire engendre des phrases, l'axiome correspond au
symbole "phrase"Phrase grammaticalephrase engendrée par la grammaireAnalyse syntaxiqueassocier à une phrase son (ou ses) arbres de dérivation
Règles pour les phrases
P --> GN préfère GN Luc préfère cette compagnieP --> GN quitte GN Prép GN
Luc quitte Paris vers 10 hP --> GN part Prép GN
Luc part après la réunionP
GN
préfère
GN
NDet
cetteLuc compagnie
Règles pour les phrases
P --> montrez-PRO GN Montrez-moi tous les volsP --> est-ce que il y a GN Prép GN ?
Est-ce qu'il y a un dîner sur le vol 312 ?P --> GN proposent GN ?
Quels vols proposent un dîner ?Notation parenthésée(P (GN (Det Quels) (N vols)) proposent (GN (Det un) (N dîner)) ?)
Constituants non récursifsou chunks
Constituants qui ne contiennent pas un constituant de la même catégorie
Exemple (GN l'un des meilleurs bâtiments à voile de (GN la compagnie))
Un GN inclus dans un autreLe petit est un chunk, le grand non
(GN (GN l'un des meilleurs bâtiments à voile) de (GN la compagnie))
Une suite de deux chunksSi le GN est précédé d'une préposition, on l'inclut dans le chunk
Constituants non récursifsou chunks
[Parmi ces passagers] [du Mongolia], [on comptait] [divers fonctionnaires civils] et [des officiers] [de tout grade]
Une phrase est presque une séquence de chunks, surtout nominaux[on comptait] chunk verbal
[M. Fogg] [quitta] [l'hôtel], [seul], [après avoir] [recommandé] [à son domestique] [de l'attendre]
[seul] chunk adjectival
[Oui] ! [oui] ! [répétait] [machinalement] [le pauvre garçon][machinalement] chunk adverbial
Règles pour les groupes nominaux
GN --> Det N un arrêtGN --> Det Adj N une petite attenteGN --> Det GAdj N la plus longue attenteGN --> Det N GAdj un coût trop élevéGN --> Det de N beaucoup d'attenteGN --> Det N Prép GN les vols pour ToulouseGN --> Det N Rel
les vols qui arrivent à Toulouse avant midiGN --> Det N Prép GN Prép GN
les vols de la soirée pour Toulouse
Ambiguïté
La tempête n'a pas eu l'ampleur redoutée en raison de la concomitance d'une forte marée
(Le Monde 12 novembre 2007)
A paper in this week's Science purports to identify an impact crater as big as the famous "dinosaur killer" at Chicxulub, in Mexico
(The Economist 15 mai 2004)
Ambiguïté
les vols de (la soirée de lundi) pour Toulouseles réponses de Luc à (plusieurs questions de Marie)
GN
Det N
les vols de
Prép
pour
Prép
Det N GN
GN
lundi Toulousela
Npr
soirée de
Prép
GN
Ambiguïté
les vols de (la soirée de lundi) pour Toulouseles réponses de Luc à (plusieurs questions de Marie)
GN
Det N
les réponses de
Prép
à
Prép
Det N GN
GN
Marie
Luc plusieurs
Npr
questions de
Prép
GN
Npr
Ambiguïtéle livre de (la fille sur la photo) dans le sacle livre de la fille sur (la photo dans le sac)
GN
Det N
le livre de
Prép
sur
Prép
Det N GN
GN
la photo dans
Prép
GN
Det N
la fille Det N
le sac
Règles pour la coordination
GN --> GN Conj GN un arrêt et une attenteP --> P Conj P On s'arrête et on attendGAdj --> GAdj Conj GAdj tentant mais dangereux
etc.
GN --> Det N Prép GN les vols pour ToulouseGN --> Det N Prép GN Conj Prép GN
les vols pour Toulouse ou depuis Toulouse
Accord grammaticalP --> GN attend Le public attend
Le GN est obligatoirement au singulier :* Les spectateurs attend
P --> GN attendent Les spectateurs attendentLe GN est obligatoirement au pluriel :
* Le public attendent
On considère les traits du GN et de attendre comme des paramètres
On ajoute des équations aux règles
Accord grammatical
P --> GN <attendre> {GN.nombre = <attendre>.nombre ; GN.personne =
<attendre>.personne ; }Le public attendLes spectateurs attendentVous attendez
Les équations peuvent être vérifiées par unification
Têtes des constituants
Le mot le plus important de chaque constituant est appelé sa tête P
(préfère)
GN(Luc)
préfère
GN(compagnie)
N(compagnie)
Det(cette)
cetteLuc compagnie
Grammaires de dépendanceOn remplace chaque symbole non terminal par la tête
correspondante, et on supprime le noeud redondant
Arbre de dépendancepréfère
Luccompagnie
cette
préfère
Luc
préfère
compagnie
compagniecette
cetteLuc
compagnie
Grammaires de dépendanceInformations perdues- étiquettes des constituants (on compense en ajoutant
des étiquettes aux arêtes)- ordre des mots (on compense si nécessaire en
ajoutant des contraintes sur l'ordre des mots)
préfère
Luccompagnie
cette
sujet objet
déterminant
LexicalisationLorsqu'un mot a des compléments, la forme des compléments
dépend du motP --> GN <préférer> GN à GN
Luc préfère cette compagnie à la concurrenceP --> GN <quitter> GN Luc quitte ParisP --> GN <partir> Prép GN Luc part pour Toulouse
Nombre de complémentsPrépositions devant les complémentsGrammaire lexicaliséeChaque règle comporte au moins un mot du lexique (la tête en
général)Nombre de règles = nombre de mots x nombre de constructions
Grammaires non lexicaliséesOn regroupe tous les mots qui entrent dans une même
constructionOn fait une règle commune
P --> GN V GN à GN { V.N1àN2 = "+" ; }Luc préfère cette compagnie à la concurrence
P --> GN V GN { V.N1 = "+" ; }Luc quitte ParisLuc préfère cette compagnie
P --> GN V Prép GN {V.PrépN1 = "+" ; V.Prép = Prép ; }Luc part pour Toulouse
Analyse syntaxiqueParsingEntrées : une phrase étiquetée et une grammaire algébriqueSorties : le ou les arbres de dérivation de la phrase
AlgorithmesAscendantsDescendantsProgrammation dynamiqueCascade de transducteurs
TransducteursUn transducteur fini est un automate fini dont les transitions
sont étiquetées par des couples de séquences : une séquence d'entrée, une séquence de sortie
Entrée : brrr ! Sortie : pfff !Etats : 0 1 2 3 4Transitions : 0b/p1 1r/f2 2r/f3 3/2 3!/!4Etats initiaux : 0Etats finaux : 4
0 1 2 3 4b/p r/f r/f !/!
/
TransducteursLes règles d'une grammaire algébrique peuvent être
représentées par des transducteursExemple :GN --> Det N
@/@ : l'ensemble des couples a/a pour tout symbole a
Entrée : Det N V GN à GN Sortie : GN V GN à GN
0 1 2 3
@/@Det/ N/ /GN
@/@
@/@
Cascade de transducteursMode d'application d'un ensemble de transducteurs à un ensemble de
séquences S0
Entrée : S0 i = 0 ;tant que (condition)
appliquer un ou plusieurs transducteurs aux séquences de Si, obtenir Si+1
i = i+1Sortie : Si
Variantes- on a n transducteurs T1, T2... Tn et on les applique dans l'ordre- on a un transducteur et on l'applique itérativement jusqu'à ce que Si+1 = Si
Analyse syntaxique par cascade de transducteurs
Entrées : une phrase étiquetée S0 et les transducteurs des règlesi = 0 ;faire
appliquer les transducteurs aux séquences de Si, obtenir Si+1
i = i+1jusqu'à Si-1 = Si
Sortie : Si
Si Si contient l'axiome, S0 est conforme à la grammairePour construire l'arbre de dérivation, il faut marquer les relations
entre les séquences de Si et celles de Si+1