Presentation is loading. Please wait.

Presentation is loading. Please wait.

2009 Pag. 1 PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu

Similar presentations


Presentation on theme: "2009 Pag. 1 PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu"— Presentation transcript:

1 2009 Pag. 1 PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu sdiaconescu@softwin.ro sdiaconescu@softwin.ro

2 2009 Pag. 2 Agenda 1.Parteneri 2.Obiectivele proiectului 3.Principiul de bază 4.Elemente privind limbajul de descriere 4.1 – Nivele de descriere 4.2 – Secţiuni de descriere 5.Arhitectura generală a sistemului 6.Câteva noţiuni de bază ale limbajului de descriere 6.1 – Arbori de dependenţe (DT) 6.2 – Arbori atribut – valoare (AVT) 6.3 – Gramatici de dependenţe şi generative (GDG)

3 2009 Pag. 3 Parteneri 1.SOFTWIN – Departamentul Cercetare-Dezvoltare 2.Universitatea “Politehnica” Bucureşti, Facultatea de Electronică, Telecomunicaţii şi Tehnologia Informaţiei (Prof. Univ. Dr. Ing. Corneliu Burileanu) 3.Universitatea “Politehnica” Bucureşti, Facultatea de Automatică şi Calculatoare (Prof. Univ. Dr. Ing. Nicolae Ţăpuş) 4.Institutul de Lingvistică „Iorgu Iordan – Al. Rosetti” (Dr. Ana Maria Barbu) 5.Universitatea Bucureşti (Conf. Dr. Emil Ionescu) 6.Institutul de Matematică “Simion Stoilow” al Academiei Române (Mb. Coresp. al Academiei Gheorghe Paun)

4 2009 Pag. 4 Obiective 1.Standarde 2.Instrumente 3.Resurse 4.Aplicaţii

5 2009 Pag. 5 Secvenţiere operaţii 1.Standarde 2.Instrumente 3.Resurse (monolingve) 4.Aplicaţii PALIROM

6 2009 Pag. 6 Principiul de bază Principiu: crearea unui limbaj (metalimbaj) care să permită: a)Descrierea cunoştinţelor lingvistice privind o limbă naturală b)Descrierea corespondenţelor lingvistice între două limbi naturale GRAALAN (Grammar Abstract Language)

7 2009 Pag. 7 Sunet 1. Nivelul sunet 2. Nivelul alfabet fonetic Semn alfabet normal 3. Nivelul alfabet normal Nivelul alfabet GRAALAN Nivele conven ţ ionale Secţiuni GRAALAN Alphabet Nivele GRAALAN Cuno ş tin ţ e mono- lingve Nivele GRAALAN (a) Semn fonetic

8 2009 Pag. 8 Morfem 4. Nivelul morfem 5. Nivelul flexiune sintetică Structură A/S 6. Nivelul flexiune sintetică / analitică Nivelul morfologic GRAALAN Nivele conven ţ ionale Secţiuni GRAALAN Nivele GRAALAN Cuno ş tin ţ e mono- lingve Nivele GRAALAN (b) Cuvânt - Syllabification - Morphological configurator - Inflection rules - Inflection forms - Lexicon

9 2009 Pag. 9 Propozi ţ ie 7. Nivelul propozi ţ ie 8. Nivelul frază Text 9. Nivelul text Nivelul sintaxă GRAALAN Nivele conven ţ ionale Secţiuni GRAALAN Nivele GRAALAN Cuno ş tin ţ e mono- lingve Nivele GRAALAN (c) Frază - Syntax

10 2009 Pag. 10 Dic ţ ionare bilingve 10. Nivelul bilingv Nivelul GRAALAN bilingv Nivele conven ţ ionale Secţiuni GRAALAN Nivele GRAALAN Cuno ş tin ţ e bilingve Nivele GRAALAN (d) - Bilingual - Messages - Macros Facilităţi specifice compilării

11 2009 Pag. 11 Secţiunile GRAALAN A) Cunoştinţe monolingve –1. Alfabet –2. Silabificare –3. Morfologie –4. Lexicon –5. Reguli de flexiune –6. Forme de flexiune –7. Sintaxă B) Corespondenţe bilingve C) Facilităţi specifice compilării Mesaje Macrouri

12 2009 Pag. 12 4. Aplicaţii Morphological analyser, Grammar checker, Inflection, Indexing/Searching, Lemmatiser, Speller, Hyphenating, Lexicon, Lexical dictionary, Human assisted machine translation, Computer assisted machine translation, Automatic machine translation, etc. Compilator GRAALAN, LKT – Creare lexicon, MKT – Creare forme flexionate, Creare coresp. bilingve MONO: Alphabet LKB, Syllabification LKB, Morphology LKB, Inflection rules LKB, Inflection forms LKB, Lexicon LKB, Syntax LKB, BI: Lexical corresp. LKB, Morphological corresp. LKB, Syntactic corresp. LKB Alphabet DTD, Syllabification DTD, Morphology DTD, Inflection rules DTD, Inflection forms DTD, Lexicon DTD, Syntax DTD, Lexical corresp. DTD, Morph. corresp. DTD, Syntactic corresp. DTD 3. Baze de cunoştinţe lingvistice LKB (XML) 2. Instrumente lingvistice GDG - Generative Dependency Grammar, DT - Dependency Tree, AVT - Attribute Value Tree 0. Baze teoretice 1. GRAALAN - Grammar Abstract Language Secţiuni: Alfabet, Silabificare, Morfologie, Reguli de flexiune, Forme de flexiune, Lexicon, Sintaxă, Corespondenţe bilingve, Mesaje ; Macrouri Arhitectura generală

13 2009 Pag. 13 Arbori de dependenţe (DT) “Maestrul” “disciplolul” “vin” @r1@ 1 2 1 2 “văd ” Maestrul şi discipolul vin şi văd că ciobanii şi străinii râd şi dănţuie. “şi” @r4@ @r2@ “şi” @r2@ a @r5@ “că ”

14 2009 Pag. 14 “ciobanii” “străinii ” “râd ” @r1@ 1 2 1 2 “dănţuie” “şi ” @r4@ @r2@ “şi ” @r2@ a @r6@ Arbori de dependenţe (DT)

15 2009 Pag. 15 clasa substantiv tip propriu comun masculin feminin neutru singular plural nearticulat nehoărât hotărât nominativ genitiv dativ acuzativ vocativ gen număr articulare caz articol pronume adjectiv numeral adverb prepoziţie conjuncţie interjecţie verb... Arbori de atribut-valoare (AVT)

16 2009 Pag. 16 Gramatici de dependenţe şi generative (GDG) Definiţie (informală) a GDG: Gramatici care printr-un proces generativ permit transformarea unui text (frază) sursă într-un arbore de dependenţe (DT). Frază sursă (formă de suprafaţă) Analiză Arbore de dependenţe (formă de adâncime) Gramatică de dependenţe şi generativă Generare

17 2009 Pag. 17 a) Descriere Sintaxă : Cum anume părţile de vorbire sunt combinate pentru a forma fraze. b) Descriere Dependenţe : Care sunt relaţiile între părţile de vorbire ale unei fraze : relaţii de coordonare şi relaţii de regenţă/subordonare. c) Descriere Acord : Potrivirea între părţile de vorbire ale unei fraze din punct de vedere al categoriilor şi valorilor de categorii (gen, număr, caz, etc.) d) Descriere Erori: Frazele prost construite trebuie identificate şi semnalate ca eronate. e) Reversibilitate: Utilizarea aceleiaşi gramatici pentru descrierea transformărilor de la structura de suprafaţă la structura de adâncime şi invers. Proprietăţi implementare GDG

18 2009 Pag. 18 Implementare GRAALAN GRAALAN Link XML LKB Linguist Macro GRAALAN Macro processor GRAALAN text GRAALAN compiler Infl. Forms Tool (MKT) Lexicon Tool (LKT)

19 2009 Pag. 19 Q&A


Download ppt "2009 Pag. 1 PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu"

Similar presentations


Ads by Google