2009 Pag. 1 PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu

Slides:



Advertisements
Similar presentations
1 Inteligenta Artificiala Universitatea Politehnica Bucuresti Anul universitar Adina Magda Florea
Advertisements

Statistical NLP: Lecture 3
Lexicografie computationala Feb., 2012 Anca Dinu University of Bucharest.
The Query Compiler Varun Sud ID: 104. Agenda Parsing  Syntax analysis and Parse Trees.  Grammar for a simple subset of SQL  Base Syntactic Categories.
SoSBlog Novac Lucian Doncilă Sergiu Rusu Andrei Rusu Alexandru Ţuţurman Andreea Tofan Radu Grupa 1B - subgrupa 3:
Consortiul national pentru biogeochimia microelementelor Organizarea spatiala a proiectelor PN2 Prioritati nov-dec 2007.
În general exist ă 2 forme mari de conservare : “in situ” şi “ex situ” 1. Conservarea “ in situ” Aceast ă metod ă de conservare const ă în.
2009 Pag Pag. 2 Agenda 1.Obiectivul proiectului 2.Parteneri 3.Autentificare versus identificare 4.Schema generala 5.Probleme de rezolvat / rezolvate.
Date spatiale. Continut - GIS notiuni Definitie Data si informatie Baze de date relationale (RDBMS) Baze de date spatiale (geo-spatial databases) - Modele.
Training utilizare portal UBB Profesori Trainer: Anna-Maria Grecu Cluj-Napoca, iunie 2011.
Polderland Language & Speech Technology B.V.. Our vision To be an independent company at the forefront of international language technology, where our.
Chapter 1 Introduction Dr. Frank Lee. 1.1 Why Study Compiler? To write more efficient code in a high-level language To provide solid foundation in parsing.
Difficulty in translating the term DISBURSEMENT Avram(Sabau) Cristina MAII Submitted in partial fulfilment of the requirements of the course in Terminology.
1 Inteligenta Artificiala Universitatea Politehnica Bucuresti Anul universitar Adina Magda Florea
Can Controlled Language Rules increase the value of MT? Fred Hollowood & Johann Rotourier Symantec Dublin.
Natural Language Processing Guangyan Song. What is NLP  Natural Language processing (NLP) is a field of computer science and linguistics concerned with.
1/31 5/6/2014 BAZELE PROGRMARII PE OBIECTE PROIECTE IN VISUAL BASIC Conf univ dr Botezatu Cezar INFORMATICĂ MANAGERIALĂ Anul I. STUDII DE LICENŢĂ.
Introducing MorphoLogic to LIRICS Gábor Prószéky MorphoLogic Pázmány Péter Catholic University Faculty.
1 Dezvoltarea regională în Republica Moldova: Realizări i perspective Realizări i lecii învăate în urma asistenei oferite de Proiectul MDRD Martin Rimmer,
Page 1 Proiect LINCOR – Introducere Dr. Ing. Stefan * SOFTWIN.
Approaches to Machine Translation CSC 5930 Machine Translation Fall 2012 Dr. Tom Way.
Interdisciplinary Workshop, Kobe University, October 30, 2008 Designing an Interactive System for the Grammatical Analysis of Written Romanian Objectives,
Auckland 2012Kilgarriff: NLP and Corpus Processing1 The contribution of NLP: corpus processing.
Universitatea Politehnica Bucureşti - Facultatea de Automatică şi Calculatoare TOWARDS A SECURE DATA SHARING PEER-TO-PEER NETWORK BASED ON GEOMETRIC AND.
Tehnologia GPS Dr. Florian Bodescu Universitatea din Bucureşti CESEC.
1 LIN 1310B Introduction to Linguistics Prof: Nikolay Slavkov TA: Qinghua Tang CLASS 11, Feb 9, 2007.
Universitatea Politehnica Bucureşti - Facultatea de Automatică şi Calculatoare Towards a Peer-to-Peer Recommender System Based on Collaborative Filtering.
-Modelul Entitate-Legatura (ER)-
Approaches to Machine Translation
Language Translation Compilation vs. interpretation.
Descrierea limbii române în GRAALAN
Februarie 2018 ASE Bucuresti
Cazurile Substantivului
Funcţii Excel definite de utilizator (FDU) în VBA
Instrumente CASE Curs nr. 7.
Candidat: Mihai RUSOAIE
Seminar 1 Design of Informatics Systems
Dezvoltarea dimensiunii europene a școlii prin creșterea competențelor cadrelor didactice ERASMUS+, KA 1.
Absolvent Ioana MENGHERIȘ
Arhitectura serviciilor web
Paxos Made Simple Autor: Puşcaş Radu George
VOLUMUL ACTIVITĂŢII DE CERCETARE FINANŢATĂ ÎN ANUL UNIV.2008/2009
Gestionarea datelor stiintifice
Retele de calculatoare
Entersoft Cybersecurity & GDPR
LINCOR – Tratare corespondenţe
Software product management
CONVERSII INTRE SISTEME DE NUMERATIE
Traversarea grafurilor. Aplicaţii
Tagging and Statistically Translating Latin Sentences
LINCOR – Descrierea informaţiilor lingvistice
“Teachers' initial training - Recruitment and evaluation"Group:173
Conferința Națională de Risk Management
Aplicatii Practice ale Microcontrolelor
Algoritm de crawling optimizat pe similaritate în documente HTML
Ethernet.
Medii informatice utilizate pentru proiectare
Sistem de monitorizare şi control prin Internet cu procesor ARM
Inteligenta Artificiala
Sistemul de prognoză atmosferică RapidRefresh - WRF
Managementul Proiectelor Informatice
Profilul absolventului
Realizarea prezentarilor cu Microsoft PowerPoint
CMMI- Arii de proces: Inginerie si managementului proiectelor
Sistemul de control intern managerial
Harti de imagini, Cadre, Stiluri
Utilizarea tehnologiei prin metoda proiectelor
Titlul proiectului descris in continuare
Approaches to Machine Translation
Levels of Linguistic Analysis
Presentation transcript:

2009 Pag. 1 PALIROM- Pachet de aplicaţii lingvistice pentru limba română Ştefan Diaconescu

2009 Pag. 2 Agenda 1.Parteneri 2.Obiectivele proiectului 3.Principiul de bază 4.Elemente privind limbajul de descriere 4.1 – Nivele de descriere 4.2 – Secţiuni de descriere 5.Arhitectura generală a sistemului 6.Câteva noţiuni de bază ale limbajului de descriere 6.1 – Arbori de dependenţe (DT) 6.2 – Arbori atribut – valoare (AVT) 6.3 – Gramatici de dependenţe şi generative (GDG)

2009 Pag. 3 Parteneri 1.SOFTWIN – Departamentul Cercetare-Dezvoltare 2.Universitatea “Politehnica” Bucureşti, Facultatea de Electronică, Telecomunicaţii şi Tehnologia Informaţiei (Prof. Univ. Dr. Ing. Corneliu Burileanu) 3.Universitatea “Politehnica” Bucureşti, Facultatea de Automatică şi Calculatoare (Prof. Univ. Dr. Ing. Nicolae Ţăpuş) 4.Institutul de Lingvistică „Iorgu Iordan – Al. Rosetti” (Dr. Ana Maria Barbu) 5.Universitatea Bucureşti (Conf. Dr. Emil Ionescu) 6.Institutul de Matematică “Simion Stoilow” al Academiei Române (Mb. Coresp. al Academiei Gheorghe Paun)

2009 Pag. 4 Obiective 1.Standarde 2.Instrumente 3.Resurse 4.Aplicaţii

2009 Pag. 5 Secvenţiere operaţii 1.Standarde 2.Instrumente 3.Resurse (monolingve) 4.Aplicaţii PALIROM

2009 Pag. 6 Principiul de bază Principiu: crearea unui limbaj (metalimbaj) care să permită: a)Descrierea cunoştinţelor lingvistice privind o limbă naturală b)Descrierea corespondenţelor lingvistice între două limbi naturale GRAALAN (Grammar Abstract Language)

2009 Pag. 7 Sunet 1. Nivelul sunet 2. Nivelul alfabet fonetic Semn alfabet normal 3. Nivelul alfabet normal Nivelul alfabet GRAALAN Nivele conven ţ ionale Secţiuni GRAALAN Alphabet Nivele GRAALAN Cuno ş tin ţ e mono- lingve Nivele GRAALAN (a) Semn fonetic

2009 Pag. 8 Morfem 4. Nivelul morfem 5. Nivelul flexiune sintetică Structură A/S 6. Nivelul flexiune sintetică / analitică Nivelul morfologic GRAALAN Nivele conven ţ ionale Secţiuni GRAALAN Nivele GRAALAN Cuno ş tin ţ e mono- lingve Nivele GRAALAN (b) Cuvânt - Syllabification - Morphological configurator - Inflection rules - Inflection forms - Lexicon

2009 Pag. 9 Propozi ţ ie 7. Nivelul propozi ţ ie 8. Nivelul frază Text 9. Nivelul text Nivelul sintaxă GRAALAN Nivele conven ţ ionale Secţiuni GRAALAN Nivele GRAALAN Cuno ş tin ţ e mono- lingve Nivele GRAALAN (c) Frază - Syntax

2009 Pag. 10 Dic ţ ionare bilingve 10. Nivelul bilingv Nivelul GRAALAN bilingv Nivele conven ţ ionale Secţiuni GRAALAN Nivele GRAALAN Cuno ş tin ţ e bilingve Nivele GRAALAN (d) - Bilingual - Messages - Macros Facilităţi specifice compilării

2009 Pag. 11 Secţiunile GRAALAN A) Cunoştinţe monolingve –1. Alfabet –2. Silabificare –3. Morfologie –4. Lexicon –5. Reguli de flexiune –6. Forme de flexiune –7. Sintaxă B) Corespondenţe bilingve C) Facilităţi specifice compilării Mesaje Macrouri

2009 Pag Aplicaţii Morphological analyser, Grammar checker, Inflection, Indexing/Searching, Lemmatiser, Speller, Hyphenating, Lexicon, Lexical dictionary, Human assisted machine translation, Computer assisted machine translation, Automatic machine translation, etc. Compilator GRAALAN, LKT – Creare lexicon, MKT – Creare forme flexionate, Creare coresp. bilingve MONO: Alphabet LKB, Syllabification LKB, Morphology LKB, Inflection rules LKB, Inflection forms LKB, Lexicon LKB, Syntax LKB, BI: Lexical corresp. LKB, Morphological corresp. LKB, Syntactic corresp. LKB Alphabet DTD, Syllabification DTD, Morphology DTD, Inflection rules DTD, Inflection forms DTD, Lexicon DTD, Syntax DTD, Lexical corresp. DTD, Morph. corresp. DTD, Syntactic corresp. DTD 3. Baze de cunoştinţe lingvistice LKB (XML) 2. Instrumente lingvistice GDG - Generative Dependency Grammar, DT - Dependency Tree, AVT - Attribute Value Tree 0. Baze teoretice 1. GRAALAN - Grammar Abstract Language Secţiuni: Alfabet, Silabificare, Morfologie, Reguli de flexiune, Forme de flexiune, Lexicon, Sintaxă, Corespondenţe bilingve, Mesaje ; Macrouri Arhitectura generală

2009 Pag. 13 Arbori de dependenţe (DT) “Maestrul” “disciplolul” “vin” “văd ” Maestrul şi discipolul vin şi văd că ciobanii şi străinii râd şi dănţuie. “şi” “şi” a “că ”

2009 Pag. 14 “ciobanii” “străinii ” “râd ” “dănţuie” “şi ” “şi ” a Arbori de dependenţe (DT)

2009 Pag. 15 clasa substantiv tip propriu comun masculin feminin neutru singular plural nearticulat nehoărât hotărât nominativ genitiv dativ acuzativ vocativ gen număr articulare caz articol pronume adjectiv numeral adverb prepoziţie conjuncţie interjecţie verb... Arbori de atribut-valoare (AVT)

2009 Pag. 16 Gramatici de dependenţe şi generative (GDG) Definiţie (informală) a GDG: Gramatici care printr-un proces generativ permit transformarea unui text (frază) sursă într-un arbore de dependenţe (DT). Frază sursă (formă de suprafaţă) Analiză Arbore de dependenţe (formă de adâncime) Gramatică de dependenţe şi generativă Generare

2009 Pag. 17 a) Descriere Sintaxă : Cum anume părţile de vorbire sunt combinate pentru a forma fraze. b) Descriere Dependenţe : Care sunt relaţiile între părţile de vorbire ale unei fraze : relaţii de coordonare şi relaţii de regenţă/subordonare. c) Descriere Acord : Potrivirea între părţile de vorbire ale unei fraze din punct de vedere al categoriilor şi valorilor de categorii (gen, număr, caz, etc.) d) Descriere Erori: Frazele prost construite trebuie identificate şi semnalate ca eronate. e) Reversibilitate: Utilizarea aceleiaşi gramatici pentru descrierea transformărilor de la structura de suprafaţă la structura de adâncime şi invers. Proprietăţi implementare GDG

2009 Pag. 18 Implementare GRAALAN GRAALAN Link XML LKB Linguist Macro GRAALAN Macro processor GRAALAN text GRAALAN compiler Infl. Forms Tool (MKT) Lexicon Tool (LKT)

2009 Pag. 19 Q&A