Presentation is loading. Please wait.

Presentation is loading. Please wait.

संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit

Similar presentations


Presentation on theme: "संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit"— Presentation transcript:

1 संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit Girish Nath Jha Associate Professor, Computational Linguistics Special Center for Sanskrit Studies, J.N.U., New Delhi – Mukesh and Priti Chatter Distinguished Professor of History of Science, University of Massachusetts Dartmouth, USA 9/19/2018

2 १) संगणकीय भाषाविज्ञान क्या है ?
Special Centre for Sanskrit Studies, J.N.U., New Delhi १) संगणकीय भाषाविज्ञान क्या है ? मानव भाषा का संगणक द्वारा विश्लेषण और ज्ञान निरूपण 9/19/2018

3 संगणकीय भाषाविज्ञान के उपविषय
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान के उपविषय वक्तृ अभिज्ञान (Speaker Recognition) वाणी अभिज्ञान (Speech Recognition) प्राकृतिक भाषा अंतर्मुख (Natural Language Interface) प्राकृतिक भाषा विश्लेषण(Natural Language Analysis/Understanding) प्राकृतिक भाषा प्रजनन (Natural Language Generation) मशीन अनुवाद (Machine Translation) वाणी प्रजनन (Speech synthesis) 9/19/2018

4 संगणकीय भाषाविज्ञान की दो विधियां
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान की दो विधियां १) व्याकरणिक विधि (rule based approach) व्याकरण के नियम संगणकीय प्रारूप में दिये जाते हैं, संगणक इन नियमों को देख कर भाषाई डेटा को प्रोसेस करता है २) सांख्यिकीय विधि (statistical approach) पहले डेटा को देख कर उनसे उभरते हुए पैटर्न को समझता है और नियम बनाता है । इस तकनीक के एक प्रकार को मशीन लर्निंग भी कहा जाता है 9/19/2018

5 पाणिनि व्याकरण की उपयोगिता
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि व्याकरण की उपयोगिता सांख्यिकीय विधि संभवतः इसलिये महत्त्वपूर्ण होती जा रही है कि संपूर्ण रूपात्मक व्याकरण किसी भाषा में उप्लब्ध नहीं है । पाणिनि व्याकरण किसी भी भाषा का एकमात्र संपूर्ण व्याकरण, लगभग पूरी तरह से रूपात्मक है जिससे इसका पूर्ण संगणकीय रूप बनाया जा सकता है । यदि ऐसा हो सका तो संस्कृत भाषा में कही गई बात को कंप्यूटर समझ पाएगा । ऐसा अब तक किसी भी अन्य प्राकृतिक भाषा में संभव नहीं हो पाया है 9/19/2018

6 पाणिनि-सिस्टम स्वनिम-अवयव (Phonetic Component) नियम-डेटाबेस (सूत्रपाठ)
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि-सिस्टम स्वनिम-अवयव (Phonetic Component) -स्वनिम (Phonemes - १४ शिवसूत्र) -प्रत्याहार (आदिरन्त्येन सहेता) नियम-डेटाबेस (सूत्रपाठ) कोष धातुपाठ गणपाठ सूचियां प्रत्यय नियम-विशेष प्रविष्टियां 9/19/2018

7 पाणिनि-सिस्टम… अधिक रूपात्मकता ( more formal)
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि-सिस्टम… अधिक रूपात्मकता ( more formal) स्पष्ट प्रक्रिया  आसान प्रोग्रामिंग कंप्यूटर-प्रोग्राम जैसी संरचना मानक निर्देश (Variable Instantiation)  प्रत्याहार, संज्ञा सूत्र वृद्धि ( evaluation / expansion) संभवतः कंपाइलर डिज़ाइन प्राभावित हुआ हो ( PS rules and replacement procedures may have been influenced by Panini) 9/19/2018

8 संस्कृत व्याकरण कंप्यूटिंग
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत व्याकरण कंप्यूटिंग पाणिनीय व्याकरण का Finite State Automata बनाना जिसमें निम्न अवयव होंगे - ध्वनिविज्ञान मोड्यूल शिवसूत्र आंतरिक-संधि 9/19/2018

9 पाणिनि सूत्रों को हम कैसे प्रोग्राम करते हैं
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि सूत्रों को हम कैसे प्रोग्राम करते हैं 9/19/2018

10 क्या संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है ?
Special Centre for Sanskrit Studies, J.N.U., New Delhi क्या संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है ? आज हम प्रबुद्ध संगणन(intelligent computing) के युग में हैं मशीन में कृत्रिम ज्ञान-निरूपण से बड़े कार्य किये जा सकते हैं 9/19/2018

11 संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है…
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है… मशीन में प्रोग्रैमिंग भाषा के द्वारा सूचना एनकोड किया जाता है मानव भाषा की अपेक्षा प्रोग्रैमिंग भाषा ज्ञान-निरूपण में असक्षम है दैनिक व्यवहार की भाषाओं का निश्चित स्वरूप नहीं होता, जिससे कंप्यूटर से संवाद संभव नहीं संस्कृत कंप्यूटर की भाषा बन सकती है ? 9/19/2018

12 ज्ञान-निरूपण तकनीकियां
Special Centre for Sanskrit Studies, J.N.U., New Delhi ज्ञान-निरूपण तकनीकियां संस्कृत परंपरा कारक-आकांक्षा-योग्यता आधारित प्रतिरूप ( model) न्याय-वैशेषिक आधारित प्रतिरूप कृत्रिम-प्रज्ञान ( Artificial Intelligence) Conceptual Graph Formal Semantics Unification based approaches 9/19/2018

13 संगणकीय भाषाविज्ञान की दो विधियां
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान की दो विधियां १) व्याकरणिक विधि (rule based approach) व्याकरण के नियम संगणकीय प्रारूप में दिये जाते हैं, संगणक इन नियमों को देख कर भाषाई डेटा को प्रोसेस करता है २) सांख्यिकीय विधि (statistical approach) पहले डेटा को देख कर उनसे उभरते हुए पैटर्न को समझता है और नियम बनाता है । इस तकनीक के एक प्रकार को मशीन लर्निंग भी कहा जाता है 9/19/2018

14 Special Centre for Sanskrit Studies, J.N.U., New Delhi
इसके अन्य लाभ अन्य भारतीय भाषाओं के लिये संगणकीय संसाधन संस्कृत मॉडल पर बनाये जा सकते हैं यदि व्याकरण के साथ नव्यन्याय आधारित तर्क को भी कंप्यूट किया जाय तो संस्कृत मशीन में ज्ञान-निरूपण का माध्यम बन जायेगी 9/19/2018

15 संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है इनपुट-आउटपुट सॉफ़्टवेयर ज्ञान-परंपरा की पुस्तकों का डिजिटाइजेशन ( electronic storage, access and preservation of texts) कोष-निर्माण, सर्च-इंजिन, अनुक्रमणियां आदि हस्तलेखों के कंप्यूटरीकरण ( Optical Character Recognition) शास्त्रों की टीकाएं ( Text Interpretation) कंप्यूटरीकृत संस्कृत शिक्षण और मल्टीमीडिया 9/19/2018

16 संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है…
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है… संस्कृत-भारतीय भाषा मशीनी अनुवाद संस्कृत-विश्लेषक (Sanskrit Parser) भारतीय-भाषा प्रजनक ( Indian language generator) संस्कृत-अन्यभाषा संगणकीय कोष निर्माण (Sanskrit-Other language dictionary) 9/19/2018

17 जे. एन. यू. संस्कृत विभाग का प्रयास
Special Centre for Sanskrit Studies, J.N.U., New Delhi जे. एन. यू. संस्कृत विभाग का प्रयास 9/19/2018

18 Computational Linguistics R&D at JNU
Projects Consultancies Collaborations Research students 9/19/2018

19 जे. एन. यू. संस्कृत विभाग का प्रयास
Special Centre for Sanskrit Studies, J.N.U., New Delhi जे. एन. यू. संस्कृत विभाग का प्रयास पोषित परियोजनाएं (Funded projects) 9/19/2018

20 Sanskrit Hindi Machine Translation (SHMT)
Members University of Hyderabad JNU IIIT Hyderabad Tirupati Vidyapeeth Sanskrit Academy Hyderabad Poornaprajna Vidyapeth Bangalore Rajasthan Sanskrit University, Jaipur IIT Bombay BHU Phase1 (2008 – 2012) Phase2 ( ) 9/19/2018

21 भारतीय भाषा कॉर्पोरा उपक्रम Indian Languages Corpora Initiative (ILCI)
9/19/2018

22 Funded by TDIL program of Ministry of C & IT
Phase1 ( )  3 crores Phase2 ( )  9.33 crores ILCI consortium Server based Corpora management Corpora tools 9/19/2018

23 Shallow parser for Indian Languages - Maithili
11 languages and partners with University of Hyderabad as leader Approx 5 crores 3 years ( ) SP Tools Consortium 9/19/2018 9/19/2018

24 Consultancies 9/19/2018

25 Microsoft USA Consultancy for Machine Translation
Center for Indic Studies, University of Massachusetts Dartmouth for S&T in Sanskrit LDC, University of Pennsylvania Microsoft Corp for Handwriting Recognition for Devanagari Microsoft Research for Indic languages tagset and annotation CDAC for localization for software 9/19/2018

26 Collaborations Signed - In process
MoU with University of Wurzburg, Germany for Sanskrit, Hindi, Linguistics, Computational Linguistics AoC with MIEF for Sharada Script In process University of Massachusetts, Dartmouth (Center of Indic Studies) Yogyakarta State University, Indonesia 3RFoudation, Massachusetts, USA 9/19/2018

27 Unfunded activities 9/19/2018

28 JNU Text Encoding & Search for Sanskrit संस्कृत वाङ्मय खोज
J-TESS : JNU Text Encoding & Search for Sanskrit संस्कृत वाङ्मय खोज 9/19/2018

29 Initiatives for Science & Technology in Sanskrit
Special Centre for Sanskrit Studies, J.N.U., New Delhi SATIAIT Initiatives for Science & Technology in Sanskrit 9/19/2018

30 Special Centre for Sanskrit Studies, J.N.U., New Delhi
What is SATIAIT ? Acronym for “Science And technology In Ancient Indian Text” The joint initiative started with the initiative of Prof Bal Ram Singh, Director, Center for Indic Studies, University of Massachusetts. Special Center for Sanskrit Studies, JNU joined the initiative in 2009 C- SATIAIT  Consortium for …. 9/19/2018

31 Mukesh & Priti Chatter endowment
Special Centre for Sanskrit Studies, J.N.U., New Delhi Mukesh & Priti Chatter endowment To Center for Indic Studies, U Mass Dartmouth for provable scientific concepts in Ancient Indian Texts 9/19/2018

32 Summary of activities We have done seminars/workshops
Formed expert groups surveys of S&T resources Collected important texts Digitized them enabled searches Translated some of them Started lab researches at U Mass D 9/19/2018

33 Seminar proceedings Editors: Bal Ram Singh Girish Nath Jha Umesh Kumar Singh Diwakar Mishra 9/19/2018

34 Identifying S&T texts Potential collections – Jaipur NMM SSU – Banaras
Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying S&T texts Potential collections – Jaipur NMM SSU – Banaras others 9/19/2018

35 Identifying texts rasa-sanketa-kalika ch1 - mercury (पारा)
Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying texts rasa-sanketa-kalika ch1 - mercury (पारा) ch2 - copper (तांबा) , iron, brass (पीतल), Mica (अभ्रक) ch3 - sulphur (गन्धक) and other poisonous substances ch4- medicinal use of some of the chemicals ch5 - making tablets from powder and rasa, their usage for different ailments 9/19/2018

36 Special Centre for Sanskrit Studies, J.N.U., New Delhi
Identifying texts… rasaayana-saara – 20th c text on metallurgy from Varanasi by Acarya Shyam Sundar Vaishya, a practicing vaidya himself Has three sections – Definitions (paribhasha prakarana) Mercury (paarad prakarana) Dhatushodhana-maarana-prakarana) He has translated the text himself and in doing so has consulted many other vaidyas of Varanasi 9/19/2018

37 Special Centre for Sanskrit Studies, J.N.U., New Delhi
Translating Texts We have translated the following texts in the area metallurgy rasayana-saara rasasanketa-kalikaa 9/19/2018

38 Special Centre for Sanskrit Studies, J.N.U., New Delhi
Lab experiments … A meeting was organized on July12, 2011 at U.Mass D Dept of Chemistry. They have shown a great interest in the activity The experiments on some metals have started in the chemistry labs of University of Massachusetts Dartmouth The findings are expected to come out as publications 9/19/2018

39 Broadbasing the activity
Special Centre for Sanskrit Studies, J.N.U., New Delhi Broadbasing the activity Courses are being developed at JNU’s Sanskrit center (to be run jointly with CIS, U Mass D) MoU between the two centers is being finalized A larger consortium of universities, institutes, individuals is being developed  C-SATIAIT Vedanta congress (Dec 28-31). 9/19/2018

40 Work done by research students
As part of M.Phil and Ph.D research by my students, a large number of tools have been developed mainly for Sanskrit Their tools and dissertations are online on our sever 9/19/2018

41 Publications Springer Cambridge Scholar Lambert DK Printworld
Recent books 9/19/2018

42 Developmental platforms
Online system Front end  Java, JSP, HTML, JS Backend  MS SQL Server 2005, data files Stored procedures, security features Connectivity  MS-JDBC driver Hosting  Tomcat/Apache webserver 9/19/2018

43 Some advertisements WILD:RE
Workshop on Indian Languages Data Resource and Evaluation Springer’s LRE Journal (Language Resource Evaluation) 9/19/2018

44 Special Centre for Sanskrit Studies, J.N.U., New Delhi
समस्याएं और संभावनाएं 9/19/2018

45 विद्वानों द्वारा परिवर्तन को न स्वीकार करना पाठ्यक्रम में कम सुधार
Special Centre for Sanskrit Studies, J.N.U., New Delhi विद्वानों द्वारा परिवर्तन को न स्वीकार करना पाठ्यक्रम में कम सुधार अनुदान की समस्या मौलिक तकनीकी सुविधाओं में कमी नौकरियों की कमी टीम में कार्य न करना 9/19/2018

46 Special Centre for Sanskrit Studies, J.N.U., New Delhi
निदान और नई संभावनाएं पाठ्यक्रम में सुधार  प्रायोगिक संस्कृत के अंतर्गत परिवर्तन लाएं भाषाविज्ञान और संगणक को आवश्यक पत्र बनाएं अनुदान की कमी हो तो कंप्यूटर विभाग से सहयोग लें 9/19/2018

47 Special Centre for Sanskrit Studies, J.N.U., New Delhi
निदान और नई संभावनाएं … संस्कृत के लिये निजी संस्थाओं / व्यक्तियों से दान लिये जा सकते हैं कंप्यूटर बेहद सस्ते हो रहे हैं छात्रों को संस्कृत और अपनी मातृभाषा में typing करायें HTML और मल्टीमीडिया की ट्रेनिंग दें संस्कृत के ग्रंथ ऑनलाइन करवायें 9/19/2018

48 Special Centre for Sanskrit Studies, J.N.U., New Delhi
निदान और नई संभावनाएं…. संस्कृत को आधार बनकर अपनी मातृभाषा के छोटे उपकरण बनाएं – spell checker, dictionary मोबाइल और सॉफ़्ट्वेयर कंपनियां इनको खरीदने में रुचि लेंगीं संस्कृत एनीमेशन का विशाल क्षेत्र है – इसमें छात्रों को प्रशिक्षण दें पौराणिक मल्टीमिडिया प्रकाशन और एनीमेशन फ़िल्मों में करियर बनाएं 9/19/2018

49 Demo http://sanskrit.jnu.ac.in localhost
Special Centre for Sanskrit Studies, J.N.U., New Delhi Demo localhost 9/19/2018

50 Thank you girishjha@gmail.com
Special Centre for Sanskrit Studies, J.N.U., New Delhi Thank you 9/19/2018


Download ppt "संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit"

Similar presentations


Ads by Google