القــارئ الآلــي للـــغة الــــــــعربية

Slides:



Advertisements
Similar presentations
Arabic Speech Recognition
Advertisements

نظام حاسوبي لتشكيل النص العربي(المشكل الآلي) ICS484 الحوسبة العربية صقر العريفي فريق: ابداع.
تعريب لوحة المفاتيح والشاشة
منصور البصيلي خالد الزهراني
تعريب الحاسب - حسني المحتسب
التعرف الآلي على الكلام العربي المنطوق
نظام هال سوبر نوفا خالد العبدلله أقسام نظام هال سوبر نوفا قاريء الشاشة أنظمة إخراج: الناطق عدسة التكبير لغة برايل.
تصميم موقع عربي حسن سليس علوم الحاسب والمعلومات. العناصر  المتطلبات الأساسية  الخطوات العملية لنشر موقع على الإنترانت / الإنترنت  مواقع الاستضافة (
أهمية معالجة النصوص العربية باستخدام الحاسب
محرر قواعد التحليل الصرفي المصدري تصميم و تنفيذ : يوسف بن عبد الرحمن السحيباني هاشم بن علي الشبعان.
428 عال - تعريب الحاسبات 1 بحث في مجال الترجمة الآلية إعداد: إعداد: محمد عادل المكينزي وليد هادي اليامي متابعة: د. عبدالملك السلمان.
الخط العربي و أحد طرق التصميم
التعرف على الكلام العربي
استراتيجية التعلم ويكي ستكس
[ إشراف الدكتور / عبدالملك السلمان ]
الترميز العربي و Unicode
مهارات الحاسب الآلي COMPUTER SKILLS ميسون القري. الفصل الدراسي الثاني 1431هـ الانترنت مجموعة ضخمة من شبكات الاتصالات المرتبطة ببعضها البعض، وهذه المجموعة.
فايز علي مشبب آل حسن فريق طموح مادة تعريب الحاسب الآلي
1 إصلاح انحناء وتقوس الكتابة في صور الوثاق العربية القديمة منصف الشرفي – وفاء بوصلاعة – محمد عادل العليمي وحدة البحث للآليات الذكية REsearch Group on Intelligent.
المواقع العربية مالها وماعليها ايمن السـنان حمد الحربي إشراف الدكتور : عبدالملك السلمان.
بحث وإعداد إشراف أحمد بن علي آل لجهر د.عبدالملك السلمان
مقدمة عن الكمبيوتر وتطوره
التعرف الآلي على الكلام العربي
Introduction to Software
أنظــمة الترمــيز العربيـــة
مقدمة الصخور الرسوبية EPS 221 أ.د. محمد بسوينى و أ.د. محمود عارف
اعداد : أ : عبد العزيز محمد العمري
مقارنة بين برنامجي IRIS وصخر للقراءة الآلية العربية
مجالات التعبير الكتابي :
بسم الله الرحمن الرحيم معهد الامير احمد بن سلمان للإعلام التطبيقي دورة الترجمة الصحفية من الى
التعرف الآلي على الكلام المنطوق العربي
فيزياء كيف تعمل الأشياء جامعة الملك فهد للبترول والمعادن كلية العلوم / قسم الفيزياء د. زين بن حسن يماني 19/5/1426هـ.
رأ ……… حمامـ ……….. نملـ …… تكاد تغرق في النهر .
محركات البحث العربية بواسطة: عبد الله عتيق العامر
محرك البحث الإدريسي غزوان البريكان
مكونات الكتابة العربية
بروتوكول الانترنت نظم تشغيل 1.
Data Structures & Algorithms Week1. Contents Textbook Grade Software.
 Reading Strategies اساليب في القراءة.  1. To discuss what is expected of us as parents, students and teachers.  2. To learn more about the DRA. 
What are prepositions? ما هي حروف الجر باللغة الانجليزية؟ هي حروف تأتي بعد الفعل في اللغة الانجليزية نستعملها لكي تدلنا على الأماكن والزمن. سنتعلم اليوم.
تقسيم الشبكات Subnetting
Educational Text. Abstract  The study aimed to investigate the effectiveness of educational computer games on the fifth graders' achievement in English.
مقدمة قواعد بيانات - أوراكل الفـصـل الــرابــع دوال الصف الواحد أ. جمانه الحازمي.
أهداف الدرس 1 ما هي محركات البحث ؟ Search engines
الذكاء الاصطناعي تطبيقاته Artificial Intelligence
لنفرض أن هدف التجربة هو مقارنة نوعين من الأعلاف (A و B) لتغذية أبقار حلوب خلال 3 شهور. وتم اختيار عشرين بقرة متشابهة ( في الوزن / العمر / السلالة / الموسم.
لنفرض أن هدف التجربة هو مقارنة صنفين من السماد (A و B) من حيث كمية محصول نوع معين من القمح.
التعلم الالكترونى الطريق نحو تعليم افضل
How to contact me Twitter Blog :-
10 0× 1 = 4× 4 = (وحدات)4 10 1× = 5 50 = (عشرات)5
برمجة قواعد بيانات تطبيق مفهوم الحماية في النماذج
تابع :تطبيع البيانات.
بسم الله الرحمن الرحيم ...
المخدم الرئيسي في الشبكات
أساسيات شبكات الحاسب CCN 112 TA.Dalal.
سياسات واستراتيجيات البحث
الفصل الثالث حصر و ترتيب البيانات.
Programming -2 برمجة -2 المحاضرة-1 Lecture-1.
المدرسة الانجليزية الحديثة استخدام القصة في تعليم مهارات اللغة العربية
Electronic Payment Systems أنظمة الدفع الالكتروني
صفي شعورك عند مشاهدتها ؟؟
مقدمة في البرمجة.
3. Browsing the Web تصفح الانترنت
التعرف على الخط العربي المكتوب يدوياً
Gateway (بوابة العبور أو الاتصال)
مادة مختارة (أمن المعلومات)
User ID Symbol Description Site Engineer SE Office Engineer OE N/A SF
مصادر على شبكة الانترنت
الكلية الجامعية للعلوم التطبيقية
4 أسباب وراء فشل حبك في مرحلة المراهقة. كثير من الفتيات والشابات يقعوا في الحب في مرحلة المراهقة، وهي المرحلة التي تبدأ فيها الفتاة في التعرف على الطرف.
Presentation transcript:

القــارئ الآلــي للـــغة الــــــــعربية جامعة الملك سعود كلية علوم الحاسب والمعلومات قسم علوم الحاسب القــارئ الآلــي للـــغة الــــــــعربية إشراف الدكتور: عبدالملك السلمان عمل الطلاب: سعود السلطان يزيد الراشد عاصم المنصور

محتويات البحث مقدمة. نبذة عن تاريخ القارئ الآلي . خصائص اللغة العربية التي تعيق عملية القراءة الآلية . بعض الطرق المستخدمة في القراءة الآلية . دراسة نماذج للقارئات الآلية . المراجع .

مقدمة : ما هو التعرف الآلي على النصوص. فوائد التعرف الآلي على النصوص. يقسم التعرف الآلي على النصوص إلي التعرف المباشر(Online) التعرف الغير مباشر (Offline)

نبذة عن تاريخ القارئ الالي: بدأت خدمة التعرف الآلي عام 1965 م في البريد الامريكي. تقوم المكائن بقراءة الرمز البريدي وتطبع شفرة عمودية (Barcode) على الرسالة حتى تقوم الاجهزة بفرز وتوزيع الرسائل الى وجهاتها من دون تدخل الإنسان.

خصائص اللغة العربية التي تعيق عملية القراءة الآلية: اتجاه الكتابة اتصال الحروف

تابع خصائص اللغة العربية التي تعيق عملية القراءة الآلية: اشكال الحروف وجود علامات الضبط بالشكل

تابع خصائص اللغة العربية التي تعيق عملية القراءة الآلية: التشابه الكبير بين بعض الحروف حروف متشابهة ولا تختلف عن بعضها الا في النقط

تابع خصائص اللغة العربية التي تعيق عملية القراءة الآلية: حروف متشابهة في ولها نفس النقط

بعض الطرق المستخدمة في القراءة الآلية: الطريقة التقليدية: الإعداد التقسيم استخراج الخصائص التصنيف ما بعد المعالجة

الطريقة التقليدية ( الإعداد ) التحويل إلى مصفوفة ثنائية يتم تحويل النقاط السوداء الى 1 والبيضاء الى 0 سيتم تطبيق مثال نظري لمرحلة الاعداد على حرف الراء (ر)

الطريقة التقليدية ( الإعداد ) التنقية من الشوائب.

الطريقة التقليدية ( الإعداد ) بعد التنقية من الشوائب وقبل عملية التنعيم

الطريقة التقليدية ( الإعداد ) بعد عملية التنعيم وقبل عملية التنحيف

الطريقة التقليدية ( الإعداد ) بعد عملية التنحيف

الطريقة التقليدية ( الإعداد ) تحديد السطر المرجعي التناغم في حجم الحروف

الطريقة التقليدية ( التقسيم ) تقسيم المستند الى سطور تقسيم السطور الى كلمات تقسيم الكلمات الى حروف

الطريقة التقليدية ( استخراج الخصائص )

الطريقة التقليدية ( التصنيف ) تتكون من مرحلتين: تصنيف الحرف ضمن مجموعة حروف شبيهة له مثل تصنيف ( ج ) ضمن مجموعة ( ج , ح , خ ) تصنيف الحرف بذاته من مجموعته مثل أن يتم تصنيف حرف ( ج ) وتمييزه عن باقي مجموعة ( ج , ح , خ )

الطريقة التقليدية ( ما بعد المعالجة ) يتم فيها بعض ما يلي: تدقيق املائي تخيير المستخدم في كلمة لم يتم التأكد من التعرف الصحيح لها

الطريقة باستخدام الذكاء الاصطناعي ينقسم القارئ في هذه الطريقة إلى ثلاث أقسام رئيسة: المدرب (Trainer) الشبكة العصبية (Neural Network) القارئ الآلي (OCR)

مراحل القراءة الآلية باستخدام طريقة الذكاء الاصطناعي: الإعداد التقسيم استخراج الخصائص التهيئة للتعرف توحيد حجم المصفوفات تحويل المصفوفة من مصفوفة ذات بعدين الى مصفوفة ذات بعد واحد التعرف على الحرف

دراسة نماذج للقارئات الآلية : القارئ الآلي من شركة صخر الاصدار رقم 4.2 من منتجات عام 1997 م . برنامجReadiris Pro من شركة Image Recognition Integrated System (IRIS) الذي يدعم اللغة العربية في بعض اصداراته الاصدار رقم 8.0 من منتجات عام 2002 .

مجالات الدراسة : نوع الكتابة . حالة الحروف . حجم الخط .

مقاييس الأداء : مقياس الأداء للكتابة المنفصلة . مقياس الأداء للكتابة المتصلة .

المدخلات : الكتابة المنفصلة : ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي للكتابة المتصلة : ” بدأت خدمة البريد الأمريكي في استعمال مكائن القارئ الآلي في عام 1965م لفرز الرسائل البريدية. حيث كانت المكائن تقوم بقراءة الرمز البريدي في الرسالة ثم يقوم الجهاز بطباعة شفرة عمودية تحتوي على نفس المعلومات والرمز البريدي على الرسالة حتى لا تكون مقروءة من قبل الانسان "

الدراسة : حجم الخط نوع الكتابة القارئ الآلي العربي Readiris نسبة الكلمات كاملة الصحة شبه الصحيحة صغير منفصلة 0% - متصلة 18% 16% متوسط 38% 50% 24% 78% 22% كبير 61% 73% 29%

الدراسة :

رأي الباحث : الأفضلية . تأثيرحجم الخط . سرعة التنفيذ . تأثير نوع الخطوط .

المراجع: [1] محاضرة مادة تعريب الحاسبات للدكتور عبدالملك السلمان للفصل الصيفي 1425/1426هـ يوم الإثنين 15/6/1425 هـ بموضوع التعرف الآلي على النصوص العربية. [2] موقع صخر / منتجات / القارئ الآلي (http://www.sakhr.com/sakhr_a/Products/OCR_Off.htm?Index=2&Main=Products&Sub=OCR) [3] موقع Optical character recognition – Wikipedia, the free encyclopedia (http://en.wikipedia.org/wiki/Optical_character_recognition) [4] محاضرة مادة تعريب الحاسبات للدكتور عبدالملك السلمان للفصل الصيفي 1425/1426هـ يوم السبت 8/5/1425 هـ بموضوع خصائص اللغة العربية. [5] B. AL-Badr and S. A. Mahmoud, “Survey and bibliography of Arabic optical text recognition”, Signal processing, Vol. 41, NO1, Jan 1995, pp. 49-77. [6] الفصل الخاص بدراسة الشبكة العصبية (Neural Networks) في مادة الذكاء الإصطناعي للدكتور يوسف العوهلي في الفصل الدراسي الثاني لسنة 1424 – 1425 هـ. [7] مشروع التعرف على الأرقام العربية لمادة الذكاء الإصطناعي للطالبين يزيد الراشد وسعود السطان في الفصل الدراسي الثاني لسنة 1424 – 1425 هـ تحت اشراف الدكتور يوسف العوهلي.