Presentation is loading. Please wait.

Presentation is loading. Please wait.

القــارئ الآلــي للـــغة الــــــــعربية

Similar presentations


Presentation on theme: "القــارئ الآلــي للـــغة الــــــــعربية"— Presentation transcript:

1 القــارئ الآلــي للـــغة الــــــــعربية
جامعة الملك سعود كلية علوم الحاسب والمعلومات قسم علوم الحاسب القــارئ الآلــي للـــغة الــــــــعربية إشراف الدكتور: عبدالملك السلمان عمل الطلاب: سعود السلطان يزيد الراشد عاصم المنصور

2 محتويات البحث مقدمة. نبذة عن تاريخ القارئ الآلي .
خصائص اللغة العربية التي تعيق عملية القراءة الآلية . بعض الطرق المستخدمة في القراءة الآلية . دراسة نماذج للقارئات الآلية . المراجع .

3 مقدمة : ما هو التعرف الآلي على النصوص. فوائد التعرف الآلي على النصوص.
يقسم التعرف الآلي على النصوص إلي التعرف المباشر(Online) التعرف الغير مباشر (Offline)

4 نبذة عن تاريخ القارئ الالي:
بدأت خدمة التعرف الآلي عام 1965 م في البريد الامريكي. تقوم المكائن بقراءة الرمز البريدي وتطبع شفرة عمودية (Barcode) على الرسالة حتى تقوم الاجهزة بفرز وتوزيع الرسائل الى وجهاتها من دون تدخل الإنسان.

5 خصائص اللغة العربية التي تعيق عملية القراءة الآلية:
اتجاه الكتابة اتصال الحروف

6 تابع خصائص اللغة العربية التي تعيق عملية القراءة الآلية:
اشكال الحروف وجود علامات الضبط بالشكل

7 تابع خصائص اللغة العربية التي تعيق عملية القراءة الآلية:
التشابه الكبير بين بعض الحروف حروف متشابهة ولا تختلف عن بعضها الا في النقط

8 تابع خصائص اللغة العربية التي تعيق عملية القراءة الآلية:
حروف متشابهة في ولها نفس النقط

9 بعض الطرق المستخدمة في القراءة الآلية:
الطريقة التقليدية: الإعداد التقسيم استخراج الخصائص التصنيف ما بعد المعالجة

10 الطريقة التقليدية ( الإعداد )
التحويل إلى مصفوفة ثنائية يتم تحويل النقاط السوداء الى 1 والبيضاء الى 0 سيتم تطبيق مثال نظري لمرحلة الاعداد على حرف الراء (ر)

11 الطريقة التقليدية ( الإعداد )
التنقية من الشوائب.

12 الطريقة التقليدية ( الإعداد )
بعد التنقية من الشوائب وقبل عملية التنعيم

13 الطريقة التقليدية ( الإعداد )
بعد عملية التنعيم وقبل عملية التنحيف

14 الطريقة التقليدية ( الإعداد )
بعد عملية التنحيف

15 الطريقة التقليدية ( الإعداد )
تحديد السطر المرجعي التناغم في حجم الحروف

16 الطريقة التقليدية ( التقسيم )
تقسيم المستند الى سطور تقسيم السطور الى كلمات تقسيم الكلمات الى حروف

17 الطريقة التقليدية ( استخراج الخصائص )

18 الطريقة التقليدية ( التصنيف )
تتكون من مرحلتين: تصنيف الحرف ضمن مجموعة حروف شبيهة له مثل تصنيف ( ج ) ضمن مجموعة ( ج , ح , خ ) تصنيف الحرف بذاته من مجموعته مثل أن يتم تصنيف حرف ( ج ) وتمييزه عن باقي مجموعة ( ج , ح , خ )

19 الطريقة التقليدية ( ما بعد المعالجة )
يتم فيها بعض ما يلي: تدقيق املائي تخيير المستخدم في كلمة لم يتم التأكد من التعرف الصحيح لها

20 الطريقة باستخدام الذكاء الاصطناعي
ينقسم القارئ في هذه الطريقة إلى ثلاث أقسام رئيسة: المدرب (Trainer) الشبكة العصبية (Neural Network) القارئ الآلي (OCR)

21 مراحل القراءة الآلية باستخدام طريقة الذكاء الاصطناعي:
الإعداد التقسيم استخراج الخصائص التهيئة للتعرف توحيد حجم المصفوفات تحويل المصفوفة من مصفوفة ذات بعدين الى مصفوفة ذات بعد واحد التعرف على الحرف

22 دراسة نماذج للقارئات الآلية :
القارئ الآلي من شركة صخر الاصدار رقم 4.2 من منتجات عام 1997 م . برنامجReadiris Pro من شركة Image Recognition Integrated System (IRIS) الذي يدعم اللغة العربية في بعض اصداراته الاصدار رقم 8.0 من منتجات عام

23 مجالات الدراسة : نوع الكتابة . حالة الحروف . حجم الخط .

24 مقاييس الأداء : مقياس الأداء للكتابة المنفصلة .
مقياس الأداء للكتابة المتصلة .

25 المدخلات : الكتابة المنفصلة :
ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي للكتابة المتصلة : ” بدأت خدمة البريد الأمريكي في استعمال مكائن القارئ الآلي في عام 1965م لفرز الرسائل البريدية. حيث كانت المكائن تقوم بقراءة الرمز البريدي في الرسالة ثم يقوم الجهاز بطباعة شفرة عمودية تحتوي على نفس المعلومات والرمز البريدي على الرسالة حتى لا تكون مقروءة من قبل الانسان "

26 الدراسة : حجم الخط نوع الكتابة القارئ الآلي العربي Readiris
نسبة الكلمات كاملة الصحة شبه الصحيحة صغير منفصلة 0% - متصلة 18% 16% متوسط 38% 50% 24% 78% 22% كبير 61% 73% 29%

27 الدراسة :

28 رأي الباحث : الأفضلية . تأثيرحجم الخط . سرعة التنفيذ .
تأثير نوع الخطوط .

29 المراجع: [1] محاضرة مادة تعريب الحاسبات للدكتور عبدالملك السلمان للفصل الصيفي 1425/1426هـ يوم الإثنين 15/6/1425 هـ بموضوع التعرف الآلي على النصوص العربية. [2] موقع صخر / منتجات / القارئ الآلي ( [3] موقع Optical character recognition – Wikipedia, the free encyclopedia ( [4] محاضرة مادة تعريب الحاسبات للدكتور عبدالملك السلمان للفصل الصيفي 1425/1426هـ يوم السبت 8/5/1425 هـ بموضوع خصائص اللغة العربية. [5] B. AL-Badr and S. A. Mahmoud, “Survey and bibliography of Arabic optical text recognition”, Signal processing, Vol. 41, NO1, Jan 1995, pp [6] الفصل الخاص بدراسة الشبكة العصبية (Neural Networks) في مادة الذكاء الإصطناعي للدكتور يوسف العوهلي في الفصل الدراسي الثاني لسنة 1424 – 1425 هـ. [7] مشروع التعرف على الأرقام العربية لمادة الذكاء الإصطناعي للطالبين يزيد الراشد وسعود السطان في الفصل الدراسي الثاني لسنة 1424 – 1425 هـ تحت اشراف الدكتور يوسف العوهلي.


Download ppt "القــارئ الآلــي للـــغة الــــــــعربية"

Similar presentations


Ads by Google