Presentation is loading. Please wait.

Presentation is loading. Please wait.

خالــد علـــي الشهري. عبدالله محمد السبيعي.

Similar presentations


Presentation on theme: "خالــد علـــي الشهري. عبدالله محمد السبيعي."— Presentation transcript:

1 خالــد علـــي الشهري. عبدالله محمد السبيعي.
عنوان البحث: الناطق الآلي مقدما البحث: خالــد علـــي الشهري عبدالله محمد السبيعي.

2 الموضوعات مقدمه. صعوبة اللغة العربية من ناحية النطق.
تطبيقات الناطق الآلي. تركيب الأصوات وتحليلها. قواعد النطق. نماذج توليد الكلام. المشكل الآلي. أمثله على بعض التطبيقات التي تستخدم الناطق الآلي ومميزاتها. تجربة مدينة الملك عبدالعزير. الخاتمة.

3 المقدمه تعريف الناطق الالي. نظره عامه عن الناطق الالي.
الناطق الآلي هو عبارة عن محرك يقوم بتحويل أي نص مكتوب إلى نص منطوق . نظره عامه عن الناطق الالي. كيف تظهر أهمية الناطق الآلي في إنجاز الأعمال؟ كيف نستفيد من الناطق الآلي في توفير الوقت والمال؟ ما الذي يميز الناطق الآلي للنصوص العربية عن غيره من النواطق الأخرى؟ 1-صعوبة اللغة العربية من ناحية النطق. 2-ضرورة تشكيل النصوص قبل نطقها. 3-صعوبة تحليل النصوص العربية

4 1. يوجد الى جانب القواميس الالكترونية.
تطبيقات الناطق الآلي: نظام التعليم. 1. يوجد الى جانب القواميس الالكترونية. 2. يساعد على التعرف على النطق الصحيح للكلمات بعد ترجمتها. مساعدة المعاقين للتغلب على ظروف إعاقتهم. 1.يساعد النا طق الالي في قراءة الكلام بعد كتابته على لوحة مفاتيح خاصة للمعا قين. 2. التعرف على الكلام من قبل المكفوفين عن طريق سماع المكتوب بدلا من قراءته. الاتصالات والخدمات العامة. 1.خدمة العملاء الفورية عن طريق خدمة الرد الالي. يكون الناطق الآلي وسيطا بين قاعدة البيانات والعميل 2.تحويل المحاضرات والموسوعات العلمية إلى نصوص منطوقة. الترفيه. 1.الالعاب والأجهزة الالكترونية الناطقة.

5 تركيب الاصوات وتحليلها
كيف تتكون الأصوات بشكل عام: ينتج الصوت نتيجة حدوث تموجات في الهواء ولا ينقل إلا خلال وسط مادي سواء كان هواء أو مادة صلبه. والأصوات الكلامية تنتج في جهاز الصوت في الإنسان من خلال الهواء الخارج من الرئتين . فالرئتان تعملان كمنفاخ للهواء الذي عند الصوت. ويتعرض الهواء لتضييق وتعديل في مساره فتنتج أصوات الحروف المختلفة. تركيب الأصوات وتحليلها: تقسم الدراسات الأصوات إلى قطع صوتية مكونة من أنواع مختلفة ولكل منها طول مختلف يتراوح بين الحديثة حدود معينة. ويتم الرجوع إلى قاموس يحتوي على ترجمة معاني القطع اللفظية. إلا أن المشكلة الرئيسة تكمن في المراحل الانتقالية بين القطع الصوتية المتتالية. أما تمييز الأصوات فيحتاج إلى تحليل للإشارة الصوتية ومعالجة كل حيز من الترددات على حدة لمعرفة الخواص الدقيقة لكل مكون من مكونات الصوت وتعتبر عملية تقسيم الصوت إلى قطع متتالية من أصعب هذه المهام نظرا لاختلاف عدة عوامل من شخص الى اخر.وكذلك التمييز.

6 نماذج توليد الكلام الأول: الثاني:
توليد الكلام آليا دون اللجوء إلى أصوات بشرية (تخليق الكلام)ومن هذا الصنف: تشبيه مخارج الأصوات أو محاكاة الجهاز الصوت. الثاني: تسلسل الكلام آليا بالاعتماد على أصوات طبيعية سبق تخزينها وإضافتها إلى النظام ويستخدم هذا النوع وحدات مختلفة الطول من الأصوات اللغوية التي سبق تسجيلها لأحد المتكلمين.

7 توليد الكلام بالتسلسل الكلمات: أشباه المقاطع: الفونيمات:
يحتاج إلى ذا كرة أكبر من تلك التي في النظم الأخرى. لا يوجد نظام ناطق آلي كامل قائم على كلمات أو مقاطع.إن النظم الحالية تقوم أساسا إما على الفونيمات أو الدايفونات أو أشباه المقاطع أو أي شكل من أشكال الجمع بينها. أشباه المقاطع: يمثل شبه المقطع بداية ونهاية المقطع . أحد مميزات أشباه المقاطع أن ألفا فقط منها يمكن أن تبني عشرة آلاف مقطع من مقاطع الانجليزية. الفونيمات: أكثر الوحدات شيوعا في الاستخدام في نظم النطق الآلي . مجموعها في الغالب بين أربعين وخمسين.

8 طريقة العمل 1.تشويه انسياب الصوت.
يتم إعداد قائمة الوحدات الصوتية على ثلاث مراحل: الأولى: يجب تسجيل الكلام الطبيعي بحيث يحتوي على جميع الوحدات التي ستستخدم فونيمات في جميع صيغ الكلام (ألفونات). الثانية:تسمية الوحدات واستخلاصها من المدخلات. الثالثة:يتم اختيار أكثر الوحدات ملائمة. مشاكل في توليد الكلام بالتسلسل عند مقارنتها بغيرها من الطرق: 1.تشويه انسياب الصوت. 2.مشاكل الذاكرة. 3.الوقت اللازم لتسمية الوحدات وجمعها.

9 المشكل الالي مثال: إن المشكل مطلوب ؟
لأنه لا يمكن عمل رموز صوتية دقيقة إلا بمعرفة فئة بعض الكلمات.إضافة إلى معرفة علاقة الاعتماد بين الكلمات المتتابعة. أن بناء المشكل الآلي العربي يعتبر تحديا حقيقيا من الناحيتين البحثية والتنفيذية فهو يحتاج إلى أبحاث شاملة في اللغة العربية. مثال: إذا قمنا بإدخال الآية التالية من القرآن الكريم: يا: إن البرنامج بإمكانه أن يدرك بسهولة أن الياء مفتوحة فلا تقبل العربية أية حركة قبل الألف اللينة غير الفتح وتظهر الكلمة يَا أيها: هذه الكلمة كذلك ليس فيها غير احتمال واحد وهو الفتح على الهمزة والشدة المضمومة على الياء والفتحة على الهاء فتصبح أَيُّهَا الذين : هذه كلمة أخرى ليس فيها سوى نوع واحد من التشكيل : الَّذٍيِنَ آمنوا : إن هذه الكلمة تحتمل أن تكون آمِنوا أو آمَنوا فالميم يمكن أن تكون مفتوحة أو مكسورة ولكن سياق الجملة يوحي بأن الكلمة يجب أن تكون فعلا ماضيا وليس فعل أمر يمكن أن يظهر الاحتمالين معا ( آمَنُوا / آمِنُوا ) يختار الكاتب أحدهما بالضغط على الشكل الصحيح

10 أمثله على بعض التطبيقات التي تستخدم الناطق الآلي العربي ومميزاتها
البرنامج الناطق (تاليكس) للجوال: - قراءة رقم المتصل إرسال واستقبال الرسائل القصيرة (SMS) مراجعة قوائم المكالمات والتعرف على المكالمات الصادرة والواردة إرسال رسائل الفاكس . -استخلاص أرقام الهواتف من ذاكرة الجوال . قاري الشاشة هال : الفئات المستفيدة: ‌ - ضعاف وفاقدي البصر: استخدام الحاسوب ‌ - المجال التعليمي (تقوية اللغة ومهارة القراءة) ‌ - الفئات الذين يعانون من صعوبة في التخاطب أو القراءة " يقرأ بدلا عنهم. ‌ - للإداريين والتنفيذيين المنهمكين في أعمالهم( الاستماع بدل النظر. ) خصائص المنتج واستخداماته: -التحويل الآلي بين اللغتين العربية والإنجليزية.

11 SpeechBar Companion Read for me Language Learning The EULER Project 1761م

12 -منهج البحث(تجربة مدينة الملك عبد العزيز ):
التركيب العام لنظام تحو يل النص إلى كلا م: وهو برنامج متكامل يقوم بتحويل النص العربي المكتوب إلى كتابة صوتية ثم يقوم بعمل تسلسل للوحدات الصوتية مولدا الكلام العربي.وقد صمم البرنامج بطريقة التقسيم مما يسهل تطوير وتعديل أي جزء من الخوارزميات المستعملة به. ويقوم البرنامج بتوليد العديد من الملفات التي تسهل على الباحث متابعة المراحل المختلفة في عملية التحويل بتسجيل الداخل والخارج من كل عملية خوارزمية. وفيما يلي عرض سريع لمكونات هذا النظام: 1. وسائل تحويل الملفات: وهي وسائل للتحويل من نظام التشفير الموحد إلى نظام التشفير القياسي الأمريكي وبالعكس وهي ضرورية للتحويل من النصوص والملفات المبنية تحت نظام النوافذ 98 إلى نظام النوافذ 2000 وان تي واكس بي.

13 2.واجهة التعامل مع المستخدم للبرنامج:
يمكن لمستخدم البرنامج أن يختار ملف النص العربي المشكل أو أن يدخل النص مباشرة باستعمال لوحة المفاتيح. كما يستطيع المستخدم أن يتحكم في نبرة وسرعة الكلام المتولد.ويتم عرض الترميز أيضا في أسفل النافذة. 3. وحدة معالجة الاستثناء: وهو أول خوارزم في النظام يتعامل مع النص العربي.ويقوم بالبحث في النص عن الكلمات والاختصارات والرموز التي تنفرد في نطقها عن قواعد النطق المعروفة واستبدالها بالنطق الصحيح.وقد قام الفريق البحثي بتجميع هذه المفردات العربية والاختصارات المشهورة ووضعها في قائمة, ومن الأمثلة على الإستثنائات(جدول1).

14 ء ــــــ ل ل ـــــــــ هــــ 3 لا ل ـَــــَــ 4 إلا
الحالات تسلسل الحروف بعد التحويل 1 ـــــــة ت 2 الله ء ــــــ ل ل ـــــــــ هــــ 3 لا ل ـَــــَــ 4 إلا ء ـــِــــ ل ل ـــَــــَــــ جدول1:عينة من حالات الاستثناء وتعديلها

15 4.وحدة تحويل النص المكتوب إلى كتابة صوتية:
يتم في هذه الوحدة تحويل النص المكتوب إلى رموز صوتية وذلك بتطبيق قوانين نطق الكتابة العربية. وقد قام الفريق البحثي بتجميع هذه القواعد وتحليلها وتدوينها طبقا للنماذج الرياضية لعلوم اللغات الطبيعية. 5.وحدة تقسيم النطق طبقا لقواعد الوقف والتنفس: تتعامل هذه الوحدة مع ملف الترميز وتنتج ملف ترميز معدل.ويتم تقسيم النص باستعمال قو اعد بسيطة مثل الوقوف عند علا مات الوقف المختلفة ونهاية السطور, أو عندما يزيد عدد الحروف في الكلمات المنطوقة على 35 حرفا. 6.وحدة تحو يل ملف الترميز إلى ألفونيات: وتقوم هذه الوحدة بالتعامل مع ملف الترميز بتطبيق سلسلة من قو اعد اختيار الألفونيات وإنتاج ملف للترميز الألو فو ني التي تتكون قاعدته من 178 مقطع للأصوات العربية والإنجليزية.

16 7.وحدة تحو يل ملف الترميز إلى دايفونات:
وتقوم هذه الوحدة بالتعامل مع ملف الترميز بتطبيق سلسلة من قو اعد اختيار الدايفونات وإنتاج ملف للترميز الدايفوني.وتتكون قاعدة المقاطع الصوتية الدايفونية العربية من 387 وحدة صوتية مسبقة التسجيل والتخزين الرقمي. ِ

17 طريقة عمل البرنامج: 1.يقوم البرنامج الرئيسي بقراءة الملف الذي يدخله المستخدم ويرغب في تحو يله إلى كلام . 2. يتم البحث عن الكلمات الاستثنائية واستبدا لها. 3.وبعد ذلك يستدعي البرنامج الرئيسي الخوارزميات المسئولة عن تطبيق قواعد النطق. 4. ويلي ذلك تطبيق قواعد تقسيم النص طبقا لقواعد الوقف والنفس . 5.يقوم البرنامج الرئيسي بالقراءة سطرا سطرا من ملف الترميز السابق بالتعاقب ويستدعي عنصر S2D الذي يقوم بقراءة الكتابة الصوتية منتجا ما بطابقها من المتتابعات الدايفو نية. كما يستدعي البرنامج الأساس عنصر s2d الذي يقوم بالمثل بإنتاج ما يطابق العبارة من المتتابعات الألفونية. 6.وفي المرحلة النهائية, وعندما يطلب المستخدم سماع عبارة, يقوم البرنامج الأساس بالقراءة من هذه الملفات. 7.يتم عرض الصوت المطلوب فقط طبقا للاختيارات التي حددها المستخدم عن طريق واجهة البرنامج,ويمكن للمستخدم حينئذ تكرار سماع نفس الصوت أو الانتقال إلى عبارة جديدة.

18 الخاتمة أهمية الدراسات الإحصائية للغة العربية: - هناك مهام كثيرة يجب أن يقوم بها الباحثون في جميع المجالات ذات العلاقة مع هذا الموضوع. - ضرورة ترتيب الأولويات للوصول لمرحلة التطبيق العملي. -اللغة العربية المتداولة تختلف عن ما هو موجود في الكتب. لذلك فإن نقطة البداية يجب أن تكون من المتداول وليس من المعاجم العربية. وهذا لا يتأتى إلا من خلال دراسات إحصائية .تبدأ من المتداول ثم تحسينه.

19 ترابط الدراسات مع بعضها:
إن الدراسات الخاصة باللغة العربية والحاسبات مترابطة مع بعضها البعض وكل منها يعتمد على الآخر. المخزون اللغوي المستعمل في حقل ما يمكن أن يستعمل في حقل آخر. لذلك فإن نشر الأبحاث وعقد المؤتمرات وتعاون الباحثين ونشر المطبوعات وتعارف الباحثين مع بعضهم البعض ، كل ذلك مما يثري المعرفة في هذا المجال ويزيد من سرعة الوصول إلى أهداف خدمة اللغة العربية العاجلة منها والآجلة. خطر ترك الأبحاث عن اللغة العربية بيد غير العرب: أصبحت كثير من الأبحاث المتعلقة باللغة العربية والحاسبات ذات طابع تجاري لذلك أ صبحت كثير من الشركات الاجنبية تنتج هذه الابحاث للأغراض الربحية. وذلك له ما بعده من تغيير الثقافة والمفاهيم والمصطلحات وغيره. إن خدمة اللغة العربية عبر التقنيات الحديثة لا تتم إلا بأيدي أبنائها من خلال مراكز أبحاث مكثفه وشامله أو جامعات عربية تفهم اللغة وتدافع عنها وتحمل همومها.


Download ppt "خالــد علـــي الشهري. عبدالله محمد السبيعي."

Similar presentations


Ads by Google