Presentation is loading. Please wait.

Presentation is loading. Please wait.

Arabic Speech Recognition

Similar presentations


Presentation on theme: "Arabic Speech Recognition"— Presentation transcript:

1 Arabic Speech Recognition
بسم الله الرحمن الرحيم التعرف الآلي على الكلام العربي Arabic Speech Recognition اشراف/د. عبدالملك السلمان تقديم عبد الله محمد النوح أحمد إبراهيم الدوسري

2 محتويات البحث المقدمة. تاريخ التعرف الآلي على الكلام العربي.
عيوب و ميزات التعرف الآلي على الكلام العربي. الصعوبات و العوائق. آلية العمل . الجهود المبذولة في تطوير هذه التقنية. التقنيات المساعدة و المساندة . مجالات الاستخدام. النظرة المستقبلية . الخاتمة.

3 المقدمة الكلام هو أسهل وسيلة لدى الإنسان للتواصل مع الآخرين.
بداية التعرف الآلي على الكلام. ظهرت أجهزة تليفون قادرة على تنفيذ أوامر صوتية بسيطة مثل اتصل بالبيت أو بالعمل .

4 تاريخ التعرف الآلي على الكلام العربي
تاريخ التعرف الآلي على الكلام العربي شركة IBM بدأت في تطوير هذه التقنية عام 1995م . في نهاية عام 1997م طوّرت الشركة نظام الإملاء على نظام التشغيل ويندوز95 . وفي أثناء ذلك بدأت شركة صخر في تطوير هذه التقنية . (Arabic Speech Recognition- ASR ).

5 عيوب و ميزات التعرف الآلي على الكلام العربي
أولاً المميزات: سهولة الاستخدام. توفير الجهد و الوقت. السرعة في عملية الإدخال و انجاز العمل. ازدياد عدد المستخدمين للحاسب الآلي. لا يلزم وضع جسمي معيّن.

6 عيوب و ميزات التعرف الآلي على الكلام العربي
ثانياً: العيوب: تأثير البيئة المحيطة بالمتحدث تأثير وسيلة الإدخال ( الميكروفون) . أن التعرف على الكلام يعتمد اعتماداً كلياً على صوت المستخدم . التكلفة العالية لمنتجات هذه التقنية .

7 الصعوبات و العوائق أولاً: بالنسبة للمشاكل المتعلقة بالتعرف الآلي على الكلام بصفة عامة: أن نطق الكلمة الواحدة يختلف من شخص إلى لآخر رغم أن الكلمة المنطوقة واحدة. أن نطق الشخص للكلمة قد يختلف من نطق إلى آخر رغم أن المتحدث واحد و الكلمة المنطوقة واحدة، وأيضاً يختلف بحسب سياق الكلمة المنطوقة في الجملة.

8 الصعوبات و العوائق ثانياً: المعوقات المتعلقة بالتعرف الآلي على الكلام العربي بشكل خاص: تعدد اللهجات . عدم وجود علامات تحدد بدء و انتهاء الكلمة خاصة في اللغة العربية . صعوبة التعرف على الكلام إذا كان في بيئة تتسم بالضوضاء و الصخب. تغير صوت المتكلم حسب حالته النفسية و الجسدية . كثرة الكلمات التي تشكل شمولاً للغة العربية و مفرداتها .

9 آلية العمل يوجد هناك نوعين من أنظمة التعرف الآلي على الكلام :
الأول وهو التعرف على الكلام عن طريق تدريب النظام على صوت المستخدم بالنطق بكلمات محددة ليتعرف عليها النظام لاحقاً . أما النوع الثاني فهو التعرف على الكلام من دون عمل تدريب للنظام على صوت المستخدم على كلمات محددة. لتحقيق ذلك لابد من وجود نظام لمقارنة الاشارات الصوتية وهو ما يعرف ب pattern matching فكرة عمل هذا النظام هي تخزين الاشارات الصوتية لكل الكلمات فى ذاكرة الكمبيوتر بالإضافة إلى تخزين الاشارات الصوتية لكل صور النطق الممكنة للكلمة الواحدة.

10 آلية العمل باختصار شديد: يتم تسجيل الصوت عبر الميكروفون.
تفلتر الموجة الصوتية و تنقى من الشوائب. تقطع الاشارة الصوتية الى مقاطع عدة . يتم التعرف على جنس المتحدث ذكرٌ ام انثى. يتم التعرف على اللغة و على اللهجة. يتم التعرف على الحروف و الكلمات، ويتم معالجتها نحوياً وصرفياً. يتم مقارنة الكلمات بما هو مخزن في قاعدة البيانات باستخدام نظام pattern matching . يتم ادراك المعنى من العبارة.

11 الجهود المبذولة في تطوير هذه التقنية
أشهر شركتين في هذا المجال هما شركة IBM و شركة صخر. أولاً شركة IBM : يحتاج هذا النظام الى التدريب على خصائص المستخدم الصوتية من خلال نطق 95جملة اختيرت بعناية. وتحتاج هذه الخطوة إلى ما بين 20 دقيقة إلى 30دقيقة، و تتراوح نسبة الدقة فيه إلى ما بين 92إلى 97% . طريقة عمل هذا النظام: في البداية يتم معالجة الإشارات الصوتية وتحويلها إلى إشارات رقمية. تتم فلترت الصوت لإخراج الخصائص الصوتية. تتم عملية مقارنة الصوت مع نماذج إحصائية تمثل طريقة نطق الكلمات الموجودة بالقاموس المعرف للنظام . بدأت في تطبيق هذه التقنية على نظام الرد الآلي للمكالمات الهاتفية.

12 الجهود المبذولة في تطوير هذه التقنية
ثانياً شركة صخر: تستخدم تقنيات مساعدة مثل معالجة اللغة الطبيعية و المشكل الآلي و المصحح الآلي. تعتمد على ثلاثة محركات: محرك معالجة الإشارات الصوتية. محرك المطابقة السمعية. محرك البرمجة الديناميكية. فشلت الشركة في نشر هذه الإمكانيات التي تمتلكها و البرامج أيضاً في السوق العربية و العالمية و خاصة على مستوى المستخدمين الأفراد .

13 التقنيات المساعدة و المساندة لها
أولاً: تقنيات برمجية: معالجة اللغة الطبيعية . التصحيح الآلي . التشكيل الآلي . تقنية مايكروسوفت SDKوالتي تعتمد على (Speech Application Language Tags- SALT-) . ثانياً تقنيات عتادّية: سرعة المعالجات . سعة حجم الذاكرة . الوسائط المتعددة .

14 مجالات الاستخدام مجال المكالمات الهاتفية (الاتصال السريع).
مجال المكالمات الهاتفية (الاتصال السريع). الرد على لمكالمات الهاتفية (البدّالة). مجال الاستعلام في الدليل الهاتفي. مجال الاستعلام عن رحلات الطيران . مجال الاستعلام عن أسعار الأسهم والعملات . مجال الأعمال المكتبية (كتابة التقارير و الخطابات). مجال مساعدة المكفوفين في الكتابة . مجال مساعدة ذوي الاحتياجات الخاصة مثل المعوقين جسدياً. مجال الانترنت ( البريد الإلكتروني) .

15 النظرة المستقبلية مدى دقة و جودة التحويل .
استخدامها في المجالات الحساسة كالمجال العسكري مثلاً. مجال التحدث إلى الروبوتات . استخدامها في تصفح الانترنت بالصوت . القدرة على بناء مترجم آلي كامل و فوري. إمكانية استخدامها في تصحيح تلاوة القران الكريم . إمكانية استخدامها في تعلم اللغة العربية . مجال الأمن و الحماية (البصمة الصوتية).

16 الخاتمة وفي الختام نتمنى أن نكون قد قدمنا ما هو نافع و مفيد .
وفي الختام نتمنى أن نكون قد قدمنا ما هو نافع و مفيد . هذا والله اعلم وصلى الله وسلّم على نبينا محمد وعلى آله و صحبة أجمعين، والسلام عليكم ورحمة الله وبركاته.


Download ppt "Arabic Speech Recognition"

Similar presentations


Ads by Google