Arabic Speech Recognition

Slides:



Advertisements
Similar presentations
نظام حاسوبي لتشكيل النص العربي(المشكل الآلي) ICS484 الحوسبة العربية صقر العريفي فريق: ابداع.
Advertisements

تعريب لوحة المفاتيح والشاشة
للل البرمجيات و التطبيقات العربية إعــداد الطالبين: عبد العزيز بن عبد الرحمن المرشد تركي بن بندر العتيبي.
منصور البصيلي خالد الزهراني
التعرف الآلي على الكلام العربي المنطوق
الفجوة الرقمية اعداد : محمود الضامن.
نظام هال سوبر نوفا خالد العبدلله أقسام نظام هال سوبر نوفا قاريء الشاشة أنظمة إخراج: الناطق عدسة التكبير لغة برايل.
س : ما هو فيروس الكمبيوتر ؟
أهمية معالجة النصوص العربية باستخدام الحاسب
ماجيــــلان Global Positioning System GPS الزمن، البندول، الساعة الذريّة.
التعرف على الكلام العربي
استراتيجية التعلم ويكي ستكس
كتابة المعادلات الرياضيه لمحرر الرياضيات العربي Math Braille
تقنيات فعالة لنتائج أفضل
المواقع العربية مالها وماعليها ايمن السـنان حمد الحربي إشراف الدكتور : عبدالملك السلمان.
التعرف الآلي على الكلام العربي
Introduction to Software
أنظــمة الترمــيز العربيـــة
المقــــــال تعريفه: مصدر ميمي بمعنى القول, ويقصد به :
اعداد : أ : عبد العزيز محمد العمري
تعريب الطابعات صالح بن علي الصبي خالد بن أحمد الحقيل
بعض تطبيقات الليزر المشاريع المعماريّة الاتصالات الكهروضوئية
بسم الله الرحمن الرحيم معهد الامير احمد بن سلمان للإعلام التطبيقي دورة الترجمة الصحفية من الى
التعرف الآلي على الكلام المنطوق العربي
بسم الله الرحمن الرحيم.
القــارئ الآلــي للـــغة الــــــــعربية
الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد،
محركات البحث العربية بواسطة: عبد الله عتيق العامر
محرك البحث الإدريسي غزوان البريكان
بسم الله الرحمان الرحيم
LEARN PHONETICS EASILY تعلم الصوتيات بسهولة BY : TheMagician & Xpert نسخة تجريبية للتقيم.
تقارير جودة الخدمات للهاتف الثابت والمتحرك عن الربع
نظام إدارة قواعد البيانات Access
P.
Activity Diagram.
أهداف الدرس 1 ما هي محركات البحث ؟ Search engines
ماهو نظام التشغيل ؟.
الذكاء الاصطناعي تطبيقاته Artificial Intelligence
الشبكات والإتصالات الفصل الثالث
تعريف تطبيقات واستخدامات نظم المعلومات الجغرافية المحتويات تعريف نظم المعلومات الجغرافية مكونات نظم المعلومات الجغرافية الاسئلة الخمسة التى تجيب عنها.
لنفرض أن هدف التجربة هو مقارنة نوعين من الأعلاف (A و B) لتغذية أبقار حلوب خلال 3 شهور. وتم اختيار عشرين بقرة متشابهة ( في الوزن / العمر / السلالة / الموسم.
النشر الإلكتروني ELECTRONIC PUBLISHING
PSCJ 11/11/2018 المحور الرئيسي: أساسيات نظم وتقنيات المعلومات الموضوع الخامس: أنواع البرمجيات 23/4/2013 Mr Hashem Alaidaros.
تقنين برمجيات نظم المعلومات الجغرافية (GIS)
التعلم الالكترونى الطريق نحو تعليم افضل
How to contact me Twitter Blog :-
برمجة قواعد بيانات تطبيق مفهوم الحماية في النماذج
تابع :تطبيع البيانات.
بسم الله الرحمن الرحيم ...
1.الدوال Function 2.الاجراءاتSub Procedure 3.وحده نمطيه Add Module
السريان في القنوات المفتوحة والمغلقة
نظام التشغيل Windows xp.
مهارت الحاسوب ا.محمد شبير.
Programming -2 برمجة -2 المحاضرة-1 Lecture-1.
Electronic Payment Systems أنظمة الدفع الالكتروني
Windows Security Center
البورصة نشأة البورصة سبب تسميتها معنى البورصة الأوراق المالية
مشكلة مصرية:الأمية.
مهارة التنظيم المتقدم تعريف مهارة التنظيم المتقدم Organizing in Advance هي تلك المهارة التي تستخدم من اجل ايجاد اطار عقلي او فكري يستطيع الافراد عن طريقه.
3. Browsing the Web تصفح الانترنت
التعرف على الخط العربي المكتوب يدوياً
الذكاء الاصطناعي المحاضرة الأولى المستوى الرابع – قسم نظم المعلومات
شرح برنامج صانع الافلام Movie Maker (الموفي ميكر)
Gateway (بوابة العبور أو الاتصال)
User ID Symbol Description Site Engineer SE Office Engineer OE N/A SF
مصادر على شبكة الانترنت
طلاب الصف الثالث تحية عطرة وبعد:
Prepared By : Ms Asma Prepared For : Grade 7
هيكلة نظم إدارة قواعد البيانات (DBMS Architecture)
السلام عليكم ورحمة الله وبركاته سيكون درسنا اليوم الدرس الأول في الوحدة الثالثة سنقدم لكم الدرس اليوم نحنُ طلاب المجموعة الثالثة : فيصل يحيى لعجم عبد الرحمن.
Presentation transcript:

Arabic Speech Recognition بسم الله الرحمن الرحيم التعرف الآلي على الكلام العربي Arabic Speech Recognition اشراف/د. عبدالملك السلمان تقديم عبد الله محمد النوح 420001846 أحمد إبراهيم الدوسري 421000495

محتويات البحث المقدمة. تاريخ التعرف الآلي على الكلام العربي. عيوب و ميزات التعرف الآلي على الكلام العربي. الصعوبات و العوائق. آلية العمل . الجهود المبذولة في تطوير هذه التقنية. التقنيات المساعدة و المساندة . مجالات الاستخدام. النظرة المستقبلية . الخاتمة.

المقدمة الكلام هو أسهل وسيلة لدى الإنسان للتواصل مع الآخرين. بداية التعرف الآلي على الكلام. ظهرت أجهزة تليفون قادرة على تنفيذ أوامر صوتية بسيطة مثل اتصل بالبيت أو بالعمل .

تاريخ التعرف الآلي على الكلام العربي تاريخ التعرف الآلي على الكلام العربي شركة IBM بدأت في تطوير هذه التقنية عام 1995م . في نهاية عام 1997م طوّرت الشركة نظام الإملاء على نظام التشغيل ويندوز95 . وفي أثناء ذلك بدأت شركة صخر في تطوير هذه التقنية . (Arabic Speech Recognition- ASR ).

عيوب و ميزات التعرف الآلي على الكلام العربي أولاً المميزات: سهولة الاستخدام. توفير الجهد و الوقت. السرعة في عملية الإدخال و انجاز العمل. ازدياد عدد المستخدمين للحاسب الآلي. لا يلزم وضع جسمي معيّن.

عيوب و ميزات التعرف الآلي على الكلام العربي ثانياً: العيوب: تأثير البيئة المحيطة بالمتحدث تأثير وسيلة الإدخال ( الميكروفون) . أن التعرف على الكلام يعتمد اعتماداً كلياً على صوت المستخدم . التكلفة العالية لمنتجات هذه التقنية .

الصعوبات و العوائق أولاً: بالنسبة للمشاكل المتعلقة بالتعرف الآلي على الكلام بصفة عامة: أن نطق الكلمة الواحدة يختلف من شخص إلى لآخر رغم أن الكلمة المنطوقة واحدة. أن نطق الشخص للكلمة قد يختلف من نطق إلى آخر رغم أن المتحدث واحد و الكلمة المنطوقة واحدة، وأيضاً يختلف بحسب سياق الكلمة المنطوقة في الجملة.

الصعوبات و العوائق ثانياً: المعوقات المتعلقة بالتعرف الآلي على الكلام العربي بشكل خاص: تعدد اللهجات . عدم وجود علامات تحدد بدء و انتهاء الكلمة خاصة في اللغة العربية . صعوبة التعرف على الكلام إذا كان في بيئة تتسم بالضوضاء و الصخب. تغير صوت المتكلم حسب حالته النفسية و الجسدية . كثرة الكلمات التي تشكل شمولاً للغة العربية و مفرداتها .

آلية العمل يوجد هناك نوعين من أنظمة التعرف الآلي على الكلام : الأول وهو التعرف على الكلام عن طريق تدريب النظام على صوت المستخدم بالنطق بكلمات محددة ليتعرف عليها النظام لاحقاً . أما النوع الثاني فهو التعرف على الكلام من دون عمل تدريب للنظام على صوت المستخدم على كلمات محددة. لتحقيق ذلك لابد من وجود نظام لمقارنة الاشارات الصوتية وهو ما يعرف ب pattern matching فكرة عمل هذا النظام هي تخزين الاشارات الصوتية لكل الكلمات فى ذاكرة الكمبيوتر بالإضافة إلى تخزين الاشارات الصوتية لكل صور النطق الممكنة للكلمة الواحدة.

آلية العمل باختصار شديد: يتم تسجيل الصوت عبر الميكروفون. تفلتر الموجة الصوتية و تنقى من الشوائب. تقطع الاشارة الصوتية الى مقاطع عدة . يتم التعرف على جنس المتحدث ذكرٌ ام انثى. يتم التعرف على اللغة و على اللهجة. يتم التعرف على الحروف و الكلمات، ويتم معالجتها نحوياً وصرفياً. يتم مقارنة الكلمات بما هو مخزن في قاعدة البيانات باستخدام نظام pattern matching . يتم ادراك المعنى من العبارة.

الجهود المبذولة في تطوير هذه التقنية أشهر شركتين في هذا المجال هما شركة IBM و شركة صخر. أولاً شركة IBM : يحتاج هذا النظام الى التدريب على خصائص المستخدم الصوتية من خلال نطق 95جملة اختيرت بعناية. وتحتاج هذه الخطوة إلى ما بين 20 دقيقة إلى 30دقيقة، و تتراوح نسبة الدقة فيه إلى ما بين 92إلى 97% . طريقة عمل هذا النظام: في البداية يتم معالجة الإشارات الصوتية وتحويلها إلى إشارات رقمية. تتم فلترت الصوت لإخراج الخصائص الصوتية. تتم عملية مقارنة الصوت مع نماذج إحصائية تمثل طريقة نطق الكلمات الموجودة بالقاموس المعرف للنظام . بدأت في تطبيق هذه التقنية على نظام الرد الآلي للمكالمات الهاتفية.

الجهود المبذولة في تطوير هذه التقنية ثانياً شركة صخر: تستخدم تقنيات مساعدة مثل معالجة اللغة الطبيعية و المشكل الآلي و المصحح الآلي. تعتمد على ثلاثة محركات: محرك معالجة الإشارات الصوتية. محرك المطابقة السمعية. محرك البرمجة الديناميكية. فشلت الشركة في نشر هذه الإمكانيات التي تمتلكها و البرامج أيضاً في السوق العربية و العالمية و خاصة على مستوى المستخدمين الأفراد .

التقنيات المساعدة و المساندة لها أولاً: تقنيات برمجية: معالجة اللغة الطبيعية . التصحيح الآلي . التشكيل الآلي . تقنية مايكروسوفت SDKوالتي تعتمد على (Speech Application Language Tags- SALT-) . ثانياً تقنيات عتادّية: سرعة المعالجات . سعة حجم الذاكرة . الوسائط المتعددة .

مجالات الاستخدام مجال المكالمات الهاتفية (الاتصال السريع). مجال المكالمات الهاتفية (الاتصال السريع). الرد على لمكالمات الهاتفية (البدّالة). مجال الاستعلام في الدليل الهاتفي. مجال الاستعلام عن رحلات الطيران . مجال الاستعلام عن أسعار الأسهم والعملات . مجال الأعمال المكتبية (كتابة التقارير و الخطابات). مجال مساعدة المكفوفين في الكتابة . مجال مساعدة ذوي الاحتياجات الخاصة مثل المعوقين جسدياً. مجال الانترنت ( البريد الإلكتروني) .

النظرة المستقبلية مدى دقة و جودة التحويل . استخدامها في المجالات الحساسة كالمجال العسكري مثلاً. مجال التحدث إلى الروبوتات . استخدامها في تصفح الانترنت بالصوت . القدرة على بناء مترجم آلي كامل و فوري. إمكانية استخدامها في تصحيح تلاوة القران الكريم . إمكانية استخدامها في تعلم اللغة العربية . مجال الأمن و الحماية (البصمة الصوتية).

الخاتمة وفي الختام نتمنى أن نكون قد قدمنا ما هو نافع و مفيد . وفي الختام نتمنى أن نكون قد قدمنا ما هو نافع و مفيد . هذا والله اعلم وصلى الله وسلّم على نبينا محمد وعلى آله و صحبة أجمعين، والسلام عليكم ورحمة الله وبركاته.