نظام تحدید المتحدث المعتمد على النص على أساس التعلم العمیق
الملخص
تعد تقنیات التعرف على المتحدث من أهم التقنیات الحدیثة وقد تم تطویر العدید من الأنظمة المختلفة من حیث الطرق المستخدمة فی استخراج الخصائص وطرق التصنیف. تشکل ان تطبیقات التعرف على المتحدث تحدیًا کبیرًا، حیث یتطلب تقنیات حدیثة وعدد کبیر من عینات الصوتیة وموارد کبیرة. فی هذه البحث تم تصمیم نظام لتحدید هویه المتحدث المعتمد على النص (تکون الکلمة او الجمل محددة مسبقا)حیث یتمیز النظام بقدرته على التعرف على المتحدث باقل وقت واقل عدد من عینات التدریب واقل الموارد.یتکون النظام من اربعة اجزاء رئیسیة وهی: الجزء الاول بناء قواعد بیانات صوتیة, تم الاعتماد فی الدراسة على قاعدتین للبیانات الصوتیة,الاولى قاعدة بیانات (QS- Dataset) وقاعدة البیانات الثانیة(audioMNIST_meta).،وقد تم معالجة و تهیئة قواعد البیانات بطریقة تم شرحها فی متن البحث لاحقا. الجزء الثانی من البحث استخلاص الخصائص عن طریق خوارزمیة معاملات درجة النغم اما الجزء الثالث فهو استخدام الشبکة العصبیة کمصنف. واما الجزء الاخیر فی البحث فهو التحقق من عمل و نتائج النظام. اوضحت نتائج الاختبار قدرة شبکة MNN على التعامل مع اقل عدد من البیانات حیث حققت نسبة (100%) واما مع البیانات الکبیرة تتراوح من 80% الى 81% على عکس شبکةCNN کانت نتائج غیر جیدة بالنسبة للبیانات القلیلة من60% الى 76 % ومع بیانات الکبیرة کانت النتائج ممتازة من91% الى 96 % .