تحسين النموذج YOLOv4واستخدامه في التعرف على الأشخاص
الملخص
تستخدم تقنية الرؤية الحاسوبية للتعرف على الأشخاص وهي أحد أهم وظائف المركبات ذاتية القيادة من أجل اكتشاف حركة الأشخاص ضمن المسارات المخصصة لها، لمنع الحوادث وتجنب المركبات المتحركة والعقبات. وكذلك في المجالات الأمنية حيث من المهم التعرف على الجاني ومطاردته ضمن حشد من الناس بسرعة وكفاءة عالية مناسبة للتطبيقات المحمولة ضمن الزمن الحقيقي. تُستخدم الشبكة العصبونية التلافيفية CNN من أجل تصميم خوارزميات تؤدي هذه المهمة بدقة عالية. تُعتبر عائلة You Only Look Once (YOLO) من اهم الخوارزميات في وقتنا الحالي التي تُستخدم لمهام التعرف والتي تحقق أداء جيد من حيث الدقة، ولكن النماذج ذات الدقة العالية تملك عدد عمليات فاصلة عائمة في الثانية Floating-point Operations per Seconds FLOPS كبير وحجم كبير نسبياً لا يناسب التطبيقات المحمولة. في هذا البحث تم تعديل نموذج YOLOv4 الأساسي كونه نموذج يعمل بكفاءة عالية ولكنه يعاني من زيادة عدد عمليات الفاصلة العائمة، لمعالجة هذه المشكلة تم استخدام نموذج
*طالب دكتوراه في قسم هندسة التحكم الآلي والحواسيب
**أستاذ مساعد في قسم هندسة التحكم الآلي والحواسيب
Efficientnet-B0 لتخفيض حجم النموذج مع اجراء بعض التعديلات عليه كما تم استخدام شبكة Cross Stage Partial (CSP) بعد تعديلها من أجل زيادة الدقة. تم بناء خوارزمية CspEffYolo لتحقيق الهدف المطلوب، وتم تدريبها باستخدام قاعدة بيانات Google Images ومن ثم اختبارها والحصول على النتائج، ومقارنتها مع النتائج المماثلة لنموذج YOLOv4 الأساسي وEfficientnet-B0. حقق النموذج متوسط معدل الدقة mAP=90.4%، مقارنة بـ88% و85.9% للنموذج YOLOv4 الأساسي وEfficientnet-B0 على التوالي. بالإضافة إلى تخفيض عدد عمليات الفاصلة العائمة وكذلك حجم النموذج.