مقارنة أداء الشبكات العصبية الترشيحية والنماذج الهجينة في تصنيف فقاعات الإجابة
الملخص
تهدف هذه الدراسة إلى مقارنة أداء نموذج يعتمد على الشبكات العصبية الترشيحية (CNN) مع نموذج هجين يجمع بين بنية الشبكات العصبية الترشيحية CNN والمحولات Transformer في مهمة تصنيف فقاعات الإجابة (مملوءة، فارغة، أو مشطوبة). قمنا بتطوير شبكة CNN تتألف من خمس طبقات ترشيحية كنموذج أساسي، ونموذج هجين مكون من طبقات ترشيحية تليه وحدتا Transformer. تم تدريب النماذج على صور فقاعات إجابة حقيقية مقسمة إلى ثلاث فئات (مملوءة، فارغة، مشطوبة) باستخدام إعدادات تدريب موحدة. تم اختبار تأثير زيادة بيانات التدريب (Data Augmentation) على دقة التعميم في كلا النموذجين، أظهرت النتائج أن النموذج الهجين بدون زيادة البيانات حقق أفضل أداء بدقة تصنيف بلغت حوالي 99.96%. كما بينت النتائج أن معظم الأخطاء كانت في التفريق بين الفقاعات المملوءة والمشطوبة. تشير الدراسة إلى أن دمج خصائص محلية مستخرجة بواسطة الـشبكة العصبية الترشيحية مع سياق عالمي يوفره الـمحول (Transformer) يحسّن دقة تصنيف الصور في المهام الدقيقة مثل تصنيف فقاعات الإجابة، كما تبيّن أن استخدام زيادة البيانات بشكل غير مدروس قد يؤدي في بعض الحالات إلى نتائج عكسية. تسلط هذه النتائج الضوء على منهجية فعّالة يمكن اعتمادها في أنظمة تصحيح الاختبارات الآلية لزيادة المرونة والدقة.