استخراج فقاعات الإجابة من أوراق الإجابة متعددة الخيارات باستخدام نموذج SegFormer وتقنيات تحليل الصورة
الملخص
تهدف هذه الدراسة إلى تطوير نظام فعّال ودقيق لاستخراج فقاعات الإجابة من أوراق الإجابة متعددة الخيارات باستخدام تقنيات التقسيم الدلالي (Semantic Segmentation) وخصوصاً نموذج التعلم العميق SegFormer-B0. تم تدريب النموذج على صور بحجم ثابت (1024×1024 بكسل)، باستخدام خوارزمية التحسين AdamW ودالة الخسارة CrossEntropyLoss. أظهرت النتائج أداءً متميزاً، حيث وصلت الدقة (Accuracy) إلى 0.9977، والاستدعاء (Recall) إلى 0.9961، والدقة التنبؤية (Precision) إلى 0.9970، ومعامل F1 Score إلى 0.9965، ومؤشر التقاطع على الاتحاد (IoU) إلى 0.9931، ما يدل على كفاءة النموذج العالية في التحديد الدقيق لحدود صندوق الإجابة.
اعتمدت الدراسة أيضاً على خوارزمية متكيفة لاكتشاف حدود صفوف الأسئلة، باستخدام تقنية الإسقاط الأفقي وتحليل القناة الحمراء (Red Channel Projection) لتحديد وفصل الأسطر بدقة. كما تم تطبيق آلية احتياطية (Fallback) لتجنب فشل عملية التقسيم في الحالات التي تفتقر فيها الصورة لمؤشرات واضحة. تضمن البحث في مرحلته الأخيرة استخدام خوارزمية التجميع DBSCAN لاكتشاف وتحديد مواضع الفقاعات بدقة عالية، مما يعزز موثوقية النتائج وملاءمة النظام للاستخدام العملي في تطبيقات التصحيح الآلي داخل البيئات التعليمية.