تحسين خوارزمية التجميع ال DBSCANبالاعتماد على EpsوالMinPts

المؤلفون

  • كيندا العيسى

الملخص

نُقدم في هذا البحث تعديلاً لخوارزمية عنقدة البيانات الـ ، والتي تُعتبر من خوارزميات التجميع الأكثر استخداماً، ولكنها تُعاني من بعض المشاكل، حيث أن الخوارزمية لا تقوم بتعيين قيم الثوابت (نصف قطر الجوار) و (الكثافة) وإنما المستخدم يقوم بإدخاله عشوائياً ودون معرفة مسبقة بالبيانات، لذلك قد يُصبح عدد التكرارات لتنفيذ الخوارزمية كبير، وكذلك التحديد العشوائي لقيم الثوابت قد يؤدي لإعطاء نتائج مختلفة. قُمنا باقتراح خوارزمية معدلة قادرة على العمل بشكل آلي دون أي تدخل من المستخدم، حيث تعتمد الخوارزمية المعدلة على إيجاد قيمة مناسبة للثابت ، وللثابت  ألياً بدلاً من إدخالها من قبل المستخدم.

كما نُقدم في هذا البحث مقارنة بين أداء خوارزمية الـ  الأصلية، وخوارزمية الـ  المعدلة، حيث استخدمنا عدة معايير لتقييم جودة عملية التجميع (V-measure, Rand Index, Silhouette)، فتمكنا من زيادة دقة التجميع في الخوارزمية المعدلة وتقليل نسبة الضجيج(noise) فيها، كما استخدمنا المعيارين Homogeneity وCompleteness لتقييم مدى تماسك وتكامل المجموعات التي تمت تجميعها.

التنزيلات

منشور

2025-05-11

إصدار

القسم

سلسلة العلوم الأساسية