الفهرس | Only 14 pages are availabe for public view |
Abstract تمثل البيانات المفقودة تحديًا شائعًا في مصادر البيانات المختلفة، بسبب أخطاء إدخال البيانات يدويًا، وأعطال المعدات، وعدم الاستجابة للمسح. تواجه النمذجة التنبؤية، التي تعتمد على مجموعات البيانات الكاملة، عقبات كبيرة في ظل وجود قيم مفقودة. تتناول هذه الأطروحة هذه القضية من خلال نهج متعدد الأوجه. الأهداف الأساسية هي كما يلي : أولاً، تطوير منهجية تستخدم الخوارزميات الذكية وتقنيات الحوسبة الناعمة للإحتساب الذكي للقيم المفقودة. ثانيًا، تم تقييم هذه الطريقة على مجموعات البيانات المرجعية، مع دمج القيم المفقودة المقدمة ومقارنة النتائج المحسوبة مع مجموعة البيانات الأصلية. ثالثا : تحليل مقارن للنظام المقترح مع طرق الإسناد القياسية لقياس مدى فعاليته. رابعا، تقييم تأثير الطريقة المقترحة على تجانس البيانات وحالتها الطبيعية بعد الإسناد باستخدام التدابير الإحصائية المعمول بها. وأخيرا، يتم تحديد كفاءة الطريقة المقترحة من خلال قياسات وقت التنفيذ على أحجام مختلفة من البيانات. تم تصميم النظام المقترح لإحتساب القيم العددية والفئوية المفقودة بذكاء، والتي تنشأ إما من فقدانها عشوائيًا أو فقدانها تمامًا بشكل عشوائي. وهي تعمل على افتراض أن ظروف البيئة الخارجية والداخلية أثناء الحصول على البيانات تظل ثابتة. في حالة الانحراف عن الإجراء العادي مما يؤدي إلى فقدان القيم، يستخدم النظام نهجًا مختلطًا يجمع بين تعظيم التوقعات الغامضة للبحث العالمي وأقرب جيران k (kNN) للبحث المحلي لاشتقاق قيم المطابقة Fuzzy K-Top (FKTMs). تخفف هذه العملية من التخمينات المتحيزة من خلال تحديد البيانات القابلة للمقارنة وتوليد تقدير من خلال خوارزمية تعظيم التوقعات الغامضة ونهج التجميع الغامض، متبوعًا بـ kNN للعثور على أقرب قيمة مطابقة. يتم قياس أداء طريقة FKTM المقترحة مقابل مجموعتين من البيانات الطبيعية المتاحة للجمهور، العلاج المناعي والعلاج بالتبريد، باستخدام مصنفات مثل الغابات العشوائية (RF)، والانحدار اللوجستي (LR)، وآلة ناقل الدعم (SVM)، مع تحقيق RF نتائج متفوقة. من خلال تحقيق دقة تبلغ 93.3% في العلاج بالتبريد و85.6% في العلاج المناعي، يتفوق النهج المقترح على طريقة التضمين المعروفة، التضمين متعدد المتغيرات بواسطة المعادلات المتسلسلة (MICE)، باستخدام مصنف SVM. في مجموعة بيانات العلاج المناعي، تتفوق التقنية المقترحة على الفئران بدقة تصل إلى 82.2%. يوضح التحليل المقارن مع خمس تقنيات التضمين في مجموعة بيانات العلاج بالتبريد الأداء المتفوق للتقنية المقترحة. تؤكد الاختبارات الإحصائية (ليفين وشابيرو ويلك) أن الطريقة المقترحة لا تؤثر سلبا على البيانات. علاوة على ذلك، فإن مقاييس الأداء، بما في ذلك وقت التنفيذ وخطأ التضمين، تظهر الكفاءة وتقلل من الأخطاء عبر مجموعات البيانات ذات الأحجام المختلفة. |