الفهرس | Only 14 pages are availabe for public view |
Abstract مع التطورات الحديثة في تكنولوجيا المعلومات ، هناك أنواع كثيرة من ظهرت البيانات. هذه البيانات غير دقيقة أوغير معروفة أو غير موثوق بها. من الأمثلة المهمة على البيانات غير المؤكدة الأخبار المزيفة. الأخبار الكاذبة المعلومات المضللة ، أو البيانات المخادعة عمدًا أو غير المؤيدة المقدمة على أنها حقائق. إنها خدعة أو معلومات مضللة ينشرها أفراد أو منظمات تعمد تضليل الآخرين والتأثير عليهم. أحدث الولايات المتحدة الانتخابات الرئاسية خير مثال على هذه المشكلة. ظزولاؤ مهم للتحكم في وسائل التواصل الاجتماعي. تساعد خوارزميات التعلم الآلي في الكشف التلقائي عن الأخبار الزائفة. في هذا أطروحة نطبق ست خوارزميات مختلفة للتعلم الآلي والتي تحقق الخير ولتعزيزها تم تطبيق مصنف تصويت جماعي. هذه الطريقة يساعد في السيطرة على التضليل على وسائل التواصل الاجتماعي من خلال تصنيف الأخبار المزيفة والحقيقية. هناك ثلاث مجموعات بيانات عامة مستخدمة في هذا العمل وهي: Fake-or-Real-News، مجموعات بيانات Media-Eval و ISOT. في هذه التجربة استخدمنا Naïve Bayes (NB) ، آلة متجه الدعم الخطي (LSVC) ، الانحدار اللوجستي (LR) ، الغابة العشوائية. (RF) ، العدواني السلبي (PA) ، مصنف هبوط التدرج العشوائي (SGD) مصنف التصويت. لتقييم الإطار المقترح خمسة أداء مختلف يتم استخدام المقاييس وهي: الدقة (ACC) ، الدقة ، الاسترجاع ، درجة f1 ، والمساحة تحت منحنى ROC (AUC). حقق النظام 94.6٪ و 96٪ و 96٪ و 94٪ من الدقة ، والجودة AUC ، والدقة ، والاستدعاء ، والنتيجة f1 لمجموعة بيانات الأخبار المزيفة أو الحقيقية على التوالى. بالنسبة لمجموعة بيانات Media-Eval ، حقق النظام 92.3٪ ، 91.6٪ ، 93٪ ، 98٪ ، و 94٪ من الدقة ، AUC ، الدقة ، الاسترجاع ، ودرجة f1 على التوالي. ل 2 مجموعة بيانات ISOT ، حقق النظام 100 ٪ من الدقة ، AUC ، الدقة ، الاسترجاع ، و f1-Score. لاحظنا أن الطريقة المقترحة في هذا العمل حققت أفضل أداء من الخوارزميات التقليدية المستخدمة وأفضل من الأساليب الأخرى المطبقة باستخدام نفس مجموعات البيانات المستخدمة في هذا العمل. الأداء الأفضل لنظامنا تم تحقيقه بسبب استخدام طرق اختيار الميزة التي تزيد من الدقة بنسبة 0.8٪. |