Author: Mohsen, Eman El-Saeed El-Saeed Abd El-Hay./ Title: Handling uncertain data challenges /

Search In this Thesis

العنوان

Handling uncertain data challenges /

المؤلف

Mohsen, Eman El-Saeed El-Saeed Abd El-Hay.

هيئة الاعداد

باحث / إيمان السعيد السعيد عبدالحي محسن

مشرف / إيمان الدايدموني

مشرف / أحمد عطوان محمد

مشرف / أسامة عودة

مناقش / نهى أحمد هيكل

مناقش / ميرفت مصطفى أبوالخير

الموضوع

Application software. Computer communication systems. Computer simulation. Software engineering.

تاريخ النشر

2022.

عدد الصفحات

online resource (118 pages) :

اللغة

الإنجليزية

الدرجة

ماجستير

التخصص

تكنولوجيا التعليم

تاريخ الإجازة

1/1/2022

مكان الإجازة

جامعة المنصورة - كلية الحاسبات والمعلومات - قسم تكنولوجيا المعلومات

الفهرس

Only 14 pages are availabe for public view

from

117

from

117

Abstract

مع التطورات الحديثة في تكنولوجيا المعلومات ، هناك أنواع كثيرة من ظهرت البيانات. هذه البيانات غير دقيقة أوغير معروفة أو غير موثوق بها. من الأمثلة المهمة على البيانات غير المؤكدة الأخبار المزيفة. الأخبار الكاذبة المعلومات المضللة ، أو البيانات المخادعة عمدًا أو غير المؤيدة المقدمة على أنها حقائق. إنها خدعة أو معلومات مضللة ينشرها أفراد أو منظمات تعمد تضليل الآخرين والتأثير عليهم. أحدث الولايات المتحدة الانتخابات الرئاسية خير مثال على هذه المشكلة. ظزولاؤ مهم للتحكم في وسائل التواصل الاجتماعي. تساعد خوارزميات التعلم الآلي في الكشف التلقائي عن الأخبار الزائفة. في هذا أطروحة نطبق ست خوارزميات مختلفة للتعلم الآلي والتي تحقق الخير ولتعزيزها تم تطبيق مصنف تصويت جماعي. هذه الطريقة يساعد في السيطرة على التضليل على وسائل التواصل الاجتماعي من خلال تصنيف الأخبار المزيفة والحقيقية. هناك ثلاث مجموعات بيانات عامة مستخدمة في هذا العمل وهي: Fake-or-Real-News، مجموعات بيانات Media-Eval و ISOT. في هذه التجربة استخدمنا Naïve Bayes (NB) ، آلة متجه الدعم الخطي (LSVC) ، الانحدار اللوجستي (LR) ، الغابة العشوائية. (RF) ، العدواني السلبي (PA) ، مصنف هبوط التدرج العشوائي (SGD) مصنف التصويت. لتقييم الإطار المقترح خمسة أداء مختلف يتم استخدام المقاييس وهي: الدقة (ACC) ، الدقة ، الاسترجاع ، درجة f1 ، والمساحة تحت منحنى ROC (AUC). حقق النظام 94.6٪ و 96٪ و 96٪ و 94٪ من الدقة ، والجودة AUC ، والدقة ، والاستدعاء ، والنتيجة f1 لمجموعة بيانات الأخبار المزيفة أو الحقيقية على التوالى. بالنسبة لمجموعة بيانات Media-Eval ، حقق النظام 92.3٪ ، 91.6٪ ، 93٪ ، 98٪ ، و 94٪ من الدقة ، AUC ، الدقة ، الاسترجاع ، ودرجة f1 على التوالي. ل 2 مجموعة بيانات ISOT ، حقق النظام 100 ٪ من الدقة ، AUC ، الدقة ، الاسترجاع ، و f1-Score. لاحظنا أن الطريقة المقترحة في هذا العمل حققت أفضل أداء من الخوارزميات التقليدية المستخدمة وأفضل من الأساليب الأخرى المطبقة باستخدام نفس مجموعات البيانات المستخدمة في هذا العمل. الأداء الأفضل لنظامنا تم تحقيقه بسبب استخدام طرق اختيار الميزة التي تزيد من الدقة بنسبة 0.8٪.