نظام ذكي لكشف روابط التصيد الاحتيالي باستخدام تقنيات التعلم العميق
يهدف هذا البحث إلى تطوير نموذج ذكاء اصطناعي متقدم قادر على كشف هجمات التصيد الاحتيالي عبر الروابط Attacks Phishing URL وذلك في ظل التزايد المستمر لهذه الهجمات واعتمادها على أساليب متطورة يصعب اكتشافها باستخدام الأنظمة التقليدية. وتُعد هجمات التصيد من أخطر التهديدات في مجال الأمن السيبراني، حيث تستهدف المستخدمين من خلال روابط مزيفة تحاكي المواقع الحقيقية بهدف سرقة البيانات الحساسة مثل كلمات المرور والمعلومات المالية. تنطلق فكرة المشروع من الحاجة إلى إيجاد حل ذكي وفعّال يعتمد على تقنيات التعلم العميق (Learning Deep (لتحليل بنية الروابط النصية واكتشاف الأنماط الاحتيالية الكامنة فيها، دون الحاجة إلى فحص محتوى الصفحة المرتبطة بالرابط. ويعتمد النموذج المقترح على بنية هجينة تجمع بين الشبكات العصبية الالتفافية (CNN (والشبكات العصبية المتكررة LSTM، حيث تساهم طبقات CNN (في استخراج الأنماط المحلية داخل الرابط، بينما تعمل طبقات (LSTM (على تحليل العالقات التسلسلية بين مكونات الرابط، مما يعزز من قدرة النموذج على التمييز بين الروابط الآمنة والروابط الاحتيالية بدقة عالية . تم في هذا البحث تطوير نموذج هجين متقدم قائم على تقنيات التعلم العميق، يجمع بين الشبكات العصبية الالتفافية CNN والشبكات العصبية المتكررة LSTM (، بهدف تحسين كفاءة كشف هجمات التصيد الاحتيالي عبر الروابط الإلكترونية. ويعتمد النموذج على تحليل البنية النصية للرابط واستخراج الأنماط الاحتيالية تلقائيا دون الحاجة إلى الاعتماد على الخصائص اليدوية التقليدية.
وقد أظهرت النتائج التجريبية أن النموذج المقترح حقق دقة بلغت ،%98.46 مع أداء متفوق مقارنة بعدد من الأساليب التقليدية والدراسات السابقة، مما يؤكد فعاليته العالية واستقراره في بيئات العمل الواقعية.
كما يركز هذا البحث على معالجة عدد من التحديات المرتبطة ببيانات الروابط، مثل عدم التوازن بين الفئات، واختلاف أطوال الروابط، وتنوع الأنماط المستخدمة في الهجمات الحديثة. ولتحقيق ذلك، تم استخدام مجموعة بيانات كبيرة ومتنوعة، مع تطبيق تقنيات معالجة مسبقة متقدمة، مثل تحويل الروابط إلى تمثيل عددي على مستوى الأحرف Representation Level-Character، مما يسمح للنموذج بفهم أدق لتركيب الرابط.
وقد أظهرت النتائج التجريبية أن النموذج المقترح حقق أداء متميزا من حيث الدقة والاستدعاء، مما يعكس كفاءته في كشف روابط التصيد وتقليل الأخطاء، وبالتالي يساهم في تعزيز حماية المستخدمين من التهديدات الإلكترونية. كما تم اختبار النموذج على بيانات جديدة غير مستخدمة في التدريب، وأثبت قدرته على التعميم والعمل بكفاءة في بيئات واقعية.
يساهم هذا المشروع في تقديم إضافة مهمة في مجال الأمن السيبراني، حيث يوفر أداة ذكية تساعد في تقليل احتمالية الوقوع ضحية لهجمات التصيد الاحتيالي، كما يدعم المؤسسات والأفراد بحلول عملية للكشف المبكر عن الروابط
The aim of this research is to develop an advanced artificial intelligence model capable of detecting URL phishing attacks in light of the continuous rise of such attacks and their increasing reliance on sophisticated techniques that are difficult to detect using traditional security systems. Phishing attacks are considered among the most dangerous threats in the field of cybersecurity, as they target users through fraudulent links that imitate legitimate websites in order to steal sensitive information such as passwords and financial data. The project is based on the need to establish an intelligent and effective solution that utilizes Deep Learning techniques to analyze the textual structure of URLs and identify hidden malicious patterns without requiring inspection of the external webpage content. The proposed model relies on a hybrid architecture that combines Convolutional Neural Networks (CNN) and Long Short-Term Memory networks (LSTM). CNN layers contribute to extracting local patterns within URLs, while LSTM layers analyze sequential relationships between URL components, thereby enhancing the model’s ability to accurately distinguish between legitimate and phishing links. This research also addresses several challenges associated with URL datasets, including class imbalance, variations in URL lengths, and the diversity of patterns used in modern phishing attacks. To overcome these challenges, a large and diverse dataset was utilized, along with advanced preprocessing techniques such as Character-Level Representation, which allows the model to achieve a deeper understanding of URL structures. Experimental results demonstrated that the proposed model achieved outstanding performance in terms of accuracy and recall, reflecting its high efficiency in phishing detection and error reduction. This significantly contributes to improving user protection against cyber threats. Furthermore, the model was tested on new unseen data outside the training process and proved its ability to generalize effectively and operate efficiently in real-world environments. This project provides a significant contribution to the field of cybersecurity by offering an intelligent tool that reduces the likelihood of users becoming victims of phishing attacks, while also supporting individuals and organizations with practical solutions for the early detection of suspicious links. In addition, the research presents a prototype model that can be further developed into a fully integrated system for practical applications or integrated into web browsers and security protection systems. The research covers several essential aspects, including problem analysis, literature review, development of the proposed model, practical implementation, performance evaluation using standard metrics, as well as discussion of results and extraction of conclusions and future recommendations. The first chapter presents the theoretical background of the problem, including the research problem, objectives, contributions, scope, and limitations, thereby establishing a strong scientific foundation for the remaining chapters of the study
