
كيفية التعامل مع البيانات الملوثة غير تامة الرتبة ضمن بيانات متعدد المتغيرات
Author(s) -
لقاء محمد
Publication year - 2021
Publication title -
magallaẗ kulliyyaẗ al-rāfidayn al-ǧāmi'aẗ al-'ulūm/maǧallaẗ kulliyyaẗ al-rāfidayn al-ǧāmiʻaẗ li-l-ʻulūm
Language(s) - Arabic
Resource type - Journals
eISSN - 2790-2293
pISSN - 1681-6870
DOI - 10.55562/jrucs.v23i2.481
Subject(s) - principal component analysis , mathematics , statistics
عندما نواجه بيانات بأبعاد عالية غالبا" ما نستخدم تحليل المركبات الرئيسية Principal Components Analysis (PCA) لتقليص تلك الابعاد. تحليل المركبات الرئيسية العادي (PCA) يكون مجموعة من المتغيرات غير المرتبطة التي تعود الى المتجهات الذاتية المشتقة في مصفوفة التباين المشترك او مصفوفة الارتباط. على كل حال من الجيد معرفة ان مصفوفة التباين المشترك هذه تتأثر بقوة بالمشاهدات المتطرفة لذلك من الضروري ان نضع طريقة حصينة تقاوم الشواذ المحتمل.Li & Chen (1985) قدموا حل يعتمد على ملاحقة البروز Projection Pursuit (PP) الفكرة هي البحث عن الاتجاه الذي فيه تكون المشاهدات البارزة Projected Observations تمتلك اكبر تباين حصين. في خطوات لاحقة كل اتجاه جديد سوف يهيكل كي يكون متعامد مع كل الاتجاهات السابقة. الطريقة وضعت جيدا" كل تتعامل مع بيانات الابعاد العالية حتى عندما يكون عدد المتغيرات (P) اكبر من عدد المشاهدات (n) او مايسمى بالبيانات غير تامة الرتبة او البيانات الناقصة. لهذا فان هذا البحث ينصب على دراسة البيانات الناقصة وخاصة عندما تحتوي مجموعة البيانات تلك على الملوثات او المشاهدات الشاذة ضمن مجموعة البيانات والوصول بعدها الى صورة معتدلة عن تلك البيانات نستطيع من خلالها تطبيق الخوارزميات الحصينة عليها مثل (R,M,S, …) وايجاد المقدرات الحصينة لها والمفاضلة فيما بينها ضمن مجموعة من المعايير.