Exploring Consistent Feature Selection for Software Fault Prediction: An XAI-based model-agnostic Approach
Julkaisuvuosi
2025
Tekijät
Khan, Adam; Ali, Asad; Khan, Jahangir; Ullah, Fasee; Faheem, Muhammad
Abstrakti:
<p>Numerous Feature Selection (FS) techniques have been widely utilized in Software Engineering (SE) to enhance the predictive accuracy of Machine Learning (ML) models. However, how consistently these FS techniques extract features under various data changes (made to the training data) remains underexplored. While prior studies have assessed the stability of traditional FS techniques (e.g., Information Gain, Genetic Search, etc.), their findings remain limited. With the growing use of eXplainable Artificial Intelligence (XAI) in SE, it is important to assess the level of consistency of model-agnostic FS techniques to ensure their reliability within dynamic learning environments. This study evaluates the consistency of Permutation Feature Importance (PFI) and SHapley Additive exPlanations (SHAP), across five ML models, i.e., Linear Regression(LR). Multi-layer Perceptron (MLP), Random Forest (RF), Decision Trees (DT), Support Vector Machines(SVM), on six Software Fault Prediction datasets under various validation methods (such as 3-fold, Bootstrap etc.), data normalization, and dataset modifications. The findings reveal that model-agnostic FS shows higher consistency than traditional FS techniques across all changes. In the case of validation-based consistency and using the SHAP, SVM and DT achieve the highest average feature consistency (100%), while MLP achieves the lowest (74.27%). Similarly, using PFI, LR, DT, and SVM achieves 100% consistency, whereas MLP remains the lowest consistency at 44.03%. In the case of data change-based consistency, using SHAP, MLP achieves the highest consistency (76.20%), whereas SVM has the lowest (70.98%). Using PFI, RF achieves the highest average consistency (77.24%), and MLP is the least consistent (44.93%). Similarly, in an overall comparison, both XAI-based techniques outperform traditional techniques, confirming their reliability for SFP tasks.</p>
Näytä enemmänOrganisaatiot ja tekijät
Teknologian tutkimuskeskus VTT Oy
Faheem Muhammad
Julkaisutyyppi
Julkaisumuoto
Artikkeli
Emojulkaisun tyyppi
Lehti
Artikkelin tyyppi
Alkuperäisartikkeli:
Yleisö
TieteellinenVertaisarvioitu
VertaisarvioituOKM:n julkaisutyyppiluokitus
A1 Alkuperäisartikkeli tieteellisessä aikakauslehdessäJulkaisukanavan tiedot
Lehti/Sarja
Volyymi
13
Sivut
75493-75524
ISSN
Julkaisufoorumi
Julkaisufoorumitaso
1
Avoin saatavuus
Avoin saatavuus kustantajan palvelussa
Kyllä
Julkaisukanavan avoin saatavuus
Kokonaan avoin julkaisukanava
Kustantajan version lisenssi
CC BY
Rinnakkaistallennettu
Ei
Muut tiedot
Tieteenalat
Sähkö-, automaatio- ja tietoliikennetekniikka, elektroniikka
Avainsanat
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Tunnistettu aihe
[object Object]
Kieli
englanti
Kansainvälinen yhteisjulkaisu
Kyllä
Yhteisjulkaisu yrityksen kanssa
Ei
DOI
10.1109/ACCESS.2025.3558913
Julkaisu kuuluu opetus- ja kulttuuriministeriön tiedonkeruuseen
Kyllä