<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Intellectual Technologies on Transport</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Intellectual Technologies on Transport</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Интеллектуальные технологии на транспорте</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="online">2413-2527</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">93571</article-id>
   <article-id pub-id-type="doi">10.24412/2413-2527-2023-335-51-59</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>Статьи</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>Articles</subject>
    </subj-group>
    <subj-group>
     <subject>Статьи</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">Software Defect Prediction System Based on Well-Tuned Random Forest Technique</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>Система прогнозирования дефектов программного обеспечения на основе хорошо отлаженной техники «случайного леса»</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Хоршид</surname>
       <given-names>Ф Х</given-names>
      </name>
      <name xml:lang="en">
       <surname>Khorsheed</surname>
       <given-names>F H</given-names>
      </name>
     </name-alternatives>
     <email>farah_hatam@uodiyala.edu.iq</email>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Ибрагим</surname>
       <given-names>Н Дж</given-names>
      </name>
      <name xml:lang="en">
       <surname>Ibrahim</surname>
       <given-names>N J</given-names>
      </name>
     </name-alternatives>
     <email>nebras.jalel@uodiyala.edu.iq</email>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Сайхуд</surname>
       <given-names>К </given-names>
      </name>
      <name xml:lang="en">
       <surname>Saihood</surname>
       <given-names>Q </given-names>
      </name>
     </name-alternatives>
     <email>qusaysaihood@au.edu.iq</email>
     <xref ref-type="aff" rid="aff-3"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Университет Диялы</institution>
     <country>ru</country>
    </aff>
    <aff>
     <institution xml:lang="en">University of Diyala</institution>
     <country>ru</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Университет Диялы</institution>
     <country>ru</country>
    </aff>
    <aff>
     <institution xml:lang="en">University of Diyala</institution>
     <country>ru</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-3">
    <aff>
     <institution xml:lang="ru">Университетский колледж Ашура</institution>
     <country>ru</country>
    </aff>
    <aff>
     <institution xml:lang="en">Ashur University College</institution>
     <country>ru</country>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2025-01-11T23:37:28+03:00">
    <day>11</day>
    <month>01</month>
    <year>2025</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2025-01-11T23:37:28+03:00">
    <day>11</day>
    <month>01</month>
    <year>2025</year>
   </pub-date>
   <issue>3</issue>
   <fpage>51</fpage>
   <lpage>59</lpage>
   <history>
    <date date-type="received" iso-8601-date="2025-01-11T23:14:51+03:00">
     <day>11</day>
     <month>01</month>
     <year>2025</year>
    </date>
   </history>
   <self-uri xlink:href="https://atjournal.ru/en/nauka/article/93571/view">https://atjournal.ru/en/nauka/article/93571/view</self-uri>
   <abstract xml:lang="ru">
    <p>Качество программного обеспечения является основным критерием для повышения спроса пользователей на программное обеспечение. Поэтому компании, занимающиеся программным обеспечением, стремятся обеспечить качество программного обеспечения путем прогнозирования его дефектов на этапе тестирования. Наличие интеллектуальной системы, способной прогнозировать дефекты программного обеспечения, значительно снижает затраты времени и усилий. Несмотря на широкую тенденцию разработки систем прогнозирования дефектов программного обеспечения на основе техники машинного обучения в последние несколько лет, точность этих систем по-прежнему является серьезной проблемой.&#13;
В данном исследовании для повышения точности прогноза представлена система прогнозирования дефектов программного обеспечения, состоящая из трех этапов. На первом этапе выполняется предварительная обработка данных, которая включает в себя очистку данных, баланс данных, нормализацию данных и выбор признаков. На втором этапе гиперпараметры настраиваются по методике Grid Search. Наконец, хорошо отлаженная техника машинного обучения реализована для предсказания дефектов программного обеспечения.&#13;
На базе набора данных JM1 были проведены эксперименты, в ходе которых предлагаемая система дала многообещающие результаты в прогнозировании недостатков программного обеспечения. Среди используемых методов хорошо настроенный метод Random Forest с точностью 88,26&amp;nbsp;% превзошел остальные используемые методы машинного обучения. Проведенное исследование доказывает, что выбор важных особенностей и эффективная гиперпараметрическая настройка методов машинного обучения значительно улучшают точность прогнозирования дефектов программного обеспечения.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>Software quality is the main criterion for increasing user demand for software. Therefore, software companies seek to ensure software quality by predicting software defects in the software testing phase. Having an intelligent system capable of predicting software defects helps greatly in reducing time and effort consumption. Despite the great trend to develop software defect prediction systems based on Machine Learning techniques in last few years, the accuracy of these systems is still a major challenge.&#13;
Therefore, in this study, a software defect prediction system based on three stages is presented to improve the prediction accuracy. First stage, data pre-processing is performed, which includes (data cleaning, data balance, data normalization, and feature selection). Second stage the hyperparameters of ML are tuned using Grid Search technique. Finally, a well-tuned ML technique is implemented to predict software defects.&#13;
Performance experiments were carried out on the JM1 dataset where the proposed system achieved promising results in predicting software defects. Among ML techniques used, a well-tuned RF technique outperformed the rest of the used ML techniques, in addition to the techniques mentioned in previous works, with an accuracy of 88,26&amp;nbsp;%. This study proves that the selection of important features and efficient hyperparameter tuning of ML techniques significantly improve the accuracy of software defect prediction.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>машинное обучение</kwd>
    <kwd>случайный лес</kwd>
    <kwd>дефекты программного обеспечения</kwd>
    <kwd>выбор признаков</kwd>
    <kwd>прогнозирование</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>machine learning</kwd>
    <kwd>Random Forest</kwd>
    <kwd>software defects</kwd>
    <kwd>feature selection</kwd>
    <kwd>prediction</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p></p>
 </body>
 <back>
  <ref-list/>
 </back>
</article>
