Повышение качества обучения эталонных диагностических моделей сложных технических объектов аугментацией обучающих данных
Аннотация и ключевые слова
Аннотация (русский):
Одной из серьезных проблем, ограничивающих возможность применения интеллектуальных методов обработки диагностической информации в задачах диагностики сложных технических объектов, является сложность формирования обучающей выборки. Эффективным способом решения проблемы является аугментация (искусственное расширение) обучающих данных. Особенностью обучающих выборок в задачах технической диагностики является неизвестный вид их распределения в пространстве признаков, при том что для обеспечения качественного обучения диагностической модели дополнительные «синтетические» данные должны быть распределены аналогично реальной обучающей выборке. Возможность определения параметров распределения данных обучающей выборки в процессе обучения с последующим воспроизведением этих параметров в сгенерированных выборках может быть реализована в генеративных моделях на основе вариационных автоэнкодеров и генеративно-состязательных сетей. В задачах интеллектуальной классификации состояния объекта диагностирования с размеченными обучающими выборками для генерации дополнительных данных предпочтительным является использование условных (conditional) генеративно-состязательных сетей. Актуальной задачей является оценка однородности обучающей и сгенерированной выборок, по результатам которой определяется длительность (количество эпох) процесса обучения генеративной модели. В работе предложен и обоснован оригинальный способ оценки однородности многомерных выборок на основе G- и F-функций Рипли (Ripley). На его основе определен количественный показатель для контроля качества и продолжительности обучения генеративной модели. Эффективность предложенного способа подтверждается на примере решения задачи аугментации обучающих данных для эталонной диагностической модели газовоздушного тракта тепловозного дизеля.

Ключевые слова:
модель машинного обучения, обучающая выборка, интеллектуальный классификатор, объект диагностирования, генеративно-состязательные сети, аугментация данных, контроль однородности многомерных выборок, пространственный анализ, функция Ripley
Список литературы

1. Федотов М. В. Предиктивная аналитика технического состояния систем тепловозов с использованием нейросетевых прогнозных моделей / М. В. Федотов, В. В. Грачев // Бюллетень результатов научных исследований. - 2021. - № 3. - С. 102-114. - DOI:https://doi.org/10.20295/2223-9987-2021-3-102-114.

2. Федотов М. В. Способы повышения качества обучения нейросетевых диагностических моделей сложных технических объектов / М. В. Федотов, А. Л. Шарапов, В. В. Грачев // Интегрированные модели и мягкие вычисления в искусственном интеллекте ИММВ-2022: Сборник научных трудов XI Международной научно-практической конференции. В 2 томах, Коломна, 16-19 мая 2022 года. Том 1. - Коломна: Общероссийская общественная организация «Российская ассоциация искусственного интеллекта», 2022. - С. 258-267.

3. Воронцов К. В. Лекции по теории обобщающей способности / К. В. Воронцов. - URL: http://www.ccas.ru/voron/download/Generalization.pdf (дата обращения: 07.05.2023).

4. Shorten C. A survey on Image Data Augmentation for Deep Learning / C. Shorten, T. M. Khoshgoftaar // Journal of Big Data. - 2019. - Vol. 6, Article number: 60. - URL: https://journalofbigdataspringeropen.com/articles/10.1186/s40537-019-0197-0 (дата обращения: 07.05.2023).

5. Krizhevsky A. ImageNet classification with deep convolutional neural networks / A. Krizhevsky, I. Sutskever, G. E. Hinton // Adv Neural Inf Process Syst. - 2012. - Iss. 25. - Pp. 1106-1114.

6. Guoliang K. PatchShufe regularization / K. Guoliang, D. Xuanyi, Z. Liang et al. // arXiv preprint, 2017.

7. Zhun Z. Random erasing data augmentation / Z. Zhun, Z. Liang, K. Guoliang // arXiv e-prints, 2017.

8. Ken C. Return of the devil in the details: delving deep into convolutional nets / C. Ken, S. Karen, V. Andrea et al. // Proceedings of BMVC. - 2014.

9. Чернобровов А. Как обмануть нейросеть или что такое Adversarial attack / А. Чернобровов. - 2020. - URL: https://www.chernobrovov.ru/articles/kak-obmanut-nejroset-ili-chto-takoe-adversarial-attack.html (дата обращения: 07.05.2023).

10. Seyed-Mohsen M. D. A simple and accurate method to fool deep neural networks / M. D. Seyed-Mohsen, F. Alhussein, F. Pascal et al. - ArXiv preprint, 2016.

11. Jiawei S. One pixel attack for fooling deep neural networks / S. Jiawei, W. Danilo, K. Sakurai // arXiv preprints, 2018.

12. Сурцуков М. Автоэнкодеры в Keras / М. Сурцуков. - 2017. - URL: https://habr.com/ru/articles/331382/ (дата обращения: 07.05.2023).

13. Goodfellow I. J. Generative Adversarial NetWork / I. J. Goodfellow, J. Pouget-Abadie, M. Mirza et al. - Reprint arXiv: 1406.2661-2014.

14. Mehdi M. Conditional Generative Adversarial Nets / M. Mehdi, S. Osindero // arXiv:1411.1784. - 2014.

15. Как найти сходство между двумя распределениями вероятностей с помощью Python. - 2023. - URL: https://questu.ru/articles/352904/ (дата обращения: 21.06.2023).

16. Ссылка на функцию расстояния Вассерштейна в Python. - 2023. - URL: https://question-it.com/questions/15429235/ssylka-na-funktsiju-rasstojanija-vassershtejna-v-python (дата обращения: 21.06.2023).

17. Грачев В. В. Диагностирование газовоздушного тракта тепловозного дизеля с использованием интеллектуального классификатора / В. В. Грачев, М. В. Федотов, А. В. Грищенко и др. // Бюллетень результатов научных исследований. - 2022. - № 2. - С. 124-140. - DOI:https://doi.org/10.20295/2223-9987-2022-2-124-140.

18. Фостер Д. Генеративное глубокое обучение. Творческий потенциал нейронных сетей / Д. Фостер. - СПб.: Питер, 2020. - 336 с.

19. Методы измерения расстояния и подобия. - 2023. - URL: https://russianblogs.com/article/62221539035/ (дата обращения: 22.06.2023).

20. Rey S. Distance Based Statistical Method for Planar Point Patterns / S. Rey, W. Kang. - URL: https://pysal.org/notebooks/explore/pointpats/distance_statistics.html (дата обращения: 01.07.2023).

Войти или Создать
* Забыли пароль?