Россия
Россия
УДК 004.891.3 Диагностические экспертные системы
Одной из серьезных проблем, ограничивающих возможность применения интеллектуальных методов обработки диагностической информации в задачах диагностики сложных технических объектов, является сложность формирования обучающей выборки. Эффективным способом решения проблемы является аугментация (искусственное расширение) обучающих данных. Особенностью обучающих выборок в задачах технической диагностики является неизвестный вид их распределения в пространстве признаков, при том что для обеспечения качественного обучения диагностической модели дополнительные «синтетические» данные должны быть распределены аналогично реальной обучающей выборке. Возможность определения параметров распределения данных обучающей выборки в процессе обучения с последующим воспроизведением этих параметров в сгенерированных выборках может быть реализована в генеративных моделях на основе вариационных автоэнкодеров и генеративно-состязательных сетей. В задачах интеллектуальной классификации состояния объекта диагностирования с размеченными обучающими выборками для генерации дополнительных данных предпочтительным является использование условных (conditional) генеративно-состязательных сетей. Актуальной задачей является оценка однородности обучающей и сгенерированной выборок, по результатам которой определяется длительность (количество эпох) процесса обучения генеративной модели. В работе предложен и обоснован оригинальный способ оценки однородности многомерных выборок на основе G- и F-функций Рипли (Ripley). На его основе определен количественный показатель для контроля качества и продолжительности обучения генеративной модели. Эффективность предложенного способа подтверждается на примере решения задачи аугментации обучающих данных для эталонной диагностической модели газовоздушного тракта тепловозного дизеля.
модель машинного обучения, обучающая выборка, интеллектуальный классификатор, объект диагностирования, генеративно-состязательные сети, аугментация данных, контроль однородности многомерных выборок, пространственный анализ, функция Ripley
1. Федотов М. В. Предиктивная аналитика технического состояния систем тепловозов с использованием нейросетевых прогнозных моделей / М. В. Федотов, В. В. Грачев // Бюллетень результатов научных исследований. - 2021. - № 3. - С. 102-114. - DOI:https://doi.org/10.20295/2223-9987-2021-3-102-114.
2. Федотов М. В. Способы повышения качества обучения нейросетевых диагностических моделей сложных технических объектов / М. В. Федотов, А. Л. Шарапов, В. В. Грачев // Интегрированные модели и мягкие вычисления в искусственном интеллекте ИММВ-2022: Сборник научных трудов XI Международной научно-практической конференции. В 2 томах, Коломна, 16-19 мая 2022 года. Том 1. - Коломна: Общероссийская общественная организация «Российская ассоциация искусственного интеллекта», 2022. - С. 258-267.
3. Воронцов К. В. Лекции по теории обобщающей способности / К. В. Воронцов. - URL: http://www.ccas.ru/voron/download/Generalization.pdf (дата обращения: 07.05.2023).
4. Shorten C. A survey on Image Data Augmentation for Deep Learning / C. Shorten, T. M. Khoshgoftaar // Journal of Big Data. - 2019. - Vol. 6, Article number: 60. - URL: https://journalofbigdataspringeropen.com/articles/10.1186/s40537-019-0197-0 (дата обращения: 07.05.2023).
5. Krizhevsky A. ImageNet classification with deep convolutional neural networks / A. Krizhevsky, I. Sutskever, G. E. Hinton // Adv Neural Inf Process Syst. - 2012. - Iss. 25. - Pp. 1106-1114.
6. Guoliang K. PatchShufe regularization / K. Guoliang, D. Xuanyi, Z. Liang et al. // arXiv preprint, 2017.
7. Zhun Z. Random erasing data augmentation / Z. Zhun, Z. Liang, K. Guoliang // arXiv e-prints, 2017.
8. Ken C. Return of the devil in the details: delving deep into convolutional nets / C. Ken, S. Karen, V. Andrea et al. // Proceedings of BMVC. - 2014.
9. Чернобровов А. Как обмануть нейросеть или что такое Adversarial attack / А. Чернобровов. - 2020. - URL: https://www.chernobrovov.ru/articles/kak-obmanut-nejroset-ili-chto-takoe-adversarial-attack.html (дата обращения: 07.05.2023).
10. Seyed-Mohsen M. D. A simple and accurate method to fool deep neural networks / M. D. Seyed-Mohsen, F. Alhussein, F. Pascal et al. - ArXiv preprint, 2016.
11. Jiawei S. One pixel attack for fooling deep neural networks / S. Jiawei, W. Danilo, K. Sakurai // arXiv preprints, 2018.
12. Сурцуков М. Автоэнкодеры в Keras / М. Сурцуков. - 2017. - URL: https://habr.com/ru/articles/331382/ (дата обращения: 07.05.2023).
13. Goodfellow I. J. Generative Adversarial NetWork / I. J. Goodfellow, J. Pouget-Abadie, M. Mirza et al. - Reprint arXiv: 1406.2661-2014.
14. Mehdi M. Conditional Generative Adversarial Nets / M. Mehdi, S. Osindero // arXiv:1411.1784. - 2014.
15. Как найти сходство между двумя распределениями вероятностей с помощью Python. - 2023. - URL: https://questu.ru/articles/352904/ (дата обращения: 21.06.2023).
16. Ссылка на функцию расстояния Вассерштейна в Python. - 2023. - URL: https://question-it.com/questions/15429235/ssylka-na-funktsiju-rasstojanija-vassershtejna-v-python (дата обращения: 21.06.2023).
17. Грачев В. В. Диагностирование газовоздушного тракта тепловозного дизеля с использованием интеллектуального классификатора / В. В. Грачев, М. В. Федотов, А. В. Грищенко и др. // Бюллетень результатов научных исследований. - 2022. - № 2. - С. 124-140. - DOI:https://doi.org/10.20295/2223-9987-2022-2-124-140.
18. Фостер Д. Генеративное глубокое обучение. Творческий потенциал нейронных сетей / Д. Фостер. - СПб.: Питер, 2020. - 336 с.
19. Методы измерения расстояния и подобия. - 2023. - URL: https://russianblogs.com/article/62221539035/ (дата обращения: 22.06.2023).
20. Rey S. Distance Based Statistical Method for Planar Point Patterns / S. Rey, W. Kang. - URL: https://pysal.org/notebooks/explore/pointpats/distance_statistics.html (дата обращения: 01.07.2023).