Автоматизированное распознавание принципиальных электрических схем железно-дорожной автоматики и телемеханики - актуальная и сложная задача. Алгоритм ее решения разделяется на несколько специализированных алгоритмов. Основными подзадачами можно назвать выделение и распознавание: структуры принципиальных электрических схем, текста, штампа и пр. В данной статье описывается подход к обработке текста на принципиальных электрических схемах железнодорожной автоматики и телемеханики.Текстовая информация на этих схемах является крайне важной, без ее анализа невозможно произвести полный перевод данных сканированного изображения в электронный вид. Предлагаются алгоритм выделения текстовой информации со схемы с применением алгоритма кластеризации для выделения групп символов и метод составления разделенных уникальных выражений (лексем) в группе.Описывается анализ полученных вариантов текстовых выражений и способы выбора наиболее корректных вариантов. Приводится общая схема процесса обработки принципиальных электрических схем с учетом методов анализа текстовой информации, предлагаемых в статье.Описан прототип программы, реализующий разработанные методы, и его использование на тестовой выборке из 300 печатных и затем отсканированных принципиальных электрических схем разного качества.
электронный документооборот, техническая документация, распознавание образов, распознавание текста, принципиальные схемы
1. Балуев Н. Н. Проблемы внедрения отраслевого формата / Н. Н. Балуев, М. Н. Василенко, В. Г. Трохов, Д. В. Седых // Автоматика, связь, информатика. - 2010. -№ 3. - С. 2.
2. Булавский П. Е. Оценка качества технической документации на системы ЖАТ / П. Е. Булавский // Автоматика, связь, информатика. - 2011. - № 8. - С. 37-39.
3. Булавский П. Е. Электронный документооборот технической документации / П. Е. Булавский, Д. С. Марков // Автоматика, связь, информатика. - 2012. - № 2. - С. 2-5.
4. Булавский П. Е. Синтез формализованной схемы электронного документооборота систем железнодорожной автоматики и телемеханики / П. Е. Булавский, Д. С. Марков // Известия Петербургского университета путей сообщения. -2013. - № 2. - С. 108-115.
5. Денисов Б. П. Автоматизация проектирования систем железнодорожной автоматики и телемеханики на базе АРМ-ПТД версии 6 / Б. П. Денисов, Н. И. Рубинштейн, С. Н. Растегаев, Н. Ю. Воробей // Актуальные вопросы развития систем железнодорожной автоматики и телемеханики : сб. науч. тр. ; под ред. Вл. В. Сапожникова. - СПб. : Петербургский гос. ун-т путей сообщения, 2013. - С. 66-74.
6. Василенко М. Н. Электронный документооборот в хозяйстве СЦБ / М. Н. Василенко, В. Г. Трохов, Д. В. Зуев // Автоматика связь, информатика. - 2014. - № 8. - С. 2-3.
7. Матушев А. А. Программный комплекс для распознавания монтажной технической документации / А. А. Матушев // Известия Петербургского университета путей сообщения. - 2015. - № 1. - С. 105-109.
8. Василенко М. Н. Развитие электронного документооборота в хозяйстве АТ / М. Н. Василенко, В. Г. Трохов, Д. В. Зуев, Д. В. Седых // Автоматика связь, информатика. - 2015. - № 1. - С. 14-16.
9. Зуев Д. В. Синтез объектной нейросетевой модели распознавания образов и ее применение в задачах железнодорожной автоматики : дис. … канд. техн. наук :05.13.18 / Зуев Денис Владимирович. - СПб., 2013. - 122 с.
10. Матушев А. А. Распознавание структуры монтажных схем ЖАТ / А. А. Матушев, Д. В. Седых // Автоматика, связь, информатика. - 2015. - № 10. - С. 4-7.
11. Ester M. A density-based algorithm for discovering clusters in large spatial data-bases with noise / M. Ester, H.-P. Kriegel, J. Sander, X. Xu, E. Simoudis, J. Han, U. Fayyad // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). - AAAI Press. - Pp. 226-231.
12. Левитин А. В. Алгоритмы. Введение в разработку и анализ / А. В. Левитин. - М. : Вильямс, 2006. - 576 с.