Аннотация:
Автоматизированное распознавание принципиальных электрических схем железнодорожной автоматики и телемеханики – актуальная и сложная задача. Алгоритм ее решения
разделяется на несколько специализированных алгоритмов. Основными подзадачами можно
назвать выделение и распознавание: структуры принципиальных электрических схем, текста,
штампа и пр. В данной статье описывается подход к обработке текста на принципиальных
электрических схемах железнодорожной автоматики и телемеханики.
Текстовая информация на этих схемах является крайне важной, без ее анализа невозможно произвести полный перевод данных сканированного изображения в электронный вид.
Предлагаются алгоритм выделения текстовой информации со схемы с применением алгоритма
кластеризации для выделения групп символов и метод составления разделенных уникальных
выражений (лексем) в группе.
Описывается анализ полученных вариантов текстовых выражений и способы выбора
наиболее корректных вариантов. Приводится общая схема процесса обработки принципиальных электрических схем с учетом методов анализа текстовой информации, предлагаемых
в статье.
Описан прототип программы, реализующий разработанные методы, и его использование
на тестовой выборке из 300 печатных и затем отсканированных принципиальных электрических схем разного качества.