Категория: Электронное моделирование

Авторы:

Василенко М. Н. , Ковалев Р. А.

Аннотация:
Автоматизированное распознавание принципиальных электрических схем железнодорожной автоматики и телемеханики – актуальная и сложная задача. Алгоритм ее решения разделяется на несколько специализированных алгоритмов. Основными подзадачами можно назвать выделение и распознавание: структуры принципиальных электрических схем, текста, штампа и пр. В данной статье описывается подход к обработке текста на принципиальных электрических схемах железнодорожной автоматики и телемеханики. Текстовая информация на этих схемах является крайне важной, без ее анализа невозможно произвести полный перевод данных сканированного изображения в электронный вид. Предлагаются алгоритм выделения текстовой информации со схемы с применением алгоритма кластеризации для выделения групп символов и метод составления разделенных уникальных выражений (лексем) в группе. Описывается анализ полученных вариантов текстовых выражений и способы выбора наиболее корректных вариантов. Приводится общая схема процесса обработки принципиальных электрических схем с учетом методов анализа текстовой информации, предлагаемых в статье. Описан прототип программы, реализующий разработанные методы, и его использование на тестовой выборке из 300 печатных и затем отсканированных принципиальных электрических схем разного качества.

Ключевые слова:
электронный документооборот; техническая документация; распознавание образов; распознавание текста; принципиальные схемы


Скачать статью