Аннотация:
В данной статье говорится о модуле распознавания структуры монтажной технической
документации железнодорожной автоматики и телемеханики. Данный модуль предлагается
в качестве дополнения и улучшения специализированного программного комплекса распознавания монтажной технической документации. Работа модуля условно делится на пять этапов
распознавания. Первый – определение типа распознаваемого документа. Второй – распознавание базовых элементов документа, которые используются в работе последующих алгоритмов.
В зависимости от типа распознаваемого документа на последующих этапах используются
разные алгоритмы. Третий этап – сортировка полученных элементов и нахождение закономерностей в документе – это необходимо для выявления не распознанных на предыдущем
этапе элементов схемы. Далее полученные данные сравниваются с известными шаблонами
монтажной документации. В случае, если документ не относится к известным типам монтаж-
ной документации, используются найденные закономерности. На последнем этапе идет поиск
пропущенных элементов монтажной схемы, если таковые имеются. Подробно рассмотрены
алгоритмы распознавания табличных структур документов, в частности алгоритм поиска
базовых элементов и алгоритм нахождения пропущенных элементов. Приведено сравнение
эффективности рассмотренного в статье модуля с существующим наиболее технологичным
аналогом. Показаны результаты тестирования модуля на различных видах монтажных документов.
Ключевые слова:
электронный документооборот; программный комплекс распознавания монтажной технической документации; распознавание структуры монтажных схем