Распознать документ

Активити Распознать документ позволяет извлекать данные из документов методами Smart Engines или Intellect lab с помощью искусственного интеллекта.

Для извлечения данных из официальных документов (паспорт, СНИЛС, виза и т. д.) можно использовать модуль Smart Engines. Это инструмент для распознавания паспортов и других идентификационных документов России и других стран. Для распознавания доступны документы в форматах .pdf и .jpg.

По умолчанию модуль представлен только для ознакомления в качестве ограниченной версии. При этом часть символов распознаваемых данных скрывается. Для активации полной версии требуется приобрести лицензию. Чтобы получить более подробную информацию, напишите на почту info@elma-rpa.ru.

Для распознавания документов типа «счет-фактура» и «универсальный передаточный документ» можно использовать модуль Intellect lab. Для распознавания доступны документы в формате .pdf. Модуль разворачивается на отдельном сервере и лицензируется отдельно от платформы. Чтобы получить полную информацию, обратитесь к вашему менеджеру по продажам.

Вы можете указать контекстные переменные, в которые требуется сохранить распознанный текст, и использовать их в процессе. Подробнее о контекстных переменных можно прочитать в статье «Контекст процесса».

Настройки активити

Чтобы открыть окно настроек, нажмите на активити на графической модели процесса.

Вкладка «Параметры»

На вкладке Параметры отображаются основные параметры активити:

  • Наименование — название активити на графической модели процесса. При добавлении активити его название задается по шаблону. В этом поле название можно изменить;
  • Документ — документ, данные из которого требуется извлечь. Для выбора доступны контекстные переменные процесса типа Файл. Вы можете добавить новую переменную, нажав plus-grey. Подробнее о создании контекстных переменных читайте в статье «Контекст процесса».
  • Метод распознавания — выбор метода распознавания.

Распознавание документов методом Smart Engines

Для извлечения данных из официальных документов (паспорт, СНИЛС, виза и т. д.) можно использовать модуль Smart Engines. Это инструмент для распознавания паспортов и других идентификационных документов России и других стран.

По умолчанию он представлен только для ознакомления в качестве ограниченной версии. При этом часть символов распознаваемых данных скрывается. Для активации полной версии требуется приобрести лицензию. Чтобы получить более подробную информацию, напишите на почту info@elma-rpa.ru.

После того как вы выберете метод Smart Engines, заполните следующие поля:

document-recognition-1

  • Страна — выбор страны, которой принадлежит распознаваемый документ;
  • Тип распознаваемого документа — выбор типа документа (виза, паспорт, свидетельство о рождении, ИНН и т. д.).

Распознавание документов методом Intellect lab

После того как вы выберете метод Intellect lab, заполните следующие поля:

document-recognition-2

  • Укажите сервер — адрес сервера Intellect lab;
  • Ожидание ответа от сервера (сек) — время ожидания ответа от сервера, по истечении которого процесс продолжит выполняться;
  • Тип распознаваемого документа — выбор типа документа для распознавания: счет-фактура или УПД. Если вы не уверены в типе выбранного документа, можно указать оба варианта;
  • Возвращаемый тип документа — переменная, в которой будет храниться тип распознанного документа. Вы можете выбрать переменную из списка или создать новую, нажав plus-grey. Подробнее о создании контекстных переменных читайте в статье «Контекст процесса».

Чтобы задать, какие данные нужно извлечь из документа, и указать переменные, в которые они будут сохранены, нажмите на кнопку Назначить переменные. Далее вы увидите реквизиты выбранного типа документа. Для каждого документа задан свой набор реквизитов.

recognize-document-2

Для каждого реквизита можно выбрать контекстную переменную процесса, в которую сохраняются данные. Вы также можете создать новую переменную, нажав plus-grey. Чтобы удалить переменную, нажмите на значок delete-icon-5.

При распознавании методом Smart Engines в окне отображается точность распознавания выбранного реквизита. Она определяет порог требуемой точности (уверенности) распознавания и зависит от множества факторов. Один из самых значимых — качество изображения документа. Например, вы указали 90% (0.9). Это означает, что, если уверенность в распознавании составляет 90% и выше, вы разрешаете получить распознанное значение. При точности менее 90% значение не принимается, т.е. контекстная переменная не будет заполняться.

При небольшой требуемой точности увеличивается вероятность получить данные с ошибкой. Поэтому нужно аккуратно подбирать этот параметр. В первую очередь нужно учитывать качество документов. Если вы уверены, что оно хорошее, то можно указать точность 97% и выше. Если качество несколько ниже, лучше указать 94%. Если оно будет плохим, можно ввести точность около 90% или ниже.

Если данные не будут распознаны, то процесс прекратится, и возникнет ошибка. Чтобы избежать прерывания процесса, предусмотрите эскалацию для этого активити. Подробнее об эскалации читайте в статье «Поток исполнения».

Вы можете искать реквизиты документов по их названиям. Для этого в строке поиска начните вводить название. Результаты поиска сразу отобразятся в таблице.

Все выбранные реквизиты и переменные отображаются в блоке Извлекаемые данные.

Вкладка «Обработчики»

О вкладке Обработчики можно прочитать в статье «Общие принципы настройки активити».

Нашли опечатку? Выделите текст, нажмите ctrl + enter и оповестите нас