Как встроить OCR в кадровый документооборот
Рассказываем, как с помощью OCR организовать потоковый найм сотрудников в любой области
23 открытий312 показов
Масштабирование бизнеса и прием на работу новых сотрудников – это всегда здорово. Для всех за исключением кадровиков. С точки зрения кадровой службы очередной новый сотрудник – это гора документов, начиная с паспорта РФ (или другой страны), трудовой книжки, дипломов, СНИЛС и заканчивая различными справками и специфическими документами вроде удостоверения сварщика или прав тракториста.
Мы в Smart Engines создаем профессиональные системы распознавания, которые делают работу с документами быстрее, а повседневную жизнь – приятнее. В этой статье расскажем, как с помощью нашего OCR-движка можно автоматизировать найм сотрудников из любых стран без бюрократии, раздражения и финансовых потерь.
Зачем автоматизировать кадровый документооборот
В соответствии с законодательством (ст. 65 ТК), для трудоустройства работодатель обязан получить и внести в систему документооборота ряд обязательных документов нового сотрудника. В этот комплект входит паспорт (основной разворот и страница с пропиской), СНИЛС, трудовая книжка или сведения о трудовой деятельности по форме СТД-Р/СТД-СФР, а также документы об образовании – дипломы, аттестаты и прочее. Кроме того, необходимы документы воинского учета (для военнообязанных), справка об отсутствии судимости и, в отдельных случаях, медкнижка, водительские права и еще много разных документов.
Если происходит найм иностранных граждан, необходимо также предоставить разрешение на работу (патент) или вид на жительство. Без этого оформление сотрудника может повлечь за собой серьезные штрафы по ст. 18.15 КоАП. Все эти бумажные документы (а при удаленном найме – их скан-копии) требуется занести в систему кадрового электронного документооборота. Делать это вручную значит обрекать кадровика на часы монотонного труда, а работодателя – на прямые финансовые потери. Ручная перепечатка просто отделяет момент, когда новый сотрудник будет полноценно оформлен и сможет приступить к работе.
При массовом найме, особенно на производстве, в логистике, строительстве, такси и доставке, бюрократические проволочки становятся причиной сбоев в бизнес-процессах. Кроме того, ручная перепечатка чревата ошибками, несоответствием в данных и другими неприятными ситуациями, создающими работодателю дополнительную головную боль. Именно в этом месте делу может помочь качественная система распознавания.
Наш флагманский продукт Smart Document Engine позволяет быстро осуществлять распознавание документов на фотографиях и сканах с помощью любых устройств. Благодаря тщательной алгоритмической оптимизации, наша технология OCR может без проблем интегрироваться как на сервера компании, так и в десктопные и мобильные приложения, а также веб-страницы и мессенджеры. Почитать подробнее про интеграцию в iOS, Android и мини-приложения мессенджеров можно по ссылкам. Все это позволяет добавить возможность сканирования кадровых документов буквально в любую ИТ-инфраструктуру и моментально получать данные, просто наведя камеру на документ или загрузив его изображение.
Как работает система распознавания в кадровой служба
О скорости мы заговорили не просто так – проведенные замеры на базовом комплекте из 12 документов (сканы и фото основного разворота паспорта и страницы с пропиской, СНИЛС, ИНН, трудовой книжки, СТД-Р, военного билета, свидетельств ЗАГС о браке и рождении, диплома об образовании, загранпаспорта и водительского удостоверения) продемонстрировали скорость работы нашей технологии в 100 комплектов за 1 минуту на сервере без GPU. Даже при пиковой нагрузке отклик составляет всего пару секунд. Это позволяет организовать потоковый ввод данных в систему кадрового документооборота без времязатрат и бюрократии.
Решение одинаково уверенно работает с печатным и рукописным текстом (что особенно актуально, если происходит распознавание паспорта или трудовой), а также с мятыми, изогнутыми и снятыми под углом документами. Smart Document Engine автоматически находит и классифицирует документ на изображении, извлекает данные и передает их в систему в готовом структурированном виде. При этом ни данные, ни изображения документов не покидают контура устройства, а также не требуется интернет-соединение и GPU. Это позволяет сделать распознавание документов безопасным и защитить пользователя от рисков утечки персональных данных.
Еще одной особенностью Smart Document Engine является поддержка тысяч разных документов (включая упомянутые выше права тракториста и удостоверение сварщика). Система позволяет сканировать документы трудовых мигрантов из всех стран СНГ, Китая, Индии, Пакистана и любых других регионов мира. В этом смысле искусственный интеллект давно превзошел рядового кадровика – он знает значительно больше документов (и языков) и самостоятельно извлекает необходимые реквизиты. В своих разработках мы придерживаемся принципов объяснимого искусственного интеллекта, поэтому вместе с результатами распознавания система предоставляет метрики уверенности по каждому из символов и дает возможность поэтапно проследить весь процесс.
При необходимости можно настроить распознавание собственных типовых форм с печатным, рукопечатным и рукописным заполнением – например, согласия на обработку персональных данных или корпоративных анкет и заявлений о перечислении заработной платы. Для этого мы разработали дизайнер форм, позволяющий настроить распознавание нового типа документа день в день без навыков программирования.
Как встроить OCR в КЭДО
Если вы работаете в облачной КЭДО, платформа, как правило, дает вам какое-то API и право на исполнение своего javascript, но это даже не обязательно. Выполнять свой javascript на любой веб-странице можно через расширение к браузеру, тем самым внедрив распознавание в продукты, которые для этого не предназначались.
Имея в своей локальной сети развернутый веб-сервер с нашим продуктом, вам достаточно послать на endpoint изображение с параметрами распознавания и дождаться ответа.
Например:
(Для демонстрации мы сократили body, где находится закодированное в base64 изображение)
Можно сразу пересылать изображение не в виде строки, а, например, с локального диска в выбранном пользователем формате.
В ответ вы получаете json с обнаруженным типом документа, его полями, значением уверенности системы в результате каждого поля и атрибутами.
Поддержка HTTP настолько распространена, что позволяет осуществить распознавание даже в устаревшем программном продукте. Например, непотопляемый Visual Basic в Excel (или его открытые аналоги), позволяет и сегодня спокойно выводить данные для обработки во внешние сервисы.
Бывают и ситуации, когда у вас есть только один сканер, который сбрасывает картинки в папку, и одна таблица в excel. Даже здесь можно поручить утилите gulpjs отслеживание новых файлов и передачу их по HTTP протоколу.
Для подобных случаев мы разработали кроссплатформенный REST-API сервер, который требует минимальных временных затрат на внедрение. После его установки и запуска вам становится доступен Swagger API, где вы интерактивно генерируете необходимые HTTP-запросы для вашей интеграции.
Что мы имеем в итоге
Итак, добавление технологий распознавания не создает существенных проблем для ИТ-специалиста. А некоторые задачи – например, настройку нового шаблона распознавания в дизайнере форм – можно спокойно делегировать даже сотруднику без навыков программирования. В результате можно быстро интегрировать и адаптировать систему распознавания под любые кадровые (и не только) комплекты документов, и навсегда забыть о рутинной перепечатке данных, потере времени и ресурсов.
А мы в Smart Engines продолжаем работать над повышением качества и скорости работы наших систем. Наш движок хорош в любых задачах распознавания вне зависимости от платформ, видов документов и сферы деятельности клиента. Ранее мы рассказывали об интеграции OCR в бухгалтерии, а скоро будут новые материалы, оставайтесь на связи!
23 открытий312 показов





