Pоссийский разработчик ПО, группа компаний «Когнитивные технологии» (CognitiveTechnologies), разработала и внедрила в Фонде социального страхования РФ интеллектуальную систему массового ввода и обработки документов со сложным фоном.
Основная проблема, стоявшая перед разработчиками, состояла в создании алгоритмов распознавания документов Фонда: описей заявлений и документов, необходимых для назначения пособия, заявлений застрахованных лиц на назначение пособия, листков нетрудоспособности, - где полезная текстовая информация размещается на гербовом фоне, водяных знаках, гильоширном узоре, бумаге с ворсом, штампах, печатях. Потоковая автоматизированная обработка документов такого класса до последнего времени считалась крайне сложной.
Рис. 1. Пример наложения печати на текстовую информацию
Фонд социального страхования Российской Федерации (ФСС РФ) — государственный внебюджетный фонд, предоставляющий услуги обязательного социального страхования гражданам России. Организация работает во всех субъектах федерации и ежегодно обрабатывает до 50 миллионов документов. В современных условиях такая структура может эффективно функционировать только при наличии хорошо продуманной интегрированной системы сбора и обработки информации.
Для решения поставленной задачи командой разработчиков был создан программный модуль Cognitive Guilloché, предназначенный для распознавания деловых документов со сложным фоном.
В рамках проекта разработчиками были также решены две проблемы, представляющие серьезный научно-практический интерес:
- «быстрая» идентификация типа документа в рамках единого потока, представленного шестью различными формами;
- обеспечение надлежащей скорости и точности обработки информации.
«Для того чтобы удовлетворить требованиям технического задания нам пришлось обеспечить такую скорость и точность распознавания, как если бы у документов не было никакого фона», - рассказывает к.т.н., Владимир Викторович Арлазаров, руководитель технологической лаборатории массового ввода документов CognitiveForms. «В сущности, нам пришлось научить систему «видеть» и «понимать» документы так же, как это делаем мы с вами», — резюмирует Владимир Арлазаров.
Следует отметить, что проект стал одним из первых в России, в котором обрабатываемые документы с фоном высокой сложности заполняются от руки. Прежние разработки, главным образом, обеспечивали ввод форм с печатным текстом.
Разработчики также отмечают, что одним из камней преткновения также была задача отличить защитную линию фона документа от линии штриха буквы. В отдельных случаях это сложно сделать даже человеку.
Рис 2,3. Примеры наложения линий защитного фона документа на текстовые поля и текстовую информацию.
Проект массового ввода документов ФСС РФ был реализован на базе технологии массового ввода документов Cognitive Forms. В его рамках была осуществлена интеграция с системой документооборота и инфраструктурой открытых ключей электронной подписи ФСС РФ.
Важно, что разработанная система удовлетворяет всем требованиям заказчика по обеспечению информационной безопасности и защиты персональных данных граждан. В этой области у CognitiveTechnologiesнакоплен многолетний опыт создания информационных систем для силовых ведомств, включающий реализацию систем безопасности и защиты информации.
Проект был реализован в центральном офисе ФСС РФ, а также в восьми пилотных субъектах РФ: Нижегородская, Новгородская, Тамбовская, Новосибирская, Курганская, Астраханская области, Хабаровский край и Карачаево-Черкесия.
«Наши технологии обработки информации уже более 15 лет надежно работают в крупнейших отечественных организациях, связанных с массовым обслуживанием населения. В их числе обработка анкет Пенсионного фонда РФ, социальных карточек студентов и пенсионеров для московского метрополитена, анкет на выдачу новых, биометрических паспортов, обеспечение автоматического голосования акционеров Газпрома, ввод платежных документов Сбербанка РФ», - говорит Президент CognitiveTechnologies Ольга Ускова. «Для развития и совершенствования наших технологий, расширения областей их применения и предоставления новых возможностей по автоматизации различных бизнес-процессов нашим пользователям, мы непрерывно инвестируем в фундаментальные и прикладные исследования в области обработки изображений, машинного зрения, bigdata и других перспективных направлений», подчеркнула Ускова.
© Издание 12NEWS (ИП Маринин А.Л.) 12news.ru, 2013