Лента ИТ-источников 11467

PDF на все случаи жизни

Разработка и поставка систем: электронного документооборота, архивного дела и кадрового учета; оказание консультационных услуг в области делопроизводства и документооборота; реализация проектов, связанных с созданием отраслевых, региональных и корпоративных систем управления документационной деятельностью.

Большинством пользователей PDF воспринимается как удобный формат для просмотра документов, не более того, поэтому в СЭД должно быть встроено средство просмотра – этим все функциональные требования в отношении работы с PDF-файлами ограничиваются.

Еще принято считать, что PDF – это нередактируемый формат, поэтому в нем можно сохранять и распространять финальные версии документов. Данное заблуждение укоренилось со времен, когда формат был закрытым и для создания PDF-документов нужно было покупать полную версию Adobe Acrobat, а для просмотра был доступен только Arcobat Reader. Это уже давно не так: наберите в поиске “PDF editor” – и вы удивитесь разнообразию средств создания и редактирования PDF, в том числе open source.

Но не спешите бить тревогу и срочно искать замену PDF: этот формат обладает гораздо большим потенциалом для различных сценариев использования в документообороте, чем вы привыкли думать.


PDF в контексте СЭД/ECM

Для применения PDF в СЭД могут быть интересны следующие его возможности:


  • Многослойность: в один файл, в разные слои помещается сканированный образ документа и распознанный текст, причем каждый фрагмент текста, каждое слово сохраняет привязку к координатам в графическом слое. Это позволяет использовать полнотекстовый поиск – на самом деле поиск происходит в тексте, а на экране пользователь видит сканированный образ с подсвеченными термами из запроса.


  • Аннотирование и комментирование: при согласовании документов всем участникам рассылается не Word'овый файл, а PDF, в котором они могут оставлять свои замечания, можно также в разных слоях, чтобы не видеть замечаний друг друга (если это необходимо). Учитывая распространенность iOS-устройств, ноутбуков и планшетов, особенно среди руководителей, это гораздо удобнее.


  • PDF-книга: некоторые приложения умеют компоновать отдельные документов (любых форматов) в один файл, снабжая его титульным листом, оглавлением и сплошной нумерацией. Это востребовано, например, при подготовке к совещаниям — повестка и материалы по всем вопросам легче рассылать на ознакомление в виде одного файла. Также один файл проще печатать, когда людям нужна бумажная копия.


  • PDF-формы: вне конкуренции, когда требуется собрать данные от заявителей или клиентов. В отличие от банальных HTML-форм, когда вся ранее введенная информация пропадает при сбое, даже не до конца заполненную PDF-форму можно сохранить и вернуться к ней позже, когда данные у вас будут все необходимые данные. В действии эту технологию можно видеть, например, на сайте визового центра Великобритании.


Чтение документов — отнюдь не тривиальная задача

С документами, содержащими два-три листа проблем нет, их все равно как читать — в простом текстовом формате, в виде скана, в Word'е, в PDF. Другое дело, когда в документе 50, 100, 300 страниц. За один раз столько не прочитать, человек вынужден останавливаться.

Читая книгу (в бумаге или на iPad), мы обычно делаем закладки — чтобы вернуться к интересующему месту. Почему же не сделать эту функцию для пользователей СЭД? С PDF-документами это сделать достаточно легко, нужно только захотеть.


Для архивного хранения — только PDF/A

Разумеется, PDF по-прежнему хорош для архивного хранения, но в этом случае нужно использовать PDF/A, подмножество стандарта PDF, из которого исключены все возможности, которые привносят динамику и переменчивость, совершенно излишнюю для архива. Это касается javaScript, шифрования, встраивания аудио-видео контента и ряда других «активных» функций.

Поэтому будьте внимательны: не всякий документ с расширением PDF можно принимать в архив!

Для справки: PDF/A — cтандарт ISO 19005-1:2005 (2005 г.), базируется на PDF версии 1.4. Для интересующихся — см. здесь более подробно: PDF/A in a Nutshell 2.0 (PDF for long-term archiving): http://www.pdfa.org/wp-content/uploads/2013/04/PDFA_in_a_Nutshell_21.pdf

PDF-рендиции документов

Рендиции (Renditions) — это представления документа в формате, отличном от оригинального, но с полным соответствием по содержанию. Чаще всего для создания рендиций применяют формат PDF или HTML.

Это нужно для публикации документов из СЭД на корпоративном портале или официальном сайте организации. Следует признать, что PDF гораздо удобнее: его можно просматривать, скачивать и сохранять, что с HTML далеко не всегда получается и не все это умеют.

При этом вы можете не менять привычный процесс разработки и согласования документа, на сайт или портал пойдет только его финальная версия, которая может быть автоматически преобразована в PDF.


Выводы: PDF и СЭД

Итак, мы имеем чрезвычайно богатый возможностями формат, к тому же еще и открытый. Творчески его используя, можно дать пользователям гораздо более высокий уровень сервиса даже в простых повседневных операциях, таких как чтение. И можно придумать много новых сервисов.

Не торопитесь изобретать велосипед: PDF стал общественным достоянием более 5 лет назад. За это время появилось огромное количество разработок, в том числе СПО – поищите хорошенько, может быть писать ничего не придется.

Чтобы увидеть эти новые возможности, нужно прежде всего пересмотреть свои взгляды на СЭД: это не система учета документов, это система работы с документами – не с их атрибутами, с контентом.




© Издание 12NEWS (ИП Маринин А.Л.) 12news.ru, 2014

Опубликовано 17.02.14 13:56
Просмотров 190
Разместил