Анализ неструктурированных электронных документов как средство оптимизации корпоративной информационной системы



страница3/12
Дата24.04.2018
Размер1.08 Mb.
1   2   3   4   5   6   7   8   9   ...   12

Электронный документооборот


Автоматизация документооборота компании, в настоящее время, стала одной из типичных задач компании, стремящейся к автоматизации своего производства, а также всех процессов, протекающих в ней. Данное явление обусловлено тем, что документы в компании – это самое распространенное средство поддержки выполнения бизнес-процессов, обеспечивающее фиксацию и перенос информации от одного исполнителя к другому. Таким образом, эффективность выполнения бизнес-процессов организации во многом определяется скоростью и качеством протекания процессов в рамках жизненного цикла документов.

Важность таких ключевых показателей при управлении бизнес-процессами компании, как количество и качество, совместно с развитием технологий автоматизации, неизбежно влечет за собой повсеместное использование электронных документов в организации.


  1. Понятие и сущность электронного документа


Документы содержат информацию, являющуюся ценным ресурсом и важным элементом деловой деятельности. Системный подход к управлению документами позволяет организациям и обществу защищать и сохранять документы в качестве доказательства действий.

С точки зрения ИС документ представляет собой мощный информационный поток, который нуждается в контроле и тщательной организации, если стоит задача совершенствования бизнес-процессов документооборота. Поскольку базовый термин, на котором фокусируется данная глава – это электронный документ,


в первую очередь необходимо обозначить, что будет пониматься под понятием «Документ», и, основываясь на данном определении, выявить особенности понятия «Электронный документ».

За время своего существования термин «Документ» не получил единого, общепринятого определения. В различных государственных документноориентированных нормативных актах не содержится однозначного указания на то, что можно считать документом, а что – нет, однако, несмотря на различные толкования термина и его определение, можно опереться


на “Национальный стандарт РФ. Система стандартов по информации, библиотечному и издательскому делу. Управление документами”. Таким образом, в соответствии с ГОСТ Р ИСО 15489-1-2007 документ – это зафиксированная на материальном носителе идентифицируемая информация любой формы, в виде текста, звукозаписи, изображения и (или) их сочетания, также имеющая реквизиты, созданная, полученная и сохранённая организацией или физическим лицом в качестве доказательства при подтверждении правовых обязательств или деловой деятельности [13].

В определении «Документа» характерны следующие моменты. Документом признается, прежде всего, материальный носитель, в то время как наличие зафиксированной на ней информации является вторичным признаком. Центр фокусировки перенесен на наличие реквизитов. Однако, учитывая наличие разрозненных определений данного понятия, трактовка понятия с той точки зрения, когда документ – это, прежде всего, информация, а материальный носитель – признак вторичный, имеет право на существование. Таким образом, следует отметить, что «Документ», как более обобщенное понятие «Электронного документа» позволяет перенести признаки «Документа» на понятие «Электронного документа» и также считать основой «Электронного документа» информацию.

В новейшей (с изменениями от 1 января 2011 г.) редакции Федерального закона «Об информации, информационных технологиях и о защите информации» (№ 149ФЗ) электронный документ понимается как «документированная информация, представленная в электронной форме, то есть
в виде, пригодном для восприятия человеком с использованием электронных вычислительных машин, а также для передачи по информационно-телекоммуникационным сетям или обработки в информационных системах» [20].

В определении «Электронного документа», соответственно, акцент переносится на то, что это в первую очередь, это информация, которая представлена в электронной форме. Исходя из определения, формируется ряд требований, которым ЭД должен отвечать:



  • содержать реквизиты, которые позволяют подтвердить его целостность и подлинность;

  • создаваться, обрабатываться, храниться, приниматься и передаваться при помощи технических программных средств;

  • быть воспроизведенным (отображенным) в понятной для восприятия форме.

Очевидно, что при использовании ЭД есть как положительные, так и отрицательные стороны. Преимущества применения ЭД:

  • упрощается и ускоряется сбор, обработка и систематизация всей информации;

  • существенно ускоряется компьютерная обработка документов;

  • оперативная (практически мгновенная) передача документов на любые расстояния при рассылке их по электронной почте;

  • при хранении электронных документов не требуются большие площади для архивов;

  • создание электронных архивов позволяет использовать уже полученную информацию для подготовки новых документов;

  • повышается эффективность работы;

  • наличие базы шаблонов документов уменьшает время на создание новых;

  • уменьшение расходования бумаги при работе с проектом электронного документа и внесении каких-либо изменений до вывода на бумагу;

  • рассылка проекта документа одновременно нескольким визирующим;

  • рассылка документа одновременно нескольким адресатам по электронной почте.

Недостатки ЭД:

  • необходимость наличия определенных технических средств для создания и дальнейшей работы, а также хранения документов;

  • защита информации, содержащейся в документах, от несанкционированных изменений.

Существует еще одна проблема, которая вытекает из особенности представления информации в электронном виде - копирование электронной информации. Одним из наиболее важных преимуществ, представленной в электронной форме информации, является легкость ее копирования. Поэтому при передаче по каналам связи электронного документа его необходимо защитить, во избежание инцидентов, от несанкционированного копирования. Однако на передающем конце остается контрольная копия. Она может рассматриваться как заверенная исполнителем копия документа. Но если заверить ее электронно-цифровой подписью, снабдив при этом всеми необходимыми атрибутами, тогда будет изготовлен один документ в двух экземплярах, которые имеют равную юридическую силу.

Следовательно, ЭД можно приравнять, проводя аналогию:



  • к юридически значимому документу - электронный документ при передаче его со всеми соответствующими атрибутами по каналам связи;

  • к рабочей копии документа - электронную копию документа, которая осталась у респондента;

  • ко второму экземпляру или заверенной копии самого юридически значимого документа, которые равносильны первому экземпляру - электронную копию документа, оставшуюся у респондента и заверенную электронно-цифровой подписью;

  • к заверенной копии документа - его распечатку, которая заверена в установленном законом порядке.

Кроме проблем, вытекающих из рамок правового статуса ЭД, есть еще один трудный вопрос, требующий разрешения, особенно в условиях текущего развития ИТ, в частности, развитие систем электронного документооборота. Проблема заключается в том, что, в настоящее время, КИС, работающие с ЭД, в большинстве своем, оперируют документом, как целостной единицей. Такая концепция принятия документа не позволяет извлечь из документа данные, которые содержаться непосредственно внутри неструктурированного ЭД. В свою очередь, потенциальные возможности технологий «интеллектуализации» содержат множество возможностей для обработки большого количества документов и данных, содержащихся в них.

Данные, находящиеся внутри документа являются неструктурированными, следовательно, для работы с ними, а также для последующего превращения человеком данных в информацию, необходим подход, позволяющий рассматривать документ, как набор структурированных данных.

Рассмотрев некоторые особенности ЭД, преимущества и недостатки его использования, а также некоторые юридические аспекты, следует обратить внимание также на структуру ЭД и базовые задачи управления документами, которые объяснят причину рассмотрения концепции документа как объекта, состоящего из множества составляющих, полезных для бизнес-процессов документооборота.

  1. Недостатки традиционного подхода к ЭД


Накопление документов, существующих в электронном виде, а также критически важных для бизнеса, растет в компаниях в быстрых темпах. Одной из основных проблем последнего десятилетия является не столько количество документов, сколько потребность во взаимосвязанной системе для работы с ними.

Раньше, в большинстве случаев, система управления документами поддерживалась за счет разрозненных средств, начиная от папок на файловой системе и электронной почты и заканчивая специализированными приложениями. При этом бизнес-логика, иными словами совокупность правил, принципов и зависимостей работы с документами в ИС, формально нигде не была закреплена, а с документами работали сотрудники отдела документационного отдела. Соответственно, возникла потребность в системе, которая решает проблему организации информации в рамках единого процесса.

Первые три десятилетия развития информационных технологий основное внимание уделялось структурированным данным, процессам их сбора, хранения и обработки. Для работы с неструктурированной информацией использовались простые инструменты, на примере текстовых редакторов. Однако в конце 90-ых годов сложилась ситуация критической точки, когда более 80-ти % всей корпоративной информации стало храниться в виде неструктурированных документов, при этом системы, которые должны были обеспечивать надежное хранение и доступ отсутствовали.

Таким образом, следует вывод о том, что накопленные массивы электронной информации, хранящейся в электронных документах, являются ценнейшим интеллектуальным активом организации, ее корпоративной памятью, следовательно, нуждаются в механизмах анализа содержимого документов. При этом интеллектуальные активы должны быть легкодоступны и надежно сохранены. Обеспечить эти потребности позволяет концепция управления корпоративной информацией призванная объединить разрозненные технологии, поддерживающие работу с неструктурированной информацией.

КИС, обладающая такой концепцией обработки корпоративной информации, должна быть настраиваема и адаптируема к окружающим внешним факторам. Невыполнение этого требования может привести к тому, что ИС, по истечении некоторого времени, перестанет выполнять свои функции из-за изменений в организационной структуре компании, ее внешнем окружении, спектре выполняемых работ. Все эти изменения неизбежно ведут к соответствующим изменениям системы понятий, которыми оперирует компания, тематике и структуре документов, классификации документов и способах организации архива.

Проблемы, возникающие при создании такой КИС, не охватываются традиционными подходами к автоматизации документооборота в компании и не решаются статистическими и лингвистическими методами полнотекстового поиска в базе данных документов.

В таком случае требуется применение интеллектуальных решений, семантических технологий с ориентацией задач управления документами (поиск, анализ, классификация, каталогизация, хранение) на понимание информационной системой содержания документа, его семантики. Одной из главных проблем анализа неструктурированных электронных документов является большое количество разнородного содержимого в документе. Если каждый элемент (слово или строку) подвергать анализу, то время извлечения данных и знаний резко возрастет и, в таком случае, не будет удовлетворять требованиям пользователей.

В то же время очевидно, что не все элементы документа несут полезную информацию, а в силу гибкости естественных языков формально различные слова (синонимы и пр.) на самом деле означают одинаковое понятие. Все эти процессы проходят в рамках выполнения процесса семантического индексирования – механизма, с помощью которого поисковый инструмент определяет не только соответствие содержимого документа ключевым запрашиваемым словам, но и определяет неявные семантические связи ключевого запроса. Таким образом, устранение описанных проблем выполняется на этапе предварительной обработки документа.

В связи с этим, первым этапом семантического индексирования, предшествующим непосредственному извлечению данных из документа и последующей их обработки, является этап структурирования данных документа. При системном подходе к вопросу извлечения из ЭД знаний, необходимо иметь соответствующий подход к определению структуры документа и его элементов.

  1. Структура электронного документа


Согласно определению «документа», формулировку которого в 1997 году дает спецификация организации DMA (Document Management Alliance) [32]: «Документ – это набор информации, который имеет отношение к выделенной теме или к родственным темам». Это определение является обобщающим, не привязывает документ к наличию носителя или реквизитов. Объект неструктурированных данных, другими словами, называемый документом, может принимать множество различных форм: это может быть закодированный текст, оцифрованное изображение бумажного документа, графика, выходные файлы САПР (система автоматизированного проектирования), цифровое видео. Таким образом, любой типы неструктурированных данных, которые могут быть автоматизированы, храниться в цифровой форме и воспроизводиться в виде, воспринимаемом человеком – это документ.

Документам, как живым и интеллектуальным объектам, принадлежит три основные характеристики, за которые ответственны три различных технологических средства. Во-первых, это объекты хранения всевозможных данных от текста до графики и звука. Во-вторых, это связи, которые «оживляют» документы. В-третьих, это атрибуты и индексы, появляющиеся в результате обработки документов в ИС. Все три характеристики можно назвать синтаксической нотацией документа, с которой также связано понятие стиля документа – его форма, проявляющаяся при воспроизведении документа при его обработке текстовыми редакторами.

По всем признакам документ является структурированным объектом, однако структурированным частично. Определение документа, как неструктурированного позволяет перейти от концепции построения архитектур ИС, ориентированных на построение полнотекстовых баз данных хранения документов к архитектуре с гибким и универсальным хранилищем данных с интеллектуальными технологиями анализа содержимого документов. Для этого необходимо учесть следующие характеристики структуры документа, накладываемые понятием ЭД:


  1. структура документа, то есть его формат и взаимосвязи между составляющими документ элементами, должна оставаться неизменной;

  2. в документе должен быть отражен контекст его создания, получения и использования документа (в том числе процесс деловой деятельности, частью которого является данная операция, дата и время данной операции и ее участники);

  3. должны быть представлены связи между отдельными записями, составляющими в совокупности документ.

Вышеописанные характеристики структуры ЭД отображены на схематическом изображении модели ЭД (см. Рисунок 1.1.). Рассмотрим схему более подробно.


  1. Схема структуры ЭД


Как видно на схеме структуры ЭД, структура документа имеет несколько основных составляющих: содержимое и метаданные. Содержимое документа состоит из элементов, которые, с вою очередь, могут быть связаны друг с другом и состоять из различных реквизитов. Набор реквизитов – обязательных элементов оформления официальных документов, зависит от вида документа [11] и в первую очередь позволяет определить структуру ЭД для человека, тем самым являясь важной частью документа.

Состав реквизитов, использующиеся, к примеру, при подготовке и оформлении организационно-распорядительных документов (см. A), определяется ГОСТом Р 6.30-2003 «Унифицированные системы документации. Унифицированная система организационно-распорядительной документации. Требования к оформлению документов» [20]. Кроме того, данный стандарт устанавливает требования к оформлению реквизитов и закрепляет схемы их расположения на макете документа. Несмотря на то, что в стандарте описаны 30 реквизитов, необходимо помнить, что различные документы состоят из разного набора реквизитов. Более того, некоторые реквизиты являются взаимоисключающими, например, «Адресат» и «Гриф утверждения». Данные реквизиты располагаются в одной и той же части макета документа и, с точки зрения документационного управления, занимают одну и ту же площадь в отведенной им части, тем самым, являясь взаимоисключающими.

Содержательный элемент документа может иметь два типа: структурированные и полуструктурированные (неструктурированные). Особенностью структурированных документов является наличие фиксированной структуры для сбора данных, четко обозначенных полей, некоторых служебных элементов. Примером структурированного документа может служить бланк регистрации, изображенный на Рисунок 1.2., а. Использование такого типа документов значительно повышает время и качество ввода документа в ИС, распознавания образа, обработки документа.

Полуструктурированные (неструктурированные) документы отличаются от структурированных тем, что их поля не имеют фиксированного размера и расположения. В таком случае при распознавании ИС ориентируется на статический текст, осуществляя его поиск по всему документу, что требует значительных затрат времени и снижает качество распознавания изображения. Пример полуструктурированного документа в виде извещения на оплату представлен на Рисунок 1.2., b.










  1. Типы форм документов: a) пример структурированной формы,
    b) Пример полуструктурированной формы


Независимо от типа формы документа, «машиночитаемая форма» содержит следующие основные элементы: информационные поля, идентификаторы, сервисные поля и декоративные элементы. Каждый элемент формы имеет свое значение.

Информационные поля служат для ввода текста при заполнении формы, в них размещаются группы знакомест, метки, группы меток. Сервисные поля позволяют выявлять принадлежности формы к определенному образцу и служат для ориентации документа во время ввода в ИС, за счет фокусировки на статическом тексте и реперных точках (черных квадратов). Идентификаторами служат штрих-коды, однозначно характеризующие принадлежность формы к определенному образцу (в том случае, если реперные точки у форм различных образцов совпадают). Декоративные элементы, такие как подписи и печати не подлежат распознаванию.

Кроме содержимого, обладающего набором элементов и реквизитов, в ЭД необходимо наличие метаданных об управлении документами, а также объясняет принципы, лежащие в основе управления ими. Сформулировать требования и основы для создания и управления метаданными позволяет национальный стандарт Российской Федерации «Система стандартов по информации, библиотечному и издательскому делу. Процессы управления документами. Метаданные для документов» ГОСТ Р ИСО 23081-1-2008 [13].

В стандарте [13] говорится, что управление метаданными – это неотъемлемая часть управления документами, обеспечивающая выполнение множества различных функций и целей. В рамках управления документами метаданные определяются как данные, описывающие контекст, содержание и структуру документов, а также процессы управления ими на протяжении всего жизненного цикла (ЖЦ) документа. Сами по себе метаданные являются структурированной или полуструктурированной информацией, позволяющей создавать, регистрировать, классифицировать, обеспечивать доступ, хранение и размещение документов, в рамках и за пределами одной или нескольких областей деятельности.

В схеме структуры ЭД (см. Рисунок 1.1.) обозначены два типа метаданных: метаданные свойств содержимого и метаданные контекстной связи. Метаданные свойств содержимого допускается использовать для идентификации, подтверждения подлинности и статуса документа. Чем больше и качественнее определен набор метаданных свойств содержимого, тем больше возможности использования метаданных в процессе управления документами в ИС. Метаданные контекстной связи, в свою очередь, содержат информацию о контекстуализации документов, процессов и систем, в рамках которых создаются, управляются и используются ЭД. Такие метаданные важны при анализе и оптимизации бизнес-процессов. В целом, все метаданные представляют интерес в рамках управления ЭД на протяжении ЖЦ ЭД.

Управление документами всегда включает в себя управление метаданными. Однако электронная среда требует иного выражения традиционных требований и иных механизмов для идентификации, ввода, определения свойств и использования метаданных. В электронной среде документы нормативного характера – это документы, сопровождаемые метаданными, определяющими их нормативный статус. Этот нормативный статус должен быть четко документирован, а не подразумеваться, как в некоторых процессах управления бумажными документами. С ЭД очень важно предоставить гарантию того, чтобы в ИС, которые создают, осуществляют ввод и управление документами, осуществлялось создание и ввод метаданных об управлении документами. И наоборот, электронная среда предоставляет новые возможности для определения и создания метаданных, а также для обеспечения полного, своевременного ввода документов.

Важно отметить, что структура ЭД может рассматривать с нескольких точек зрения. Структура документа, воспринимаемая человеком, и структура, необходимая ИС для обработки документа (машиночитаемая), различаются. Более того, в документе содержится, как структурированная информация, так и неструктурированная. Для работы с неструктурированными данными, их необходимо первоначально обработать. Также отмечено, что каким бы ни был тип документа, структурированным или полуструктурированным, при управлении ЭД в ИС должны учитываться метаданные.

На основе построенной схемы структуры ЭД, а также описанной информационной модели ЭД в работе [19], была построена информационная модель структуры ЭД (см. Рисунок 1.3.), которая отображает основные информационные блоки ЭД, с которыми предстоит работа в ИС. Информационная модель – это модель объекта, в нашем случае ЭД, представленная в виде информации, описывающей существенные для данного рассмотрения параметры и переменные величины, связи между ними, входы и выходы объекта и позволяющая путём подачи на модель информации об изменениях входных величин моделировать возможные состояния объекта.




  1. Информационная модель структуры ЭД


В целом, модель состоит из трех блоков, соответствующих составным частям схемы структуры ЭД. Соответствие элементов схемы и информационной модели представлено в Таблица 2.1.. Далее рассмотрим предназначение каждой модели, входящей в состав всей информационной модели структуры ЭД.
  1. Соответствие элементов схемы и информационной модели структуры ЭД

Элемент схемы

структуры ЭД



Элемент информационной модели

структуры ЭД



Содержание

Модель семантического описания

Метаданные свойств содержимого

Модель описания свойств содержимого

Метаданные контекстной связи

Модель описания контекстной связи

Модель семантического описания представляет собой набор конечного числа семантических сущностей, иными словами описание следующих элементов: объектов, сущностей, понятий содержания документа. Также в этой модели учитываются отношения между этими элементами, состояния, причины и следствия.

В свою очередь, модель описания свойств содержимого выражается в описании статических характеристик, как общих для всех типов документов (создатель, формат, дата создания), так и дополнительных, характерных для определенного контекста документов. Так, например характеристика «Идентификатор» или «Дата создания документа» являются обязательными для всех документов, в то время как такая характеристика, как «Приложение, в котором создан документ» будет встречаться только у документов, созданных с помощью приложений.

Модель описания контекстной связи необходима для описания движения документа и принадлежности его к бизнес-процессам. Для этого в данной модели предусмотрены такие характеристики, как «переход», «варианты» и «состояния». Последовательность переходов, которой обладает документ, выражается в показателях: «время», «характер», «причина» и др., а характеристика «варианты» отображает потенциальные способы переходов, заложенные в маршруты движения ЭД. В свою очередь характеристика «состояния» отображает перечень состояний документа на пути его движения. Более того, вся модель описания контекстной связи функционирует в условиях временной шкалы.

Таким образом, в данном разделе была обозначена схема структуры ЭД и модель структуры ЭД, что позволит в последующих главах проектировать архитектуру КИС с базовым объектом – документ, в противовес стандартным системам электронного документооборота, в которых основным объектом является запись в базе данных. Кроме того, исходя из понятия и структуры ЭД, целесообразно также обозначить жизненный цикл ЭД, который отражает все фазы ЭД, которые присутствуют во время работы с ЭД в ИС.


  1. Жизненный цикл электронного документа


В любой организации и вне ее происходит непрерывный процесс движения ЭД, а также, что немаловажно информации и знаний. Жизненный цикл ЭД отличается от традиционного «бумажного» документа большей гибкостью и прозрачностью.

Проводя анализ электронного документооборота (ЭДО), в качестве объекта исследования можно рассматривать отдельный документ (бумажный / электронный), документопоток, документационный технологический процесс. Однако основополагающим объектом исследования и совершенствования можно назвать документопоток.

Согласно ГОСТ Р 51141-98 [5] документопоток – это поток документов, циркулирующих между пунктами обработки и создания информации (руководителями организации и структурных подразделений, специалистами) и пунктами технической обработки документов: секретариатом, канцелярией и др.

В каждой организации можно выделить следующие потоки документов:



  1. поток входящей документации, состоящий из поступающих в организацию документов;

  2. потоки внутренней документации, состоящие из документов, созданных в организации и не предназначенных к выходу за ее пределы;

  3. поток исходящей документации, состоящий из документов, предназначенных для отправки в другие организации [5].

Основные этапы ЖЦ ЭД

Исходя из определения ЭД, можно сделать вывод о том, что управление корпоративными ЭД – это технология, используемая для ввода, управления, хранения, сохранности, доставки и вывода, как документов, так и содержимого этих документов, относящихся к важнейшим процессам организации. За основу жизненного цикла ЭД возьмем принятую в концепции систем типа ECM структурную схему управления корпоративным контентом, предложенную ассоциацией по вопросам управления информацией и изображениями (AIIM  Association for Information and Image Management) [33].

ЖЦ ЭД в ИС будет состоять из следующих этапов:


  1. ввод документа в ИС;

  2. хранение документа в ИС;

  3. обеспечение сохранности документа в ИС;

  4. управление документом;

  5. доставка документа;

  6. вывод документа из ИС.

Кроме этого, следует обозначить, что ЖЦ, состоящий из шести вышеописанных этапов, также должен включать в себя целый перечень состояний документа, что является очень важным компонентом в понимании управления ЭД. Список состояний документа, принятый в системе описания организации – ARIS [13] представляется достаточным и наиболее полным и включает в себя: планирование; создание (разработка); согласование; визирование; утверждение; регистрация; публикация; регламентация доступа; извещение об изменениях; оперативное хранение; выполнение основных функций; архивное хранение информации; экспертиза ценности; уничтожение.

На основе ЖЦ ЭД становится возможным определение таких понятий как управление ЭД и электронный документооборот (ЭДО).


  1. Стандарты по управлению ЭД


Согласно основным этапам ЖЦ ЭД обратимся к нормативным документам и стандартам, относящимся к управлению электронными документами в организации, содержащими четко сформулированные требования к работе с документами и информацией. В настоящее время общепризнанными международным сообществом документами, устанавливающими требования к управлению ЭД, являются следующие стандарты: ГОСТ Р ИСО 15489-1 – 2007, ГОСТ Р ИСО 23081-1 – 2008, ISO 15836:2003, ISO/TR 15801:2004, ISO/TR 18492:2005, ISO/TR 12037:1998, ISO 2142:2001, ISO 19005-1:2005, XKMS, MoReq2.

Рассмотрим каждый стандарт более подробно.



  1. ГОСТ Р ИСО 15489-1 – 2007 «Система стандартов по информации, библиотечному и издательскому делу. Управление документами. Общие требования» [16] идентичен международному стандарту ISO 154891:2001 (Information and documentation. Records management. General). Данный стандарт устанавливает требования, предъявляемые к документам, создаваемым в процессе осуществления деловой деятельности: аутентичность (подлинность), достоверность, целостность (неизменность), пригодность для использования.

Стандарт ГОСТ Р ИСО 15489-1 – 2007 является высокоуровневым нормативным документов, в котором отражены основные принципы современного управления документами. С практической точки зрения стандарт может быть полезен для того, чтобы обозначить для начальства и сотрудников подразделений важность управления документами в деловой деятельности. К тому же, с точки зрения ЖЦ ЭД, стандарт устанавливает требования ко всем этапам ЖЦ.

Кроме того, следует обратить внимание на такие характеристики, которые устанавливают требования к проектированию систем управления документами, в соответствии с которыми система должна обладать функциональными характеристиками, позволяющими выполнять и поддерживать различные процессы документооборота.



  1. ГОСТ Р ИСО 23081-1 – 2008 «Система стандартов по информации, библиотечному и издательскому делу. Управление документами. Процессы управления документами. Метаданные для документов» [13] идентичен международному стандарту ISO 23081 (Metadata for records).

В стандарте подчеркивается значимость метаданных об управлении документами в различных процессах деловой деятельности и различных ролей и типов метаданных, а также объясняются принципы и структуру, лежащие в основе управления ими.

  1. ISO 15836:2003 (The Dublin Core metadata element set) [34] – «Набор элементов метаданных “Дублинского ядра”» представляет собой универсальный набор метаданных, содержащихся в Дублинском ядре. Указания по применения Дублинского ядра содержатся во многих государственных стандартах метаданных, основанных на данном стандарте.

  2. ISO/TR 15801:2004 (Information Stored electronically – Recommendations for trustworthiness and reliability) [23] – «Информация, хранимая в электронном виде – Рекомендации по обеспечению достоверности и надежности» является международным стандартом. Стандарт регламентирует внедрение и эксплуатацию систем управления информацией, которые хранят информацию в электронном виде и для которых важны достоверность, надежность, аутентичность и целостность информации. Стандарт охватывает не полный ЖЦ ЭД, затрагивая только этапы ввода, использования и управления документами.

  3. ISO/TR 18492:2005 (Long-term preservation of electronic document-based information) [25] – «Обеспечение долговременной сохранности электронной документированной информации» является техническим отчетом и первым международным руководством по решению проблемы обеспечения долговременной сохранности электронных документов.

В отчете предлагается концепция разработки стратегий обеспечения долговременной сохранности, а также описываются зарекомендовавшие себя приемы практической работы, которые можно применять в организациях для обеспечения долговременной доступности и аутентичности электронных документов.

  1. ISO/TR 12037:1998 (Recommendations for the expungement of information recorded on write-once optical media) [28] – «Рекомендации по удалению информации, записанной на оптических носителях однократной записи». В данном стандарте рассматривается достаточно узкая проблема частичного уничтожения информации на носителе однократной записи.

  2. ISO 12142:2001 (Media error monitoring and reporting techniques for verification of stored data on optical digital data disks) [26] – «Мониторинг ошибок при передаче и методики отчетности для верификации сохраненных данных на оптических цифровых дисках» концентрируется на узкой проблеме передачи данных для сохранности.

  3. ISO 19005-1:2005 (Electronic document file format for long-term preservation - Part 1: Use of PDF 1.4 (PDF/A-1)) [23] – «Файловый формат для долговременного хранения электронных документов – Часть 1: Использование формата PDF 1.4 (PDF/A-1)». Данный международный стандарт разработан для описания принципов и методов использования формата PDF для долговременного хранения документа, как в организациях, так и в архивах.

Значение стандарта заключается в том, что коммерческие и государственные организации, библиотеки, архивы, другие учреждения во всем мире используют формат PDF для представления важной информации в неизменном виде. Большая часть такой информации должна храниться длительное время, некоторая доля информации должна храниться постоянно. Цели, которые реализует стандарт:

  • определение формата файла, основанного на PDF, который обеспечит механизм для представления электронных документов таким способом, который позволит сохранить их визуальное изображение с течением времени;

  • определение формы для представления логической структуры истории электронных документов в метаданные в рамках соответствующих файлов;

  • обеспечение структуры для документирования контекста и другой семантической информации об электронных документах в пределах формата.

  1. XKMS (XML Key Management Specification) [37] – «Спецификация управления ключами XML» является набором протоколов, разработанный W3C, который описывает распространение и регистрацию открытых ключей, применимый для использования совместно со стандартом XML, определенным W3C и IETF.

Данный стандарт подходит, например, для того, чтобы СЭД имела разработанный на основе стандартов интерфейс, позволяющий подключать новые технологии электронных подписей по мере их появления.

  1. MoReq2 (Model Requirements for the Management of Electronic Records) [27] – общеевропейская функциональная спецификация по управлению электронными документами, описывающая функциональные возможности систем управления документами и являющаяся инструментом тестирования систем на соответствие требованиям.

Требования, обозначенные в данном стандарте охватывают все этапы ЖЦ ЭД, и изложены таким образом, что они одинаково и однозначно понятны сотрудникам-документоведам и ИТ-специалистам, в связи, с чем стандарт MoReq2 завоевал популярность в качестве «протокола обмена» между пользователями и разработчиками.

Особенности спецификации MoReq2:



  • унификация со стандартом ISO 15489 терминология в области ЭД;

  • учет ряда национальных стандартов таких стран, как: Великобритания, Германия, Норвегия, США и др.;

  • наличие систем тестов для оценки и сертификации СЭД;

  • разделение спецификации на две части: базовый и опциональные модули;

  • содержит «типовые» требования и носит общий характер (вопросы специфичные для секторов экономики не рассматриваются).

В данном разделе приведена таблица, которая показывает, как ключевые стандарты связаны с процессами управления ЭД. Согласно обозначенным в п.1.2.4. этапам ЖЦ ЭД, сравним рассмотренные выше стандарты с точки зрения наличия требований к этапам. Первый этап ввода документа в ИС, в рамках сравнительного анализа, разделим на два подпункта: «создание» и «ввод»; этап управления дополним подпунктом «использование». Таким образом, сводная таблица стандартов управления ЭД представлена в Таблица 2.2..
  1. Сравнительный анализ стандартов по управлению ЭД

№ п/п

Стандарт

Создание

Ввод

Обеспечение сохранности

Управление

Использование

Хранение

Передача

Уничтожение

1

ГОСТ Р ИСО 15489-1 – 2007

+

+

+

+

+

+

+

+

2

ГОСТ Р ИСО 23081-1 – 2008




+

+

+

+




+




3

ISO 15836:2003




+

+

+

+




+




4

ISO/TR 15801:2004




+




+

+










5

ISO/TR 18492:2005







+
















6

ISO/TR 12037:1998






















+

7

ISO 12142:2001
















+







8

ISO 19005-1:2005

+

+

+
















9

XKMS




+

+
















10

MoReq2

+

+

+

+

+

+

+

+

Как видно из сводной таблицы стандарт ГОСТ Р ИСО 15489-1 – 2007 и спецификация MoReq2 обладают набором требований для каждого этапа ЖЦ ЭД и являются обобщающими, в то время как остальные стандарты являются более характерными для разных этапов ЖЦ. Так, к примеру, стандарты метаданных имеют отношение к процессам ввода, использования, обеспечения сохранности, передачи и управления. В их число входят ГОСТ Р ИСО 23081-1 – 2008, охватывающий все виды метаданных для управления документами, и ISO 15836:2003 «Дублинское ядро», специфицирующее стандартный набор метаданных для целей поиска.

Для процесса создания документов наибольший интерес представляют стандарты форматов документов. Примером такого стандарта форматов был рассмотрен стандарт ISO 19005-1:2005, в котором разработано и описано подмножество формата PDF (Portable Document Format – «Переносимый формат для информационных материалов») – PDF-A для использования при архивном хранении.

К процессу ввода имеют отношение различные стандарты метаданных. К этому процессу также относятся некоторые из стандартов форматов, - с точки зрения возможности автоматического извлечения значений метаданных; и стандарты, затрагивающие правовые вопросы, например ISO/TR 15801:2004.

Ключевым стандартом в области обеспечения сохранности ЭД и информации является ISO/TR 18492:2005, содержащий концепцию разработки и управления процессами обеспечения сохранности. Кроме того, большая часть деятельности по обеспечению сохранности существенно опирается на использование стандартов метаданных, а также стандарта ISO 19005-1:2005, определяющего формат, подходящий для длительного хранения документов. Более того, вопрос обеспечения сохранности затрагивается и в стандарте XKMS.

Стандарты метаданных могут поддерживать процессы управления доступом и срокам хранения, а также процессы передачи документов. Также на этапах управления и использования применимы стандарты, затрагивающие правовые вопросы, а именно ISO/TR 15801:2004.

Для этапов процесса ЖЦ ЭД хранение и уничтожение рассмотрены индивидуальные для каждого этапа стандарты. В качестве стандарта в области хранения рассмотрен ISO 12142:2001, фокусирующийся на отдельных аспектах процесса хранения, связанных с хранением информации на оптических дисках. А для процесса уничтожения рассмотрен стандарт ISO/TR 12037:1998, фокусирующийся на отдельных аспектах процесса уничтожения, а именно, удалении.

В результате обзора и анализа, рассмотренных в данном разделе стандартов, можно сделать вывод о том, что выбранные стандарты позволяют очертить общую картину взаимосвязи процессов, затрагивающих ЭД, и стандартов, регламентирующих и предлагающих требования для работы с ЭД. Кроме того, формирование требований к разрабатываемой архитектуре будет основываться на анализе требований, предъявляемых стандартами на определенном этапе ЖЦ ЭД. Таким образом, можно сказать, что за основу требований можно взять обобщающие стандарты, а для определения более характерных этапам требований ссылаться на стандарты, отвечающие на определенные для этапа вопросы.

  1. Понятие электронного документооборота


В настоящее время в Российской Федерации, в частности, действует ряд общегосударственных нормативно-правовых актов, регламентирующих наиболее общие правила подготовки, оформления и организации работы с документами в организации.

В проекте Федерального закона «Об электронном документе» №1075993 [12], который будет регулировать отношения, связанные с формированием и использованием электронных документов, а также, определяющий основные требования, предъявляемые к ЭД в электронном документообороте (ЭДО), дается следующее понятие ЭДО: электронный документооборот – процесс формирования, обработки, хранения и обмена электронными документами. Несмотря на прозрачность и понятность определения термина «Электронный документооборот», в рамках данной работы особого внимания требует обозначение места ЭДО в процессах КИС.

В определении ЭДО делается упор не только на движение документов, но и на то, что это процесс должен быть организован в электронной среде. Важно также и то, что документооборот зависит от системы управления, является вторичным по отношению к ней, но в то же время именно документооборот, отражая систему управления, позволяет ее наглядно увидеть. Поэтому вторичность порядка движения документов по отношению к целям и задачам организации, документооборот рекомендуется нормировать и регулировать.

Независимо от того, какая организация использует ЭДО, в рамках каждой компании образуется набор ЭД, характерный для вида деятельности конкретной компании. В связи с этим существует достаточное количество видов электронного документооборота, такие как:



  • производственный документооборот;

  • управленческий документооборот;

  • архивное дело (совокупность процедур архивного документооборота);

  • кадровый документооборот (процедуры кадрового учета);

  • бухгалтерский документооборот и др.

Очевидно, что систем электронного документооборота может быть столько же, сколько существует видов деятельности, как следствие, ИС, автоматизирующие частные виды документооборота, развиваются по направлению массовости.

Более детально, какие базовые виды детальности, понимаются под ЭДО, можно понять, если разделить понятия делопроизводство и документооборот. Электронным делопроизводством называется совокупность операций над документами, а это:



  • регистрация входящего документа (автоматическое или ручное задание реквизитов);

  • создание исходящего документа;

  • сохранение в архиве (публикация);

  • внесение изменений (дополнений) в документы и их реквизиты;

  • поиск документов;

  • задание поручений и контроль исполнения.

В свою очередь, делопроизводство, снабженное дополнительными операциями:

  • функциями маршрутизации;

  • регистрацией содержания документов;

  • выполнением бизнес-процессов, связанных с документом,

называется электронным документооборотом [1]. Это определение охватывает большое число реально функционирующих СЭД - систем автоматизации работы с документами на протяжении всего их жизненного цикла, однако, его осмысление в большей степени зависит от определения жизненного цикла ЭД.

СЭД являются старейшим ИТ-компонентом КИС. Это подтверждает тот факт, что, в частности, широкое внедрение ИТ двадцать лет назад в России начиналось именно с решения автоматизации делопроизводственных задач [9]. Сейчас, в большинстве случаев, СЭД является интегрированной частью общей ИС предприятия. Однако само понятие СЭД со временем претерпевает эволюционные изменения, поскольку расширяется спектр решаемых такими системами задач, выходя за традиционные для России СЭД рамки. Переход от систем для документооборота, решающих ограниченный набор задач (организация распорядительного документооборота и автоматизация канцелярии) к единым технологиям работы документами, пронизывающим все аспекты деятельности организации. Такие технологии называются ECM-технологиями. ECM-система, как и СЭД является частным случаем КИС.

Более того, несмотря на наличие СЭД и ECM-систем, в данной работе принимаются во внимание ИС масштаба всей организации, поскольку СЭД – системы ограничивающиеся ЭДО, в то время как в данном исследовании представляет интерес движение ЭД в рамках всей КИС компании. Именно поэтому в следующем разделе будет рассматриваться применение различных технологий в КИС для работы с ЭД и их анализа.


  1. Каталог: data -> 2014
    2014 -> Реферат Отчет с., главы, 22 рис., табл., 16 источников, прил видео стеганография, стеганография mpeg, сокрытие информации в видео, встраивание и извлечение информации, дискретное косинусное преобразование, помехоустойчивое кодирование, циклические
    2014 -> Становление футбольного клуба как бренда на примере фк
    2014 -> Проблемы и перспективы взаимодействия Европейского Союза и России по урегулированию локальных кризисов
    2014 -> Факторы формирования российского и американского экспорта вооружений в начале XXI века
    2014 -> Памятка студентам бакалавриата «Куда обращаться?»
    2014 -> «Восприятие института монархической власти в Великобритании, России и в Японии»
    2014 -> Программа краткосрочного повышения квалификации работников ниу вшэ
    2014 -> Практики краудсорсинга в прикладных социальных исследованиях


    Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   12


База данных защищена авторским правом ©vossta.ru 2019
обратиться к администрации

    Главная страница