Анализ неструктурированных электронных документов как средство оптимизации корпоративной информационной системы



страница11/12
Дата24.04.2018
Размер1.08 Mb.
1   ...   4   5   6   7   8   9   10   11   12

Проектирование архитектуры КИС


На основе сформированных требований можно перейти к этапу проектирования архитектуры КИС представляющему собой многоэтапный процесс, требующий системного подхода к проектированию архитектуры. Для проектирования полноценной архитектуры КИС необходимо рассмотреть ее на разных уровнях абстракции:

  • концептуальный уровень;

  • логический уровень;

  • физический уровень.

Каждый из уровней архитектуры описан и спроектирован согласно сформированным требованиям к архитектуре, а также ориентированности на управление ЭД.
  1. Проектирование концептуального уровня архитектуры КИС


На этапе обзора существующих типов архитектур ИС было отмечено, что сервис-ориентированная архитектура (СОА) является наиболее новой концепцией и инструментом проектирования архитектуры КИС. Более того, СОА представляет собой не коробочный продукт или решение, а идеологию информатизации бизнеса, основанную на процессном подходе и методологии управления бизнес-процессами. Таким образом, в виду своей бизнес-ориентированности, а также модульному принципу проектирования, принято решение об использовании концепции СОА для проектирования архитектуры КИС.

Как отмечалось в разделе 1.1.2., особенность концепции СОА заключается в разработке такого программного обеспечения, которое основано на использовании распределенных, слабо связанных заменяемых компонентах, которые оснащены стандартизированными интерфейсами для взаимодействия по стандартизированным протоколам. В рамках СОА следует выделять три основных компонента: поставщик сервисов, потребитель сервисов и реестр сервисов. Под сервисом будем понимать законченный функциональный компонент системы, который может многократно использоваться в программной поддержке различных бизнес-процессов. Иными словами, в архитектуре КИС, спроектированной в такой концепции унификация и автоматизация бизнес-процессов будет осуществлена за счет использования типовых компонентов – сервисов.



Поставщик сервисов обеспечивает реализацию и описание сервиса. Реестр сервисов содержит информацию о существующих сервисах. А потребителем сервисов в свою очередь, являться такой компонент системы, который нуждается в функциональных возможностях поддержки своих бизнес-целей сервисом того или иного поставщика. Кроме того, потребитель сервиса при обращении к реестру для нахождения описания сервиса может напрямую использовать универсальный идентификатор ресурса (URI). Схема взаимодействия компонентов ИС изображена на Рисунок 3.1.. Цифрами обозначена последовательность этапов взаимодействия.



      1. Схема с этапом сообщения адреса сервиса потребителю



      1. Схема с этапом поиска описания в реестре по URI
  1. Схемы взаимодействия компонентов ИС в концепции СОА


Обращая внимание на то, что в проектируемой архитектуре должна учитываться возможность использования семантических технологий, вышеописанная модель может быть усовершенствована с учетом особенностей семантических технологий. В семантической схеме взаимодействия компонентов, определим следующие моменты: a) поставщик сервиса регистрирует в реестре описание в обычном и онтологическом формате; b) потребитель сервиса передает в реестр запрос и онтологическое описание запроса. С учетом этих изменение, схема семантического взаимодействия компонентов ИС примет вид, изображенный на Рисунок 3.2..


  1. Схема семантического взаимодействия компонентов ИС в концепции СОА


При семантическом взаимодействии компонентов ИС с реестром сервисов взаимодействует семантический сервис, который осуществляет проверку на соответствие семантических совпадений из онтологии запроса от потребителя и онтологий сервисов, состоящих в реестре сервисов. Благодаря такой организации взаимодействия компонентов системы, при котором как в описании сервиса есть смысловое вложение, так и в запросе потребителя, модель СОА обеспечит более релевантное взаимодействие поставщика и потребителя сервиса. А семантический сервис, находящийся на уровне реестра сервисов, организовывает автоматический поиск сервисов и создает единую базу знаний.

Переход к семантической модели СОА вызван наличием недостатков технологий, участвующих во взаимодействии поставщика и потребителя сервисов. В работе [3] обозначены следующие недостатки технологий: спецификация WSDL (Web Services Description Language) – язык описания Web-сервисов и доступа к ним. Основан на языке XML, использующаяся для описания сервисов, жестко регламентирует формат сообщений, используемые протоколы и адрес, по которому находятся сервисы, и не позволяет отразить семантику; реестр UDDI (Universal Description Discovery & Integration) – инструмент для расположения описания Web-сервисов для последующего их поиска слабо интегрируется в существующие ИС и не содержит семантики, необходимой потребителям сервисов.

В связи с вышеперечисленными недостатками технологий, применяющихся в архитектуре СОА, в семантической модели СОА для придания описания сервиса семантической окраски будет использоваться расширение WSDL в виде описания на языке OWL-S. На Рисунок 3.3. отображены стандартная и семантическая модели СОА КИС с использующимися технологиями.






a)

b)
  1. Модели СОА КИС: a) Стандартная модель СОА КИС, b) Семантическая модель СОА КИС

Рассмотрим модели СОА КИС более подробно. Уровень потребителей сервисом в семантической модели отличается от стандартной наличием OWL описания запроса. Для обмена информацией между потребителями сервисов и сервисами по транспортному протоколу HTTP используется протокол SOAP, являющийся рекомендованным и самым широко используемым коммуникационным протоколом для Web-сервисов. На уровне сервера ИС включает в себя такие компоненты как:



  • корпоративная сервисная шина (Enterprise Service Bus, ESB), отвечающая за взаимодействие элементов ИС (клиентов и сервисов);

  • реестр сервисов, хранящий данные о предоставляемых поставщиками сервисах, а также содержащий информацию о бизнес-процессах, находящихся в ИС;

  • модуль оркестровки сервисов, предназначенный для хранения серии действий по управлению потока работ (обычно имеющих одну линию выполнения);

  • модуль хореографии сервисов необходимый для отражения видимого обмена сообщениями, а также правил взаимодействия между сервисами.

Работа реестра сервисов возможна за счет использования реестра UDDI, хранящего в себе множество точек соединения различных Web-служб. Поставщики сервисов самостоятельно регистрируют сервисы в реестре UDDI, а клиенты самостоятельно запрашивают необходимые сервисы. Также, следует отметить, что в семантической модели присутствует семантический сервис, обрабатывающий семантическое описание сервисов, и при обращении потребителя сверяющий семантическое описание запрашиваемого сервиса с существующими сервисами поставщиков.

Уровень поставщиков сервисов в семантической модели отличается от стандартной тем, что вместе с WSDL-файлом описания сервиса поставщик передает OWL-S описание (онтологию сервиса), в то время как в стандартной модели WSDL-файл – это единственный вариант описания сервиса.

Таким образом, проектируемая архитектура приобрела изменения уже на этапе определения уровней трех участников (поставщик, потребитель, реестр) модели СОА. Далее следует рассмотреть архитектуру на более низком уровне, где подробно будут разложены функциональные модули архитектуры, необходимые для реализации управления ЭД с учетом применения семантической концепции.

  1. Проектирование логического уровня архитектуры КИС


Проектирование логического уровня архитектуры предполагает определение принципов построения архитектуры, функциональных возможностей по обработке и обмену информацией, форматами представления данных и по организации информационной поддержки бизнес-объектов. Также на данном уровне архитектуры необходимо обозначить типы информационных процессов, распределенных по элементам КИС в соответствии с функциональными потребностями компании.

Поскольку, в рамках данной работы, архитектура КИС ориентируется на управление ЭД, все технологии совершенствования направлены на изменение концепции работы ИС с документами. Естественно, что документы, данные и знания в компаниях хранятся в электронной среде в виде корпоративной памяти [19]. Целесообразно рассмотреть структуру корпоративной памяти в архитектуре КИС на трех уровнях: онтологический уровень (т.к. было принято решение о выборе онтологического подхода семантических технологий), содержательный уровень, уровень физического хранения (см. Таблица 3.1.). Уровень физической хранения является более детальным и относится к этапу проектирования физического уровня архитектуры, поэтому в данном разделе будут рассмотрены первые два уровня корпоративной памяти.


  1. Структура корпоративной памяти

№ п/п

Уровень

Данные

Знания

Документы

1

Онтологический уровень

Метаданные

Онтологии

Структура архивов

2

Содержательный уровень

Справочники, каталоги

Правила выбора

Отчеты, методики, технологии

3

Уровень программной реализации

БД, файлы, Web-страницы

Базы знаний

Электронные документы, чертежи и др.

Как видно из приведенной таблицы, на онтологическом уровне данные представляются в виде метаданных, в нашем случае, с помощью метаданных содержания и метаданных семантической связи. Содержание документов представляется в виде онтологий. В качестве онтологий, содержащих знания, в данной работе используются: онтологии описания структуры документов; онтологии описания документов; онтологии описания предметной области. При масштабировании архитектуры, вызванном различными потребностями, количество онтологий может быть увеличено. Что касается документов, то на данном уровне документы организуются в некоторый набор архивов, по тем критериям, которые продиктованы непосредственно потребностями бизнеса.

Описав форматы представления и хранения данных, целесообразно перейти к уровню бизнес-логики архитектуры (см. Рисунок 3.4.).




  1. Уровень бизнес-логики архитектуры КИС


Данный блок содержит бизнес-логику предметной области (управление ЭД), а также иерархию бизнес-процессов компании. К бизнес-объектам можно отнести: документы, роли, события, задачи и др. Также в бизнес-логике содержится понятие коллекций, они могут быть общие, ролевые, персональные; могут быть организованы в виде журналов, папок и другим способом. Немаловажным элементом данного уровня является обозначение функциональных задач, требующих решения. Все элементы бизнес-логики предметной области, так или иначе соединяются в иерархии бизнес-процессов компании.

Кроме уровня бизнес-логики, на этапе формирования логического уровня архитектуры, необходимо выделить уровень инфраструктуры (см. Рисунок 3.5.).




  1. Уровень инфраструктуры архитектуры КИС


На данном уровне определяется сервисная поддержка организации Web-сервисов, использующихся в КИС; сами сервисы; подсистемы, каждая из которых включает в свой состав свой набор сервисов; модули, в которые организованы подсистемы по схожести подсистем к решению задач по управлению ЭД на разных этапах ЖЦ ЭД.

Особенное внимание следует обратить на модуль семантического ядра, реализующий весь функционал по семантической обработке ЭД. Остальные модули включают в свой состав такие подсистемы, которые пользуются подсистемами модуля семантического ядра, как переходным объектом к хранению и представлению данных с помощью онтологического подхода. В составе подсистем перечислены такие модули с подсистемами, которые носят характер управления ЭД, естественно, что в зависимости от потребностей компании, количество модулей может быть увеличено для решения тех или иных задач, носящих специфический для компании характер.

К числу функциональных модулей архитектуры относятся такие модули, которые удовлетворяют функциональным и техническим требованиям, предъявляемым к архитектуре и входящие в рамки ЖЦ ЭД (исключая хранение и вывод из ИС). Функциональные модули КИС с составляющими подсистемами перечислены ниже.


  1. Ввод документов в ИС (модуль ввода):

    1. подсистема распознавания образов;

    2. подсистема обработки форм;

    3. подсистема аннотирования;

    4. подсистема индексирования;

    5. подсистема категоризации.

  2. Обеспечение сохранности документов (модуль безопасности):

    1. подсистема идентификации пользователей;

    2. подсистема контроля версиями;

    3. подсистема контроля доступа к контенту;

    4. подсистема контроля взаимоисключений.

  3. Управление (модуль управления):

    1. подсистема управления документами;

    2. подсистема управления записями;

    3. подсистема управления web-контентом;

    4. подсистема управления электронной почтой;

    5. подсистема управления цифровыми активами.

  4. Доставка (модуль доставки):

    1. подсистема интеграция контента;

    2. подсистема выборки;

    3. подсистема синдикации;

    4. подсистема локализации;

    5. подсистема публикации.

Рассмотрим состав и структуру модуля семантического ядра. Предлагаемая семантическая подсистема поддерживает следующие варианты использования онтологии: аннотирование объектов; семантический поиск; формирование списка объектов, связанных с исходным объектом; категоризация; индексирование.

Онтологическая модель предметной области задает семантику понятий, которые используются для описания информационных объектов архитектуры КИС. Такие описания называются семантическими метаданными, и они позволяют:



  1. устранить лексическую многозначность терминов, используемых для описания информационных объектов;

  2. определять соответствие между различными информационными объектами, используя онтологию.

Более того, семантические метаданные могут описывать объект с разных точек зрения: структуры, контекста и контента. А в рамках проектируемой архитектуры КИС описание контента наиболее важно, поскольку в архитектуре предусмотрена реализация функции полнотекстовой обработки информации.
  1. Проектирование физического уровня архитектуры КИС


Физический уровень архитектуры КИС характеризует физическую организацию технических средств, реализующих ту или иную совокупность информационных процессов и оснащенных каналами передачи и хранения информации. На данном уровне проектирования архитектуры КИС необходимо обратиться к третьему уровню структуры корпоративной памяти, представленной в табл. 3.1. Предлагаемые уровень обработки данных и организации хранения представлен на рис. 3.6.


  1. Физический уровень архитектуры КИС

Функциональность семантической подсистемы по работе с онтологиями расположена в сервере онтологий, а функциональность по работе с семантическими метаданными - в сервере семантических метаданных. Сервер онтологий – это отдельно функционирующее приложение, хранящее множество онтологий и предоставляющее к ним доступ. Сервер онтологий, в свою очередь, используется различными приложениями и модулями, которым нужны различные функции в процессе ЖЦ ЭД. Связь подсистемы работы с онтологией с другими подсистемами и модулями возможна через подсистему, хранящую правила преобразования данных ЭД в элементы онтологий.

Для реализации в семантической подсистеме выбранных вариантов использования онтологии, сервер онтологий предоставляет следующие функции: хранение онтологий; извлечение онтологий; логический вывод; поиск в онтологии запрашиваемых понятий и отношений.

Сервер семантических метаданных – это отдельно функционирующее приложение, хранящее семантические метаданные, предоставляющее к ним доступ и обрабатывающее их. Для реализации выбранного варианта использования онтологии сервер семантических метаданных, тесно взаимодействует с сервером онтологий и предоставляет следующие функции:



  • составление семантических метаданных;

  • хранение семантических метаданных;

  • извлечение семантических метаданных;

  • сравнение семантических метаданных.

Спроектированные уровни архитектуры КИС соединенные вместе, позволяют увидеть все взаимосвязи между уровнями. Архитектура КИС, спроектированная для управления ЭД с помощью функций семантического ядра, а также в своей концепции имеющая изменение стандартной архитектуры СОА концептуально меняют подход к обработке ЭД в КИС, работая с ЭД одновременно, как с логической единицей системы, так и с объектом, наполненным различными блоками хранения информации, а также метаданными. Принципиальная архитектура КИС представлена в .

Каталог: data -> 2014
2014 -> Реферат Отчет с., главы, 22 рис., табл., 16 источников, прил видео стеганография, стеганография mpeg, сокрытие информации в видео, встраивание и извлечение информации, дискретное косинусное преобразование, помехоустойчивое кодирование, циклические
2014 -> Становление футбольного клуба как бренда на примере фк
2014 -> Проблемы и перспективы взаимодействия Европейского Союза и России по урегулированию локальных кризисов
2014 -> Факторы формирования российского и американского экспорта вооружений в начале XXI века
2014 -> Памятка студентам бакалавриата «Куда обращаться?»
2014 -> «Восприятие института монархической власти в Великобритании, России и в Японии»
2014 -> Программа краткосрочного повышения квалификации работников ниу вшэ
2014 -> Практики краудсорсинга в прикладных социальных исследованиях


Поделитесь с Вашими друзьями:
1   ...   4   5   6   7   8   9   10   11   12


База данных защищена авторским правом ©vossta.ru 2019
обратиться к администрации

    Главная страница