Методические рекомендации по созданию электронного архива г. Улан-Удэ 01 г. Содержание общие положения



страница1/5
Дата14.08.2018
Размер0.72 Mb.
#44026
ТипМетодические рекомендации
  1   2   3   4   5


УПРАВЛЕНИЕ ПО ДЕЛАМ АРХИВОВ РЕСПУБЛИКИ БУРЯТИЯ

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ

«ГОСУДАРСТВЕННЫЙ АРХИВ РЕСПУБЛИКИ БУРЯТИЯ»

МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ

ПО СОЗДАНИЮ ЭЛЕКТРОННОГО АРХИВА

г. Улан-Удэ

2014 г.
СОДЕРЖАНИЕ
1.ОБЩИЕ ПОЛОЖЕНИЯ……………………………………………………..3

2. СТРАТЕГИЯ СОЗДАНИЯ ЭЛЕКТРОННОГО АРХИВА ……………....4

2.1. Понятие и основные этапы создания электронного архива……………4

2.2. Экспертиза документов…………………………………………………..5

2.3. Разработка технического задания…………………………………….....5

2.4. Оцифровывание документов…………………………………………….6

2.4.1. Технология оцифровывания архивных документов…………………6

2.4.2. Требования к качеству изображения цифровых копий документов…………………………………………………………………....10

2.4.3. Выбор формата и способа сжатия данных…………………………...11

2.4.4. Требования к программным средствам и компьютерному оборудованию для просмотра и обработки оцифрованных изображений………………………………………………………………….14



2.5. Индексирование документов и работа с базами данных……………...15

2.5.1. Идентификация цифровых копий……………………………………15

2.5.2. Файл описаний цифровых копий…………………………………….17

2.6. Программно-аппаратные компоненты электронного архива………...20

ПРИЛОЖЕНИЯ………………………………………………………………23

1. ОБЩИЕ ПОЛОЖЕНИЯ


Сегодня наблюдается рост масштабов информатизации архивных учреждений. Документы, создаваемые в электронном виде, позволяют принципиально решить проблему оперативного доступа – осуществлять поиск необходимого документа, его копирование. Появляются широкие возможности для анализа подборок документов по тому или иному заданному признаку, создание тематических отчетов, сортировка документов по хронологии и т.д. Немаловажным моментом является то, что при обеспечении соответствующего режима, условий миграции, электронные документы без опасности несанкционированного удаления и фальсификации могут храниться достаточно длительное время.

Однако, если потребность в технологиях назрела давно, то технические возможности реализации появились относительно недавно, как следствие комбинации следующих факторов:

-появились относительно недорогие носители;

-снизился показатель стоимость/производительность для высокоскоростных вычислительных систем, сетей и устройств;

- получили развитие аппаратно-программные системы, реализующие параллельную обработку запросов;

- повысился уровень интерфейса работы с системами управления базами данных (СУБД);

- появились новые информационные технологии индексирования сверхбольших массивов данных;

- разработаны и развиваются отечественные технологии и программные продукты распознавания и анализа русскоязычных текстов.

Для архивных учреждений как носителей колоссального объема информации наиболее эффективным решением проблемы является перевод документов архива (по крайней мере, наиболее востребованной ее части) в цифровой вид и создание, таким образом, электронного архива. В этой связи целесообразно определить основные направления и принципы создания электронного архива применительно к практической деятельности архивных отделов муниципальных образований Республики Бурятия.

Настоящие рекомендации подготовлены на основе Методических рекомендаций по созданию цифровых копий документов на бумажной основе (утв.приказом ГБУ «ГАРБ» от 26.12.2012 № 44) и согласованных на ЭПК Управления по делам архивов РБ (протокол от 29.11.2012 № 12) и Методических рекомендаций по организации работы и технологическому обеспечению хранения электронных документов (утв.приказом ГБУ «ГАРБ» от 06.06.2014 №21) и согласованных на ЭПК Управления по делам архивов РБ (протокол от 29.05.2014 № 5).



2. СТРАТЕГИЯ СОЗДАНИЯ ЭЛЕКТРОННОГО АРХИВА


2.1. Понятие и основные этапы создания электронного архива

Электронный архив (далее ЭА) - по сути, комплекс аппаратно-программных средств и технологий создания архива документов в электронном виде. Цель создания ЭА состоит в обеспечении оперативного и полноценного доступа ко всем хранящимся и поступающим документам. Для этого требуется решить две основные задачи: ввести массив имеющихся в архиве документов путем оцифровывания и обеспечить возможность оперативного полнотекстового доступа к электронным документам.

В общем виде идею можно изложить следующим образом. Организуется развертывание локально-вычислительной сети, включающей графические рабочие станции(персональные компьютеры) и серверы ввода и обработки информации. Для ввода документов с бумажных носителей низкого качества, используются сканеры потокового ввода и соответствующие программные средства. Информационная система либо оператор обеспечивает эффективное индексирование и полнотекстовый поиск неструктурированной информации большого объема. Данные, необходимые для поиска документов, хранятся в высокопроизводительной и отказоустойчивой системе памяти, а графические образы документов - в виде изображений на носителях, характеризуемых длительным временем хранения и относительно низкой стоимостью.

Основные функции ЭА:

- перевод в электронный вид (сканирование) имеющихся бумажных документов;

- распознавание и корректирование ошибок (подразумевает обязательный контроль на всех этапах работы);

- создание, миграция, хранение электронных документов и образов на оперативных (HDD, RAID) и долгосрочных накопителях (DVD, Blu-Ray, M-Disc и т.п.);

-индексирование документов;

- оперативный поиск и отображение документов вывод и тиражирование документации из электронного архива по заявкам;

- анализ документов;

- управление функционированием системы.

2.2. Экспертиза документов

Экспертиза проводится в самом начале, на подготовительном этапе работы по созданию ЭА и подразумевает обследование массива архивных документов, сформировавшемся в архивном отделе по ряду критериев:

- определение объемов массива (количества дел, папок, книг, карточек, листов), подлежащих обработке;

- определение физического состояния документов (ветхое, удовлетворительное, хорошее);

- форматов документов (А4, А3, А2, А1, А0,>А0, карточные каталоги, расшитые документы, фотографии, книги, широкоформатные документы, карты и т.п.);

- согласование реквизитов документов для их индексирования (типы полей, количество, средняя длина полей, расположение на документе);

- среднее количество листов в документе;

- определение формата электронного ресурса (формат файлов, базы данных, необходимость загрузки в существующую систему, разработка новой информационной системы).


2.3. Разработка технического задания

На первый взгляд, разработка технического задания необходима лишь когда выполнением работы по созданию ЭА занимается сторонняя организация, предоставляющая подобные услуги на профессиональном уровне. Однако, это заблуждение, при определении направлений самостоятельной работы по созданию ЭА также необходим некий исходный документ, своего рода руководство к действию с прописанными требованиями, устанавливающими основное назначение объекта (в нашем случае ЭА).

В техническое задание включается:

- параметры сканирования, сканирующего оборудования и выходные форматы файлов (TIFF, JPEG, PDF и т.п.);

- структура выходной базы данных для загрузки в существующую информационную систему либо параметры разработки новой информационной системы;

- порядок выполнения работ;

- параметры качества и мероприятия по обеспечению конфиденциальности.
2.4.Оцифровывание документов

Архивные документы переводятся в электронный вид методом поточного (массового) сканирования, что также подразумевает некоторые виды работ:

- подготовка массива (сортировка, расшивка документов);

- сканирование и обработка образов;

- проверка отсканированного массива (промежуточный контроль);

- сшивка документов, комплектация, проверка.

В результате сканирования создаются точные электронные копии (электронные образы) документов со всеми артефактами (резолюциями, визами, подписями, печатями, штампами и т.д.). Для сканирования крупноформатных документов, нерасшитых дел и других сброшюрованных документов, книг и альбомов используются так называемые планетарные (книжные) сканеры. В планетарных сканерах документ неподвижен и расположен лицевой стороной вверх на значительном удалении от оптической системы и сканирующего элемента.

При таком методе оцифровки кроме высокого качества сканирования достигается высокая сохранность документов, поскольку отсутствует контакт сканирующих элементов с оригиналами.


2.4.1. Технология оцифровывания архивных документов
Процесс созданий цифровых копий архивных документов включает следующие этапы:

- подготовка документов для оцифровывания;

- оцифровывание документов;

- сверка изготовленных копий с оригиналом на отсутствие пропусков и сохранение надлежащего качества;

- обработка изображений;

- сохранение цифровых копий документов;

- описание цифровых копий документов (архивное аннотирование);

- организация хранения графических информационных массивов.

Необходимо тщательно подходить к отбору документов для создания электронной копии. Выделяются следующие категории документов для оцифровки:


  • документы досоветского периода

  • редкие, особо ценные, ветхие документы и издания

  • повышенного спроса

Существуют принципы отбора документов, в соответствии с которыми:

  • документы должны представлять собой историческую и культурную ценность, нести информацию об истории, особенностях жизни региона.

  • особая редкость документа и повышенная опасность его физического разрушения, утраты.

В соответствии с вышеизложенными требованиями должен быть составлен перечень документов, составляющих план по оцифровыванию, который утверждается руководителем архивного отдела.

Подготовка документов для оцифровывания включает сортировку по виду, формату и качеству предоставленного материала; формирование пакетов оцифровывания для каждого вида оборудования.

В подготовку документов для оцифровывания должно входить выравнивание документа, разгибание краев, очистка от песка, вложенных скрепок, обрывков, выкладывание прошивочных нитей таким образом, чтобы максимально был виден текст или изображение документа.

Сортировка по формату и качеству может потребоваться в случаях, когда сканирующее оборудование требует настройки на определенный набор условий (например, при съемке цифровой фотокамерой со штатива). Как правило, современные книжные сканеры автоматически определяют размер сканируемого объекта и меняют режим сканирования в зависимости от цвета или контрастности оригинала. В таких случаях сортировка по размеру и качеству не требуется.

Некоторые документы сначала необходимо отправлять на реставрацию и после этого подвергать оцифровыванию. Подготовка документа должна вестись исключительно с учётом основных принципов реставрации, т.е. не допускать никаких доработок, искажающих внешний вид и содержание оригинала.

Процесс оцифровывания документов заключается в создании их цифровых копий в виде графических файлов.

Технология оцифровывания определяется техническими особенностями применяемых для этого устройств и должна конкретизироваться в инструкциях операторам таких устройств. Вместе с тем нужно учитывать ряд общих требований:

- на копии должны быть видны края листа, тогда при использовании не будет возникать сомнений, не осталась ли часть информации за кадром;

- для возможности воспроизведения цифровых копий в натуральную величину вместе с документом в кадр нужно помещать узкую линейку с сантиметровыми делениями;

- при сканировании цветных оригиналов в случаях, когда может потребоваться распечатка полноцветной копии, необходимо также помещать в кадр стандартные калибровочные цветовые шкалы (поставляемые вместе со сканером);

- документ может содержать листы, расположенные с нарушением логической последовательности (например, подшитые тетрадным способом). В таких случаях можно снимать документ вместе с полоской текста «Продолжение на листе...» или учитывать это обстоятельство при присвоении файлам идентификационных имен.

При обработке изображений при необходимости осуществляется выравнивание изгиба страниц, улучшение изображений (регулировка баланса яркости - контрастности, корректировка цветовой гаммы, удаление бликов, теней, других шумовых и фоновых элементов) и контроль качества цифровых копий. Выравнивание и поворот страниц могут производиться как аппаратно, так и программно.

При удалении шумовых и фоновых элементов необходимо учитывать, с какой целью создается копия. Если она должна представлять внешний вид документа в репрезентативных целях, то удаление программными средствами особенностей, различимых на оригинале, является неприемлемым. Это допустимо только для пользовательских копий, в которых важно лишь информационное содержание документа. В таких случаях с изображения могут быть удалены (ослаблены) пятна или текст, проступающий с обратной стороны листа.

Сохранение цифровых копий документов предусматривает экспорт графических образов документов в различные форматы и присвоение уникальных буквенно-цифровых имен файлам изображений с целью их однозначной идентификации.

Описание цифровых копий документов (архивное аннотирование) предусматривает создание служебных комментариев (файлов-описаний). Связь графических файлов с файлами-описаниями достигается путем присвоения файлам описаний уникальных буквенно-цифровых имен.

В данном случае речь идет только о первичном описании, отражающем обстоятельства создания копии, но не содержание копируемых документов. В файле описания целесообразно отмечать те особенности документа, которые не всегда отражены в листе-заверителе (литерные листы, ошибки в нумерации, не по порядку подшитые листы и т.п.). Описание должно обязательно фиксировать случаи наличия в деле пустых листов или пропусков в оригинальной нумерации, чтобы у пользователя не возникли сомнения, все ли листы отсканированы. Для поврежденных фрагментов желательно делать пометку «Нечитабельно в оригинале» или т.п.

В дальнейшем (или непосредственно после аннотирования) цифровые копии могут описываться более детально, с применением международных стандартов архивного описания. На копию каждого документа, а в необходимых случаях - на каждый кадр многостраничного документа должна создаваться информационно-поисковая характеристика, призванная обеспечить быстрый поиск нужного файла средствами автоматизированной поисковой системы.

Принципы подробного описания содержательной части документов и их цифровых копий выходят за рамки данных рекомендаций. В каждом архиве они могут быть реализованы по-разному. Следует только отметить, что эта работа, как правило, гораздо более трудоемка, чем собственно оцифровывание. Это обстоятельство нужно учитывать при планировании бюджета времени, предназначенного для работы с цифровыми копиями.

Организация хранения графических информационных массивов в контексте данных рекомендаций означает запись файлов графических образов и созданных описаний на машинные носители. Вопросы учета и последующего хранения носителей с цифровыми копиями должны определяться правилами работы архивов и здесь не рассматриваются.

Одновременно с процессом оцифровывания или после накопления определенного массива документов в графическом формате может проводиться процесс оптического распознавания документов, их перевода в текстовый формат.

В настоящее время распознавание документов эффективно только для печатных и машинописных текстов с высоким качеством печати. Для систем компьютерного распознавания текста уровень предельной экономичности составляет 99,95%. При наличии более 4-5 ошибок на 1000 знаков (символов) текста целесообразен его ручной набор.

Текстовый файл с распознанным текстом призван служить только дополнением к цифровой копии в графическом формате, предназначенным для более эффективного использования. Его создание не предполагает замену им собственно цифровой копии.

Вопрос с оцифровкой документов, пользующихся повышенным спросом, но находящихся в неудовлетворительном физическом состоянии, решается в индивидуальном порядке. Такой документ может быть оцифрован, если есть возможность его реставрации или консервации в ближайшие сроки после копирования. Когда появляется возможность доступа к электронной версии документа, выдачу оригинала, в целях сохранности, необходимо ограничить, а то и вовсе исключить.
2.4.2. Требования к качеству изображения цифровых копий документов
Получение оптимального качества изображения является важнейшей задачей успешного оцифровывания документов. Цифровая копия архивного документа считается качественной, если при ее отображении на экране монитора или распечатке получается практически идентичная копия бумажного документа или изображения, точно воспроизводящая все линии, знаки, символы, тональность и цвет. При условии хорошей читаемости цифровой копии допускается незначительное изменение фона.

Качество оцифровывания зависит от:

- разрешения сканирования, измеряемого в точках на дюйм (dpi);

- режима сканирования, определяемого битовой глубиной (количеством бит на точку) – максимальным числом оттенков (теней) и/или цветов каждой точки цифрового изображения;

- деталей документа (размеров букв, символов, линий, тона и цвета);

- физического состояния документа.

Применяются следующие режимы сканирования:

- черно-белый (двухтоновый)c 1-битовой глубиной, при котором изображение представляет собой сочетание черных и белых точек;

- с градацией серого цвета (полутоновый) - с 8-битовой глубиной, при котором изображение может быть полутоновым, с 256 оттенками цветов в диапазоне от черного к белому;

- цветной - с 24-битовой глубиной, при котором изображение может быть цветным с 16,7 млн. различных оттенков.

Учитывая высокие финансовые затраты и трудоемкость работ по оцифровыванию архивных документов, а также способность цифровых копий при необходимости заменить оригинал, не рекомендуется проводить оцифровывание с низким разрешением, пригодным только для ограниченного использования, а также с параметрами меньшими, чем предлагаемые минимальные параметры.

В зависимости от вида и физических характеристик документов рекомендуется использовать следующие разрешения и режимы оцифровывания:

- чистые, высоко контрастные документы с четко отпечатанным текстом, крупным шрифтом и регулярными интервалами, напечатанные на современном безударном печатающем устройстве (например, с пластмассовой угольной лентой, на струйном или лазерном принтере) - до 600 dpi в режиме двухтонового оцифровывания или до 300 до 400 dpi при оцифровывании с градацией серого цвета;

- рукописи; рисунки пером или карандашом; тексты, напечатанные на пишущей машинке с шелковой лентой; цветные иллюстрации и другие рисунки с изменяющимися полутонами серого цвета; черно-белые и цветные фотографии - от 300 до 400 dpi при оцифровывании с градацией серого цвета;

- документы, где цвет важен для интерпретации информации или содержания, или желания произвести наиболее точное их представление - от 400 до 600 dpi в режиме цветного оцифровывания.

В случаях, если предполагается оптическое распознавание текста, следует учитывать, что темп и качество распознавания возрастает при более высоком пространственном разрешении, заданным при оцифровывании, а также при оцифровывании с градацией серого цвета.




2.4.3. Выбор формата и способа сжатия данных
Для хранения графических образов архивных документов требуется значительное дисковое пространство. Например, цифровая копия архивного документа формата А4, созданная с разрешением 300 dpi в режиме цветного оцифровывания, может быть сохранена в файле объемом 25 Мб; в режиме с градацией серого цвета - 8 Mб; в черно-белом режиме без полутонов - 1 Mб.

Для сокращения размеров графических файлов применяются программные средства сжатия, с помощью которых, например, цифровую копию архивного документа формата А4, созданную с разрешением 300 dpi в режиме цветного оцифровывания, можно уменьшить с 25 Мб до 450 Кб; в режиме с градацией серого цвета - с 8 Мб до 150 Кб; в черно-белом режиме без полутонов с 1 Мб до 30 Кб.

При определении оптимальных форматов хранения и способов сжатия данных должен применяться дифференцированный подход и учитываться следующие факторы:

- эффективное (в несколько раз) программное сжатие, особенно цветных цифровых изображений, может привести к потерям качества, поэтому экономия на размерах файлов за счет качества изображения нежелательна;

- при сохранении оцифрованных изображений, требующих корректировки (настройки резкости, контраста, удаления крупных дефектов), целесообразно применять форматы без сжатия данных или с минимальным сжатием.

Базовым форматом для сохранения графических данных является формат TIFF (Tagged Image File Format). Данный формат в значительной степени не зависит от аппаратно-программной платформы. Формат TIFF работает как со сжатыми, так и с несжатыми массивами данных, причем формат TIFF G4 обеспечивает компрессию черно-белого материала без потери качества.

При сжатии предлагаются на выбор три разных алгоритма: LZW, ZIP и JPEG. Следует учитывать, что из них только алгоритмы LZW и ZIP обеспечивают сжатие без потерь качества, а из соображений совместимости с другими программами рекомендуется выбирать алгоритм LZW, патент на который принадлежит компании Unisys.

Для передачи и хранения данных оцифровывания полутоновых и цветных фотографий используется формат JPEG (Joint Photographic Experts Group). Данный формат работает в режиме переменных коэффициентов сжатия, предполагающих некоторую (обычно неощутимую на глаз) потерю качества. При сильных уровнях сжатия потеря качества становится заметной. Уровень сжатия рекомендуется определять опытным путем, исходя из особенностей конкретных изображений.

Как правило, формат JPEG даже при небольших уровнях сжатия обеспечивает ощутимо меньший объем графического файла, чем формат TIFF. Данный формат может быть рекомендован для окончательного сохранения изображений, которые в дальнейшем не предполагается редактировать.

Одним из возможных способов сохранения изображений является универсальный формат PDF. Он разработан компанией Adobe Systems для представления отформатированных документов, содержащих текст и графику, с помощью программы Adobe Acrobat. Создаваемый в этом формате документ может иметь систему рубрикации в виде многоуровневой системы закладок, что обеспечивает поиск необходимой информации. Преимущество PDF-файлов состоит в их относительной независимости от кодировок и наличия (отсутствия) каких-либо шрифтов на конкретном компьютере, так как файл в формате PDF содержит не только информацию по описанию страницы, но и другие типы информации: шрифты, изображения, команды печати, ключевые слова для поиска и индексации файла, звук, видео, активные формы, гипертекстовые ссылки и т.д. Это позволит использовать цифровые копии фонда пользования без особых требований к компьютеру и программному обеспечению, что очень важно для большинства архивов.

Использование формата PDF позволяет значительно расширить и улучшить защиту документов. Можно задавать защиту от печати, открытия, изменения и доступа к PDF-документу. Можно поставить защиту от изменения документа, при этом, разрешив добавлять к нему комментарии и цифровую подпись. Недостатком формата PDF может стать его ориентация на просмотр изображений в их первоначальном виде и ограничение возможности последующей обработки изображений. Данный недостаток отчасти смягчается тем, что новые версии программного обеспечения Adobe Acrobat (5.0 и выше) позволяют экспортировать изображения через буфер обмена в другие программы (графические редакторы), их обработку и сохранение в графических форматах. Такой подход можно рекомендовать в крайних случаях, но следует учитывать, что конвертирование таким способом большого количества изображений окажется очень медленным и трудоемким процессом.

Поэтому при сохранении в формате PDF цифровых копий, для которых можно предполагать повторное использование с обработкой в графических редакторах, необходимо дублировать образы документов в форматах TIFF, PNG или JPEG. Но нужно учесть, что сегодня невозможно предугадать, какая часть пользователей цифровых копий пожелает обрабатывать их в графических редакторах, и с какими целями. Если спрос на графические файлы в редактируемых форматах окажется велик, то стратегия сохранения в PDF будет ошибочной. Если же редактируемые форматы окажутся невостребованными, то затраты на создание таких файлов пропадут впустую.

Новый формат DjVu обеспечивает сильное сжатие и позволяет существенно экономить дисковое пространство. Для цветных документов, содержащих одновременно текст и графику, файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Однако данный формат является еще более закрытым в сравнении с PDF и обеспечивает только просмотр изображений (для этого необходимо установить одну из свободно распространяемых через Интернет программ-вьюверов, например DjVu Solo), но не их редактирование или конвертацию в другие форматы. Не имеет он и таких мощных средств аннотирования, как PDF. Поэтому формат DjVu может быть рекомендован для создания промежуточных рабочих копий рукописных материалов, которые предполагается затем прочитывать и вручную вводить их в базы данных.

Подобные форматы очень эффективны при обработке отсканированных изображений, с их помощью можно добиться резкого повышения читабельности угасающих текстов, ослабления темного фона, удаления цветных пятен и т.п. Но с точки зрения долговременного хранения такие форматы нежелательны, поскольку являются программно-зависимыми – все их особенности способна воспроизвести, как правило, только «родная» для них программа – графический редактор. В случае, если фирма-разработчик исчезнет с рынка или прекратит сопровождение такого формата, хранимые в нем документы могут стать недоступными.

Потому цифровые копии, улучшенные с помощью графических редакторов, рекомендуется для последующего хранения конвертировать в один из программно-независимых форматов, описанных выше.
2.4.4. Требования к программным средствам и компьютерному оборудованию для просмотра и обработки оцифрованных изображений
Программные средства для просмотра и обработки оцифрованных изображений должны обеспечивать просмотр и обработку форматов, полученных изображений и предусматривать следующие возможности: пролистывание изображений в прямом и обратном порядке; просмотр изображения на полном экране; увеличение как всего изображения, так и отдельных его частей; уменьшение изображения; восстановление первоначального размера объекта; поворот изображения; обращение (инвертирование) изображения; показ технологических записей из заголовка (размер оригинального изображения, пространственное разрешение, формат, количество битов); распечатывание документа. Кроме того, полезно иметь опцию конверсии изображения или сжатия массива.

Для обеспечения процесса сканирования используется программное обеспечение, совместимое со стандартом TWAIN. TWAIN (Toolkit Without An Interesting Name) – в переводе означает «инструментальный набор, для которого не удалось придумать интересного названия», который считается стандартом для периферийных устройств таких как сканеры, т.е. является связующим звеном между компьютером и сканером.

Примеры ПО для сканирования: ABBYY Fine Reader, Adobe PhotoShop, Cognitive Cuineiform, Microsoft Photo Editor, ACDSEE, Irfan View, Xnview, Adobe Acrobat.

Для просмотра и обработки оцифрованных изображений требуется компьютерное оборудование с высокими требованиями по возможности передачи данных и объему оперативной памяти RAM, так как объемы цифровых изображений значительны в сравнении с объемами текстовых файлов.

Минимальным требованиям отвечают персональные компьютеры с процессорами Pentium (Celeron) и тактовой частотой 2000 МГц, операционной системой Windows 2000, XP и выше, оперативной памятью RAM от 256 Mб, жестким диском не менее 80 Гигабайт. Рекомендуемые требования по объему оперативной памяти и емкости жесткого диска в 2–3 раза превышают минимальные.

В контексте требований к рабочей станции особое внимание должно быть уделено размеру экрана монитора - диагональ не менее 19 дюймов, рекомендуется 22 дюйма и более.

Наиболее распространенное программное обеспечение для создания и просмотра цифровых копий документов приводится в приложении 1.
2.5.Индексирование документов и работа с базами данных

После процедуры сканирования, оцифрованные документы подвергаются индексации (далее по тексту употребляется синоним - идентификация) по различным информационным полям (например, тип документа, название, номер дела, дата создания и др.).

При кажущейся простоте процесс индексации документов достаточно сложен, как с организационной, так и с технологической точки зрения. При необходимости обработки больших документальных массивов автоматическое распознавание специальными программами применяется крайне редко, поскольку процент ошибок достаточно велик. Поэтому отсканированные документы поэтапно должны обрабатываться«вручную» подготовленными специалистами.
2.5.1. Идентификация цифровых копий

При идентификации (именовании) файлов цифровых копий необходимо придерживаться единого подхода, а именно, имя файла должно формироваться в виде буквенно-цифрового шифра.

При создании шифров используются буквы латинского алфавита и общепринятые символы. Следует избегать использования пробелов, букв с диакритическими знаками и кириллических букв (особенно ў).

Шифры могут быть полистные, групповые. Полистные шифры применяются для идентификации файлов цифровых копий отдельных листов. Групповые шифры - для идентификации объединенных в единый файл цифровых копий, логически связанных между собой и принадлежащих к делу/единице хранения, описи дел, внутренней описи документов дела.

В процессе оцифровывания архивных документов современными специализированными сканерами не возникает необходимости расшивки дел. И дела оцифровываются сброшюрованными. Обложки дел, титульные листы, заверительные листы, листы использования, внутренние описи и т.д. подлежат оцифровыванию. После оцифровывания их надо относить к цифровым копиям дела.

Для архивов, применяющих традиционную систему классификации «фонд - опись - дело», предлагается следующая структура шифра:



<Индекс архива>_<Тип шифра>_<Характеристика оцифрованного документа>_<Номер фонда>_<Номер описи>_<Номер дела/ед.хр.>_ [<Номер листа [Признак листа]>]_[<Номер литерного листа_ [Признак листа]>], где:

индекс архива – аббревиатура архива;



тип шифра:

L - полистный;

G - групповой;

Т - описания;



Характеристика цифровой копии:

A - архивный документ;

F - опись дел;

D внутренняя опись документов дела;

номер фонда - номер фонда;

номер описи - номер описи дел;

номер дела/ед.хр. - порядковый номер дела (для документов на бумажном носителе);

номер листа - порядковый номер листа (страницы), начиная с 001 для пронумерованных листов; 000 - для не пронумерованных листов вначале дела; end - для не пронумерованных листов в конце дела.

номер литерного листа - принимает значения 1, 2, 3, 4 и т.д. соответственно буквенному значению а, б, в, г и т.д.

признак листа - принимает значения:

«b» - для оборотной стороны листа (для лицевой стороны листа не используется);

«d» - для документа, оцифрованного разворотом (по две страницы), то есть на каждом изображении слева - оборот предыдущего листа, а справа - лицевая сторона следующего листа.

Для типов шифров G и T (группового и описания) параметр <Номер листа [Признак листа]> не используется.

Примеры:


1. GARB_LA_1807_1_25_001b - ГАРБ, цифровая копия листа архивного документа: фонд 1807, опись 1, дело 25, лист 1, оборот.

2. GARB_LF_1807_1_002 - ГАРБ, цифровая копия листа описи дел: фонд 1807, опись 1, лист 2.

3. GARB_LD_1807_1_25_005 - ГАРБ, цифровая копия листа внутренней описи документов дела: фонд 1807, опись 1, дело 25, лист 5.

4. GARB_GА_1807_1_25 - ГАРБ, цифровые копии архивных документов дела: фонд 1807, опись 1, дело 25.

5. GARB_GF_1807_1 - ГАРБ, цифровые копии листов описи дел: фонд 1807, опись 1.

6. GARB_GD_1807_1_25 - ГАРБ, цифровые копии листов внутренней описи документов дела: фонд 1807, опись 1, дело 25.

7. GARB_TA_1807_1_25 - ГАРБ, файл описания цифровых копий архивных документов дела: фонд 1807, опись 1, дело 25.

8. GARB_TF_1807_1 - ГАРБ, файл описания цифровых копий листов описи дел: фонд 1807, опись1.

9. GARB_TD_1807_1_25 - ГАРБ, файл описания цифровых копий листов внутренней описи документов дела: фонд 1807, опись 1, дело 25.

10. GARB_LA_1_1a_4_000_001.jpg - ГАРБ, цифровая копия обложки вначале архивного документа: фонд 1, опись 1а, дело 4.

11. GARB_LA_1_1a_4_000_002.jpg - ГАРБ, цифровая копия титульного листа архивного документа: фонд 1, опись 1а, дело 4.

12. GARB_LA_1_1a_4_end_001.jpg- ГАРБ, цифровая копия обложки в конце архивного документа: фонд 1, опись 1а, дело 4.

13. GARB_LA_1_1a_4_521_1.jpg - ГАРБ, цифровая копия литерного листа документа: фонд 1, опись 1а, дело 4, лист 521а.

14. GARB _LA_1_1a_4_521_1b.jpg - ГАРБ, цифровая копия литерного листа документа: фонд 1, опись 1а, дело 4, лист 521а, оборот.



Поделитесь с Вашими друзьями:
  1   2   3   4   5




База данных защищена авторским правом ©vossta.ru 2022
обратиться к администрации

    Главная страница