Лекция №1. Информация, данные. Информационная система. База данных. Хранилища данных. База знаний. Банк данных, предметная область банка данных, пользователи, администратор бд



Скачать 108.18 Kb.
Дата10.04.2019
Размер108.18 Kb.
ТипЛекция

Лекция №1. Информация, данные. Информационная система. База данных. Хранилища данных. База знаний. Банк данных, предметная область банка данных, пользователи, администратор БД.

Цель: определить разницу между базой данных и системой управления базой данных. Ознакомиться с основными требованиями, которые предъявляются к банку данных и основными определениями, относящимися к БД и СУБД.

Прежде чем приступить к изучению принципов организации баз данных рассмотрим базовые понятия курса, такие как «данные, предметная область, база данных».

С точки зрения пользователей автоматизированных информационных систем данные являются информацией, фиксированной в определенной форме, пригодной для последующей обработки и хранения.

Как правило, набор данных относится к определенной области знаний объектов, событий. Такую область принято называть предметной областью для данного набора данных.

Информация - любой вид сведений о предметах, фактах, понятиях предметной области, неизвестных до их получения и являющихся объектом хранения, передачи и обработки.

Предметная область - совокупность объектов реального или предполагаемого мира, рассматриваемых в пределах данного контекста, который понимается как отдельное рассуждение, фрагмент научной теории или теория в целом и ограничивается рамками данного контекста.

Среда передачи данных - любая физическая среда, способная передавать информацию с помощью электромагнитных или других сигналов.

Данные - представление информации в формализованном виде, удобном для пересылки, сбора, хранения и обработки.

Решая конкретную задачу, необходимо выбрать множество данных, представляющих реальную ситуацию. Затем надлежит выбрать способ представления этой информации. Представление данных определяется исходя из средств и возможностей, допускаемых компьютером и его программным обеспечением. С развитием вычислительной техники и программирования средства и возможности представления данных получили большое развитие и теперь позволяют использовать как простейшие неструктурированные данные, так и данные более сложных типов, полученные с помощью комбинации простейших данных.



Процессы обработки информации всегда являлись основой человеческой деятельности и объединение таких процессов с информационными ресурсами, со временем стали называть информационными системами (ИС).

ИС – это комплекс, состоящий из информационной базы (хранилища информации) и процедур, позволяющих накапливать, хранить, корректировать, осуществлять поиск, обработку и выдачу информации. С появлением вычислительной техники ИС пережили качественный, революционный процесс развития превратившись в автоматизированные информационные системы (АИС), т.е. – информационные системы, физическими и функциональными компонентами которых являются программно-технический комплекс и средства связи.

Современные АИС представляют собой чрезвычайно сложные человеко-машинные комплексы, интегрированные (неразрывно связанные) в национальную и мировую информационные среды. Именно эта интеграция и создает эффективную научно-техническую базу информационного общества, так как изолированные АИС в настоящее время малоэффективны. 

Рассмотрим общий смысл понятий базы данных (БД) и системы управления базами данных (СУБД).

С самого начала развития вычислительной техники образовались два основных направления использования ее.

Определение основных терминов

Дадим определения основных терминов. В качестве составных частей схемы выделяются информация (входная и выходная) и правила ее преобразования.

Правила могут быть в виде алгоритмов, процедур и эвристических последовательностей.



Алгоритм

- последовательность правил перехода от исходных данных к результату. Правила могут выполняться компьютером или человеком.

Данные

- совокупность объективных сведений.

Информация

- сведения, неизвестные ранее получателю информации, пополняющие его знания, подтверждающие или опровергающие положения и соответствующие убеждения. Информация носит субъективный характер и определяется уровнем знаний субъекта и степенью его восприятия. Информация извлекается субъектом из соответствующих данных.

Знания

- совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача.

Кортеж

- совокупность полей или запись.

Объект

- термин, обозначающий факт, лицо, событие, предмет, о котором могут быть собраны данные.

Сущность

- примитивный объект данных, отображающий элемент предметной области (человек, место, вещь и т.д.).

Под базой данных (БД) понимают совокупность хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений.

Целью создания баз данных, как разновидности информационной технологии и формы хранения данных, является построение системы данных, не зависящих от принятых алгоритмов (программного обеспечения), применяемых технических средств и физического расположения данных в ЭВМ; обеспечивающих непротиворечивую и целостную информацию при нерегламентируемых запросах. БД предполагает многоцелевое ее использование (несколько пользователей, множество форм документов и запросов одного пользователя).

База знаний (БЗ) представляет собой совокупность БД и используемых правил, полученных от лиц, принимающих решения (ЛПР).

Наряду с понятием "база данных" существует термин "банк данных", который имеет две трактовки.



  1. В настоящее время данные обрабатываются децентрализовано (на рабочих местах) с помощью персональных компьютеров (ПК). Первоначально же использовалась централизованная обработка на больших ЭВМ. В силу централизации базу данных называли банком данных и потому часто не делают различия между базами и банками данных.

  2. Банк данных - база данных и система управления ею (СУБД). СУБД (например, FoxPro) представляет собой приложение для создания баз данных как совокупности двумерных таблиц.

Банк данных (БнД)

- это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных.

Базы данных (БД)

- это именованная совокупность данных, отображающая состояние объектов и их отношения в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимы для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных могут меняться - но и это есть проявления постоянства - постоянная актуальность.

Система управления базами данных (СУБД)

- это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

Иногда в составе банка данных выделяют архивы. Основанием для этого является особый режим использования данных, когда только часть данных находится под оперативным управлением СУБД. Все остальные данные обычно располагаются на носителях, оперативно не управляемых СУБД. Одни и те же данные в разные моменты времени могут входить как в базы данных, так и в архивы. Банки данных могут не иметь архивов, но если они есть, то в состав банка данных может входить и система управления архивами.

Эффективное управление внешней памятью являются основной функцией СУБД. Эти обычно специализированные средства настолько важны с точки зрения эффективности, что при их отсутствии система просто не сможет выполнять некоторые задачи уже по тому, что их выполнение будет занимать слишком много времени. При этом ни одна из таких специализированных функций не является видимой для пользователя. Они обеспечивают независимость между логическим и физическим уровнями системы: прикладной программист не должен писать программы индексирования, распределять память на диске и т. д.

Основные требования, предъявляемые к банкам данных

Развитие теории и практики создания информационных систем, основанных на концепции баз данных, создание унифицированных методов и средств организации и поиска данных позволяют хранить и обрабатывать информацию о все более сложных объектах и их взаимосвязях, обеспечивая многоаспектные информационные потребности разных пользователей. Основные требования, предъявляемые к банкам данных, можно сформулировать так:



  • Многократное использование данных: пользователи должны иметь возможность использовать данные различным образом.

  • Простота: пользователи должны иметь возможность легко узнать и понять, какие данные имеются в их распоряжении.

  • Легкость использования: пользователи должны иметь возможность осуществлять (процедурно) простой доступ к данным, при этом все сложности доступа к данным должны быть скрыты в самой системе управления базами данных.

  • Гибкость использования: обращение к данным или их поиск должны осуществляться с помощью различных методов доступа.

  • Быстрая обработка запросов на данные: запросы на данные, должны обрабатываться с помощью высокоуровневого языка запросов, а не только прикладными программами, написанными с целью обработки конкретных запросов.

  • Язык взаимодействия конечных пользователей с системой должен обеспечивать конечным пользователям возможность получения данных без использования прикладных программ.

  • Сохранение затрат умственного труда: существующие программы и логические структуры данных не должны переделываться при внесении изменений в базу данных.

  • Наличие интерфейса прикладного программирования: прикладные программы должны иметь возможность просто и эффективно выполнять запросы на данные; программы должны быть изолированными от расположения файлов и способов адресации данных.

  • Распределенная обработка данных: система должна функционировать в условиях вычислительных сетей и обеспечивать эффективный доступ пользователей к любым данным распределенной БД, размещенным в любой точке сети.

  • Адаптивность и расширяемость: база данных должна быть настраиваемой, причем настройка не должна вызывать перезаписи прикладных программ. Кроме того, поставляемый с СУБД набор предопределенных типов данных должен быть расширяемым - в системе должны иметься средства для определения новых типов и не должно быть различий в использовании системных и определенных пользователем типов.

  • Контроль целостности данных: система должна осуществлять контроль ошибок в данных и выполнять проверку взаимного логического соответствия данных.

  • Восстановление данных после сбоев: автоматическое восстановление без потери данных транзакции. В случае аппаратных или программных сбоев система должна возвращаться к некоторому согласованному состоянию данных.

  • Вспомогательные средства должны позволять разработчику или администратору базы данных предсказать и оптимизировать производительность системы.

  • Автоматическая реорганизация и перемещение: система должна обеспечивать возможность перемещения данных или автоматическую реорганизацию физической структуры.

Компоненты банка данных

Определение банка данных предполагает, что с функционально-организационной точки зрения банк данных является сложной человеко-машинной системой, включающей в себя все подсистемы, необходимые для надежного, эффективного и продолжительного во времени функционирования.

В структуре банка данных выделяют следующие компоненты:


Пользователи БД и СУБД

Пользователей (СУБД) можно разделить на две основные категории: конечные пользователиадминистраторы баз данных.

Особо следует поговорить об администраторе базы данных (АБД). Естественно, что база данных строится для конечного пользователя (КП). Однако первоначально предполагалось, что КП не смогут работать без специалиста-программиста, которого назвали администратором базы данных. С появлением СУБД они взяли на себя значительную часть функций АБД, особенно для БД с небольшим объемом данных. Однако для крупных централизованных и распределенных баз данных потребность в АБД сохранилась. В широком плане под АБД понимают системных аналитиков, проектировщиков структур данных и информационного обеспечения, проектировщиков технологии процессов обработки, системных и прикладных программистов, операторов, специалистов в предметной области и по техническому обслуживанию. Иными словами, в крупных базах данных это могут быть коллективы специалистов.

В обязанности администратора БД входит:



  1. анализ предметной области, статуса информации и пользователей;

  2. проектирование структуры и модификация данных;

  3. задание и обеспечение целостности;

  4. загрузка и ведение БД;

  5. защита данных;

  6. обеспечение восстановления БД;

  7. сбор и статистическая обработка обращений к БД, анализ эффективности функционирования БД;

  8. работа с пользователем.

Вопросы для самопроверки

  1. Дайте определение базы данных.

  2. Дайте определение банка данных.

  3. Назовите две трактовки банка данных.

  4. Что такое система управления базой данных?

  5. Основные требования, предъявляемые к банку данных.

  6. Что такое данные, информация, знания?

  7. Пользователи СУБД и БД?

  8. Основные функции администратора БД.

  9. Что обеспечивает возможность быстрой и дешевой разработки новых приложений?



Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©vossta.ru 2019
обратиться к администрации

    Главная страница