36263

Хранение информации. Структура базовой информационной технологии

Доклад

Информатика, кибернетика и программирование

Хранение информации данных не является самостоятельной фазой в информационном процессе а входит в состав фазы обработки. Различают структурированные данные в которых отражаются отдельные факты предметной области это основная форма представления данных в СУБД и неструктурированные произвольные по форме включающие и тексты и графику и прочие данные. Эта форма представления данных широко используется например в Интернеттехнологиях а сами данные предоставляются пользователю в виде отклика поисковыми системами. Организация того или...

Русский

2015-01-19

130 KB

169 чел.

PAGE   \* MERGEFORMAT 3

Вопрос 2. Хранение информации.

Хранение информации (данных) не является самостоятельной фазой в информационном процессе, а входит в состав фазы обработки. Однако, в силу важности организации хранения, данный материал вынесен в отдельный раздел. 

Различают структурированные данные, в которых отражаются отдельные факты предметной области (это основная форма представления данных в СУБД), и неструктурированные, произвольные по форме, включающие и тексты, и графику, и прочие данные. Эта форма представления данных широко используется, например, в Интернет-технологиях, а сами данные предоставляются пользователю в виде отклика поисковыми системами.

Организация того или иного вида хранения данных (структурированных или неструктурированных) связана с обеспечением доступа к самим данным. Под доступом понимается возможность выделения элемента данных (или множества элементов) среди других элементов по каким-либо признакам с целью выполнения некоторых действий над элементом. При этом под элементом понимается как запись файла (в случае структурированных данных), так и сам файл (в случае неструктурированных данных).

Для данных любого вида доступ осуществляется с помощью специальных данных, которые называются ключевыми (ключами). Для структурированных данных такие ключи входят в состав записей файлов в качестве отдельных полей записей. Для неструктурированных поисковые слова или выражения входят, как правило, в искомый текст. С помощью ключей выполняется идентификация требуемых элементов в информационном массиве (массиве хранения данных).

Дальнейшее изложение фазы хранения информации относится к структурированным данным.

Модели структурированных данных и технологии их обработки основаны на одном из трех способов организации хранения данных: в виде линейного списка (или табличном), иерархическом (или древовидном), сетевом.

Хранение информации – это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.

Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.

Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии.

В результате реализации такого алгоритма, документ, независимо от формы представления, поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где он помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.

Этап хранения информации может быть представлен на следующих уровнях:

• внешнем;

• концептуальном, (логическом);

• внутреннем;

• физическом.

Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе реализации их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Способы организации хранения информации связаны с ее поиском – операцией, предполагающей извлечение хранимой информации.

Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней. Эти методы применяются для работы с файлами, графическими базами данных и т.д.

Рис. 1 Алгоритм процесса подготовки информации к хранению

Маркер – метка на носителе информации, обозначающая начало или конец данных либо их части (блока).

В современных носителях информации используются маркеры:

•  адреса (адресный маркер) – код или физическая метка на дорожке диска, указывающие на начало адреса сектора;

•  группы – маркер, указывающий начало или конец группы данных;

•  дорожки (начала оборота) – отверстие на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.

•  защиты – прямоугольный вырез на носителе (картонном пакете, конверте, магнитном диске), разрешающий выполнение любых операций над данными: запись, чтение, обновление, удаление и др.;

• конца файла – метка, используемая для указания окончания считывания последней записи файла;

• ленты (ленточный маркер) – управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;

• сегмента – специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого сегмента.

Хранение информации в ЭВМ связано как с процессом ее арифметической обработки, так и с принципами организации информационных массивов, поиска, обновления, представления информации и др.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Массив – упорядоченное множество данных.

Информационный массив система хранения информации, включающая представление данных и связей между ними, т.е. принципы их организации.

Хранение информации осуществляется на специальных носителях. Исторически наиболее распространенным носителем информации была бумага, которая, однако, непригодна в обычных (не специальных) условиях для длительного хранения информации. Для ЭВТ по материалу изготовления различают следующие машинные носители: бумажные, металлические, пластмассовые, комбинированные и др.

По принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.

По методу считывания различают контактные, магнитные, электрические, оптические. Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе. Выделяют носители прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается следующими параметрами: временем доступа, емкостью памяти и плотностью записи.

Таким образом можно заключить, что хранение информации представляет процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.

Хранение информации

Информация, закодированная с помощью естественных и формальных языков, а также информация в форме зрительных и звуковых образов хранится в памяти человека. Однако для долговременного хранения информации, ее накопления и передачи из поколения в поколение используются носители информации.

Материальная природа носителей информации может быть различной: молекулы ДНК, которые хранят генетическую информацию; бумага, на которой хранятся тексты и изображения; магнитная лента, на которой хранится звуковая информация; фото- и кинопленки, на которых хранится графическая информация; микросхемы памяти, магнитные и лазерные диски, на которых хранятся программы и данные в компьютере, и так далее.

По оценкам специалистов, объем информации, фиксируемой на различных носителях, превышает один эксабайт в год (1018 байт/год). Примерно 80% всей этой информации хранится в цифровой форме на магнитных и оптических носителях и только 20% - на аналоговых носителях (бумага, магнитные ленты, фото- и кинопленки). Если всю записанную в 2000 году информацию распределить на всех жителей планеты, то на каждого человека придется по 250 Мбайт, а для ее хранения потребуется 85 миллионов жестких магнитных дисков по 20 Гбайт.

Информационная емкость носителей информации. Носители информации характеризуются информационной емкостью, то есть количеством информации, которое они могут хранить. Наиболее информационно емкими являются молекулы ДНК, которые имеют очень малый размер и плотно упакованы. Это позволяет хранить огромное количество информации (до 1021 битов в 1 см3), что дает возможность организму развиваться из одной-единственной клетки, содержащей всю необходимую генетическую информацию.

Современные микросхемы памяти позволяют хранить в 1 см3 до 1010 битов информации, однако это в 100 миллиардов раз меньше, чем в ДНК. Можно сказать, что современные технологии пока существенно проигрывают биологической эволюции.

Однако если сравнивать информационную емкость традиционных носителей информации (книг) и современных компьютерных носителей, то прогресс очевиден. На каждом гибком магнитном диске может храниться книга объемом около 600 страниц, а на жестком магнитном диске или DVD - целая библиотека, включающая десятки тысяч книг.

Надежность и долговременность хранения информации. Большое значение имеет надежность и долговременность хранения информации. Большую устойчивость к возможным повреждениям имеют молекулы ДНК, так как существует механизм обнаружения повреждений их структуры (мутаций) и самовосстановления.

Надежность (устойчивость к повреждениям) достаточно высока у аналоговых носителей, повреждение которых приводит к потери информации только на поврежденном участке. Поврежденная часть фотографии не лишает возможности видеть оставшуюся часть, повреждение участка магнитной ленты приводит лишь к временному пропаданию звука и так далее.

Цифровые носители гораздо более чувствительны к повреждениям, даже утеря одного бита данных на магнитном или оптическом диске может привести к невозможности считать файл, то есть к потере большого объема данных. Именно поэтому необходимо соблюдать правила эксплуатации и хранения цифровых носителей информации.

Наиболее долговременным носителем информации является молекула ДНК, которая в течение десятков тысяч лет (человек) и миллионов лет (некоторые живые организмы), сохраняет генетическую информацию данного вида.

Аналоговые носители способны сохранять информацию в течение тысяч лет (египетские папирусы и шумерские глиняные таблички), сотен лет (бумага) и десятков лет (магнитные ленты, фото- и кинопленки).

Цифровые носители появились сравнительно недавно и поэтому об их долговременности можно судить только по оценкам специалистов. По экспертным оценкам, при правильном хранении оптические носители способны хранить информацию сотни лет, а магнитные - десятки лет.

Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных, склада (хранилища) данных.

База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных - система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.

Система баз данных - совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (ХД - используют также термины Data Warehouse, «склад данных», «информационное хранилище») - это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых - автоматическое; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных - множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

Каждый из участников действия (пользователь, группа пользователей, «физическая память») имеет свое представление об информации

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое).

Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность-связь», ER-модель, модель Чена), бинарные и инфологические модели, семантические сети).

Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.

Структура базовой информационной технологии.

Определим структуру и состав типовой ИТ. Мы будем называть типовую ИТ базовой , если она ориентирована на определенную область применения. Базовая ИТ создает модели, методы средства решения задач. Базовая ИТ создается на основе базовых (типовых) аппаратно-программных средств. Базовая ИТ подчинена основной цели - решению функциональных задач в своей предметной области (задачи управления, проектирования, научного эксперимента, испытания и т. д.).

На вход базовой ИТ как системы поступает комплекс решаемых задач, для которых должны быть найдены типовые решения с помощью методов и средств, присущих именно ИТ. Рассмотрим использование базовой ИТ на концептуальном, логическом и физическом уровнях.

Концептуальный уровень базовой ИТ - задается идеология автоматизированного решения задач. Типовая последовательность решения задач может быть представлена в виде алгоритма.

Рис.2. Концептуальная модель базовой ИТ.

Начальный этап - постановка задачи (ПЗ). Если эта задача автоматизированного управления, то она представляет собой совокупность взаимосвязанных алгоритмов, которые обеспечивают управление. ПЗ - содержательное описание задачи: целевое назначение задачи, экономико-математическая модель и метод ее решения, функциональная и информационная взаимосвязь с другими задачами. Оформляется документально в методических материалах «Постановка задачи и алгоритм решения». На этом этапе очень важна корректность описания с точки зрения критериев.

Следующий этап - формализация задачи (ФЗ). Разрабатывается математическая модель.

Если математическая модель установлена, следующий этап - алгоритмизация задачи (АЗ). Алгоритм - процесс преобразования исходных данных в искомое результат за конечное число шагов.

Реализация алгоритма на основе конкретных вычислительных средств осуществляется на этапе программирования задачи - ПРЗ. Это объемная задача, но она осуществляется как правило на типовых технологиях программирования.

При наличии программы осуществляется РЗ - решение задач - получение конкретных результатов для входных данных и принятых ограничений.

Этап АР - анализ решения. При анализе решения можно уточнить модель формализации задач.

Наиболее сложными, творческими и объемными являются этапы постановки задачи и ее формализации. Понятие первоначальной задачи - это глубокое понимание процессов в предметной области.

В условиях базовой ИТ глобальная задача - это разработка модели предметной области (МПО).

При реализации ИТ часто встречаются с плохо формализуемыми задачами. Тут приходят на помощь экспертные системы. В основу ЭС закладываются знания лучших экспертов в предметной области. Разработчик ЭС собирает все известные способы формализации данной задачи. Пользователь - разработчик данной ИТ - получает варианты решения задач. Это процесс автоматизирования проектирования ИТ.

Логический уровень создания ИТ. Модели базовой ИТ

На логическом уровне устанавливают модели решения задачи и организации информационных процессов. Если известна общая модель управления некой АСУ, в которую будет внедряться базовая ИТ, мы можем представить взаимосвязь моделей базовой ИТ.

Цель базовой ИТ на логическом уровне - построение модели решаемой задачи и ее реализация на основе организации информационных процессов.

Рассмотрим взаимосвязь моделей базовой ИТ на схеме.

Рис.3. Логический уровень базовой ИТ. Модель организации информационных процессов.

Модель решения задачи в условиях выбранной базовой ИТ согласуется с моделью организации информационных процессов (МОИП). МОИП включает в себя МОД (модель обработки данных), МО (модель обмена данными), МУПД (модель управления данными), МНД(модель накопления данных), МПЗ (модель представления знаний). Каждая из этих моделей отражает определенные информационные процессы и содержит базы построения частных матмоделей конкретного информационного процесса.

Модель обмена - оценивает вероятностно-временные характеристики процесса обмена с учетом маршрутизации (М), коммутации (К) и передачи (П) информации. В качестве воздействий в этом процессе участвуют: входные (потоки сообщений); мешающие (потоки ошибок), и управляющие (потоки управления). На основании этой модели синтезируют систему обмена данными, то есть выбирают технологию сети, метод оптимальной коммутации, маршрутизации.

Модель накопления данных МНД. Определяет схему информационной базы СИБ, устанавливает логическую организацию информационных массивов ОИМ, задает физическое размещение информационных массивов РИМ.

Информационный массив - основное понятие, основной элемент внутримашинного информационного обеспечения. ИМ - совокупность данных по группе однородных объектов, содержащих одинаковый набор сведений. ИМ могут включать информацию:

  •  программы ОС и тестовые программы (обеспечивают работу ЭВМ);
  •  прикладные программы (обеспечивают решение набора функциональных задач);
  •  библиотека стандартных программ.

Типы информационных массивов:

  •  постоянные (формируются до начала работы системы - директивные, справочные, нормативные данные - не изменяемые во времени);
  •  промежуточные (возникают как результат предыдущего расчета и основа для следующего);
  •  текущие (содержат рабочую информацию о состоянии управляемого объекта);
  •  служебные (обслуживают остальные массивы);
  •  вспомогательные (возникают при операциях над основными массивами).

По виду носителя ИМ делятся на массивы на машинных (внутренних и внешних) и немашинных носителях.

Особенность ИМ - его структура, способ упорядочивания данных по ключевым признакам. Записи могут упорядочиваться по возрастанию или убыванию значения ключевого признака. В качестве ключевого выбирается наиболее часто встречающийся признак.

Модель обработки данных МОД. Она определяет организацию вычислительных процессов ОВП для решения задач пользователя. Последовательность и процедуры решения вычислительных задач должны быть оптимизированы с точки зрения критериев: объем памяти, ресурсы, числа обращений и т. д. Организация процесса впрямую зависит от предметной области. При разработке базовой ИТ прежде всего следует правильно выбрать ОС. Именно ОС задает реальные возможности по управлению вычислительным процессом.

Структура вычислительного процесса задается числом задач. Очень важными являются требования к моменту запуска и выпуска (выхода результатов) задач. Эти моменты определяют динамику получения результатов, то есть динамику всего процесса управления производством.

Первые ОС были ориентированы на пакетную обработку информации. Этот режим в принципе не пригоден для задач управления большой размерности и оперативности. Переход к системам разделения времени позволил в условиях прерывания отдавать предпочтение приоритетным задачам. Оказалось возможным планировать вычислительный процесс.

Новые возможности для пользователя заложены в виртуальных ОС. Она позволила пользователю иметь неограниченный вычислительный ресурс, не замечая работы соседних пользователей. В условиях распределенной обработки данных возникают новые требования к вычислительному процессу. Требуется не только распределить вычислительный ресурс между пользователями и их вычислительными задачами, но и учесть топологию пользователей.

При создании моделей организации вычислительного процесса (ОВП) используют два возможных подхода: детерминированный и вероятностный. При детерминированном подходе применяется теория расписаний очередности задач при накладываемых ограничениях. К сожалению, в этот удобный метод вмешиваются случайные помехи. Могут возникнуть непредвиденные задачи, требующие срочного решения. Для них выделяются дополнительные интервалы времени. При вероятностном подходе устанавливает средний вычислительный ресурс, среднее время выполнения программы, усредненная производительность вычислительной системы. Усредненные параметры рассчитываются на основании статистических данных и постоянно корректируются.

Если мы склонны к типизации решаемых вычислительных задач для конкретной ИТ, то очень большое значение имеет разработка пакетов прикладных программ (ППП).

Среди моделей обработки данных следует еще упомянуть имитационные модели. С их помощью решаются задачи планирования организации вычислительного процесса.

Модель представления знаний МПЗ. Модели представления знаний являются основой автоматизированного решения задач управления. Модели представления знаний существуют в виде логического Л, алгоритмического А, семантического С, фреймового Ф и интегрального И представлений.

Модель управления данными МУПД. Управление данными - управление процессами накопления, обмена и обработки данных. Накопление данных сейчас происходит в условиях современных бах данных, при этом управляющее воздействие должны обеспечить ввод информации, обновление ее, размещение массивов в БД. Эти функции осуществляет современная СУБД.

С появлением ЭВМ данные накапливались в виде совокупности одинаково построенных записей - файлов. При решении каждой новой задачи создавались новые файлы. Логическая связь между файлами отсутствовала. Возникала проблема целостности данных. Для каждого обращения к файлам создавалась своя программа. Отдельные данные в файлах дублировались. Совершенствование вычислительной техники и одновременно рост объемов информации привели к появлению концепции баз данных. В БД записи взаимосвязаны, могут совместно использоваться для решения все новых задач.

В зависимости от решаемых задач выбираются модели баз данных.

Современное производство решает огромное количество рутинных информационных задач. Но и очень велико количество задач, требующих информацию для принятия решения. Для этого требуется новые подходы к формированию данных, вводу и выводу их, обработке. Эти новые подходы реализуются с помощью новых ИТ, реализующих их взаимную организацию. Этой организацией ведает модель управления данными. Модель базируется на том, что данные обладают относительной стабильностью. Стабильность структуры данных дает возможность строить базы со стабильной структурой. А получаемую информацию отображать в виде переменных значений данных в этой стабильной структуре.

В соответствии с моделью предметной области может быть сформирован класс данных для всех решаемых задач. На логическом уровне предметная БД включает в себя логические записи, их элементы и взаимосвязь между ними.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие к одному» и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие теоретико-множественного отношения, она базируется на реляционной алгебре и теории отношений.

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

По наиболее характерным признакам БД можно классифицировать следующим образом:

по способу хранения информации:

  •  интегрированные;
  •  распределенные;

по типу пользователя:

  •  монопользовательские;
  •  многопользовательские;

по характеру использования данных:

  •  прикладные;
  •  предметные.

В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используемым приложениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изменяемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффективности функционирования, особенно это касается быстродействия.

Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объема, оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевлении, широкое внедрение сетей передачи данных способствовало внедрению распределенных БД. Распределение данных по месту их использования может осуществляться различными способами:

  1.  Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно;
  2.  Подмножество данных. Группы данных, совместимые с исходной базой данных, хранятся отдельно для местной обработки;
  3.  Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень;
  4.  Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные;
  5.  Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему;
  6.  Несовместимые данные. Независимые базы данных, спроектированные без координации, требующие объединения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления:

  •  прикладные БД, ориентированные на конкретные приложения, например, может быть создана БД для учета и контроля поступления материалов;
  •  предметные БД, ориентированные на конкретный класс данных, например, предметная БД «Материалы», которая может быть использована для различных приложений.

Конкретная реализация системы баз данных с одной стороны определяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.

Для работы с БД используется специальный обобщенный инструментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

  •  независимость данных на концептуальном, логическом, физическом уровнях;
  •  универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);
  •  совместимость, неизбыточность;
  •  безопасность и целостность данных;
  •  актуальность и управляемость.

Существуют два основных направления реализации СУБД: программное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции:

  •  описание данных на концептуальном и логическом уровнях;
  •  загрузку данных;
  •  хранение данных;
  •  поиск и ответ на запрос (транзакцию);
  •  внесение изменений;
  •  обеспечение безопасности и целостности.

Обеспечивает пользователя следующими языковыми средствами:

  •  языком описания данных (ЯОД);
  •  языком манипулирования данными (ЯМД);
  •  прикладным (встроенным) языком данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так называемых машин баз данных (МБД). Их появление вызвано возросшими объемами информации и требованиями к скорости доступа. Слово «машина» в термине МБД означает вспомогательный периферийный процессор. Термин «компьютер БД» - автономный процессор баз данных или процессор, поддерживающий СУБД.

Основные направления МБД:

  •  параллельная обработка;
  •  распределенная логика;
  •  ассоциативные ЗУ;
  •  конвейерные ЗУ;
  •  фильтры данных и др.

Совокупность процедур проектирования БД можно объединить в четыре этапа. На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Эти требования документируются в форме, доступной конечному пользователю и проектировщику БД. Обычно при этом используется методика интервьюирования персонала различных уровней управления.

Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначальный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователей на основе различных подходов.

В процессе логического проектирования высокоуровневое представление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД может быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объем данных в каждом приложении, общий объем данных и т.д.). На основе этих оценок логическая структура может быть усовершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответствующую модель.

Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на основе модели. Основными факторами, определяющими методику расчленения, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.

Модели приложений могут быть классифицированы следующим образом:

  1.  Приложения, использующие единственный файл.
  2.  Приложения, использующие несколько файлов, в том числе:

- допускающие независимую параллельную обработку;

- допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в первую очередь рассмотреть возможность использования определенных допущений, упрощающих функции СУБД, например, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУБД и рассматриваемую фазу проектирования.

Средства проектирования и оценочные критерии используются на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проектирования, практически не подверженным влиянию стиля проектирования.

В настоящее время неопределенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, представлены ниже.

Количественные критерии: время, необходимое для ответа на вопрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.

Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.

Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимым изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных - информационная поддержка принятия решений, а не оперативная обработка данных. Потому база данных и склад данных не являются одинаковыми понятиями.

Основные функции репозитариев:

  •  парадигма включения/выключения и некоторые формальные процедуры для объектов;
  •  поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;
  •  оповещение инструментальных и рабочих систем об интересующих их событиях;
  •  управление контекстом и разные способы обзора объектов репозитария;
  •  определение потоков работ.

Рассмотрим кратко основные направления научных исследований в области баз данных:

  •  развитие теории реляционных баз данных;
  •  моделирование данных и разработка конкретных моделей разнообразного назначения;
  •  отображение моделей данных, направленных на создание методов их преобразования и конструирования коммутативных отображений, разработку архитектурных аспектов отображения моделей данных и спецификаций определения отображений для конкретных моделей данных;
  •  создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;
  •  разработка, выбор и оценка методов доступа;
  •  создание самоописываемых баз данных, позволяющих применить единые методы доступа для данных и метаданных;
  •  управление конкурентным доступом;
  •  развитие системы программирования баз данных и знаний, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;
  •  совершенствование машины баз данных;
  •  разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных;
  •  интеграция неоднородных информационных ресурсов.


 

А также другие работы, которые могут Вас заинтересовать

38951. Особенности анализа оптических сигналов с помощью процедуры двумерного ДПФ. Методические погрешности 298 KB
  Массив gk1k2 трактуется как результат дискретизации некоторого изображения или излучающей поверхности gху т. что отсчеты спектра соответствующие высоким пространственным частотам находятся в центральной ийласти результирующего массива а соответствующие низким пространственным частотам в угловых областях Для...
38952. Синтез линейных элементов ОЭП с помощью процедуры дискретной свертки (ДС). Вид выражения одномерной и двумерной ДС, его связь с аналоговой сверткой 784 KB
  сигнала gτ St – сигналы на входе и выходе ht – ИХ линейного элемента При проектировании gτ St известны ht искомая. сигнала является дискретным аналогом свертки. сигнала hk – отсчеты ИХ ЛЭ ym – результирующая последовательность отсчетов вых. сигнала При переходе к автоматическому проектированию необходимо вхю сигнал и ИХ ограничить некоторым временным интервалом затем дискретезировать.
38953. Синтез случайных величин как базовая операция процедуры анализа параметрической чувствительности. Методы: «обратной функции», Неймана, «кусочной аппроксимации» 353.5 KB
  Синтез случайных величин как базовая операция процедуры анализа параметрической чувствительности. расчет качества ОЭС при условии изменения параметров элементов в соответствии с законами распределения их как случайных величин. Ядро процедуры – синтез случайных величин с известными параметрами. Методы синтеза основаны на преобразовании исходной последовательности значений gk случ велич Г р м распределенной в интервале [0;1] в последовательность значений xi случ величины Х с заданной функцией распределения ФР Fx или плотностью...
38954. Вычисление сигнала на выходе линейного элемента ОЭП с использованием процедуры ДС. Методы: прямой свертки, быстрой свертки 432.5 KB
  Методы: прямой свертки быстрой свертки Определение Линейных элементов Линейность в широком смысле Параметрические системы у них импульсная характеристика изменяется но не в зависимости от входного сигнала Линейность в узком смысле Дюамель Если это выражение справедливо для линейного элемента то он линейный в узком смысле. ymотсчеты выходного сигнала При выполнении процедуры используется метод прямого перебора значений ht: известен вид ht но неизвестен а Дискретная свертка T1T2предварительные значения по методике дпф Нужно...
38955. Анализ сигналов с помощью процедуры дискретного преобразование Фурье (ДПФ). Вид выражения ДПФ, его связь с аналоговым преобразованием Фурье 42 KB
  Вид выражения ДПФ его связь с аналоговым преобразованием Фурье Для гармонического анализа периодического сигнала с периодомиспользуется разложение в ряд Фурье на некотором интервале Т: где Sn комплексный коэффициент определяющий амплитуду и фазу гармонической составляющей с номером n и частотой fn n T0 исследуемого сигнала. В случае апериодического сигнала g{t используется преобразование Фурье: где Sf комплексная непрерывная функция спектральная плотность сигнала определяющая текущую амплитуду и фазу сигнала в бесконечно...
38956. Общая методика выполнения процедуры ДС. 167.5 KB
  с известным приближением определяется интегральной сверткой: 1 где момент времени в который определяется величина выходного сигнала; сигналы на входе и выходе соответственно; импульсная характеристика линейного элемента. При проектировании известными являются входной сигнал а также...
38957. Общая методика анализа спектра типовых входных сигналов с использованием процедуры ДПФ. Зеркальная особенность (mirror). Эффект появления ложных спектральных компонент (aliasing) 1.76 MB
  Эффект появления ложных спектральных компонент lising. Выбирается интервал Т ограничения сигнала в соответствии с выражениями: для бесконечного апериодического сигнал: где интервал по шкале частот между отсчетами спектра определяющей требуемое по условию задачи разрешение по частоте; для сигнала в виде одиночного импульса или группы импульсов: при отсутствии разрыва хотя бы в одной краевой точке т. Вследствие нарушения условия Котельникова происходит наложение отсчетов спектра соответствующих соседним периодам сто приводит к...
38958. Принципы построения обучаемых АТСН 43.5 KB
  Назначение обучаемых ТВК может быть различным всевозможные измерительные приборы системы технического зрения астронавигационные системы тепловизионные обзорнопоисковые системы и т. Однако режиму автономного функционирования должен предшествовать период обучения системы при временном участии оператора. Изображение эталона посредством оптической системы ОС и телевизионного датчика ТВД преобразуется сначала в аналоговый видеосигнал а затем с помощью формирователя бинарного сигнала ФБС в эталонный бинарный сигнал фиксируемый в...
38959. Функции узла предварительной обработки видеосигнала в структуре ТВК. Состав и назначение его основных компонентов 235.5 KB
  Состав и назначение его основных компонентов Основная функция устройства предварительной обработки УПО – преобразование видеосигнала представляющего собой последовательность видеоимпульсов соответствующих освещенностям в анализируемых точках изображения в адекватные значения кодов двоичных чисел. Кроме АЦП в составе УПО должны быть дополнительные аппаратные средства обеспечивающие условия оптимального согласования параметров видеосигнала с параметрами АЦП независимо от содержания кадра рис. Функциональная схема устройства...