24425

Основные компоненты современных систем баз данных. Классификация и модели данных, реализуемых в СУБД

Контрольная

Информатика, кибернетика и программирование

Классификация и модели данных реализуемых в СУБД. База данных – это данные организованные в виде набора записей определенной структуры и хранящиеся в файлах где помимо самих данных содержится описание их структуры. Метаданные Данные о структуре базы данных.

Русский

2013-08-09

318 KB

6 чел.

  1.  Основные компоненты современных систем баз данных. Классификация  и модели данных, реализуемых в СУБД.

База данных – это данные, организованные в виде набора записей определенной структуры и хранящиеся в файлах, где помимо самих данных, содержится описание их структуры.

СУБД – это программно–технологический комплекс, интегрирующий аппаратные средства, БД на технических носителях, программное обеспечение управления БД в самом широком смысле этого термина (операции выборки, линейных преобразований БД и других), а также программируемую логику и набор процедур.

1. Основные компоненты:

  1.  Данные пользователя.
  2.  Метаданные - Данные о структуре базы данных.
  3.  Индекс – объект, создаваемый с целью повышения производительности выполнения запросов. Индекс формируется из значений одного или нескольких столбцов таблицы и указателей на соответствующие строки таблицы и, таким образом, позволяет находить нужную строку по заданному значению.
  4.  Хранимые процедуры - это программа, которая хранится в базе данных. Некоторые хранимые процедуры являются утилитами для базы данных. .
  5.  Триггеры — это процедура, которая выполняется при воникновении определенных ситуаций в данных.

2. Классификация данных.

Данные в зависимости от их способа представления в ЭВМ разделяются на пространственные, фактографические, графические и звуковые.

Пространственные данные представляются на карте в виде значений атрибутов, отнесенных к определенным координатам или изолиниям значений атрибутов. Пространственные данные всегда имеют географические координаты (географическая привязка).

Фактографические данные определяются местом и временем, отражают факты различных ситуаций для одной или нескольких точек, в исходном или агрегированном . 

Текстовые данные – это документы, характеризующиеся библиографической информацией, представляются в текстовых редакторах.

Графические данные – это пространственная или фактографическая  информация, представленная с помощью графических средств на экране (карты, графики, диаграммы, изображения).

Звуковые данные – это звук, записанный в цифровом виде, например, записи песен или данных, введенных в ЭВМ с голоса.

Мультимедийные данные – содержат несколько типов данных. типичным примером таких данных являются html – страницы.

Основания классфикации данных:

Основание

Объекты

Степень подготовленности к обработке

Данные на бумажных носителях (книги, бюллетени, ежемесячники, и т.п.); магнитных лентах, дискетах и др.; в массивах данных; БД

Способ и сроки передачи

Категория  А. Оперативные данные, собранные через глобальную сеть телесвязи в пределах времени отсечения (1-24 ч)

Категория В. Данные, отличающиеся от категории А более продолжительным временем отсечения (от нескольких суток до двух месяцев)

Категория С. Исторические данные, собираемые с большими задержками во времени.

Способ измерения

Дистанционный, автоматический, визуальный, ручной

Регулярность наблюдений

Регулярные, регулярные синхронные, асинхронные, нерегулярные, эпизодические

Шкала измерений

Порядковая, количественная,  номинальная, балльная

Инвертирование

Полностью инвертированные; выборочно – инвертированные (временные ряды); объединенно инвертированные

Агрегированные (расчетные)

Вычисленные характеристики первого рода –интерполированные, второго – вычисленные и интерполированные значения и третьего – фоновые характеристики района

Прогнозные

Краткосрочные, долгосрочные, сверхдолгосрочные

Статичность

Изменяющиеся, статические, условно–постоянные

Периодичность обработки

Регламентированные (ежедневные, ежедекадные, ежемесячные и др.), нерегламентированные

Регламент доведения до пользователя

Экстренные (сразу после обнаружения); периодические (ежечасно, ежесуточно, ежедекадно, ежемесячно); в установленные сроки

Распространение

По запросу, рассылка по списку, обмен

Использование

Информационные, справочные, информационно– справочные, рекомендации

3. МОДЕЛЬ ДАННЫХ -  Совокупность принципов организации базы данных. Самыми популярными являются иерархическая, сетевая и реляционная. Каждая М д. предусматривает различные принципы определения, манипулирования и хранения данных в базе данных, но наиболее важным является принцип организации связей между данными а базе данных.

Реляционная модель данных состоит из таблиц, каждая из которых представляет собой множество кортежей одинаковой структуры. Связи между кортежами различных таблиц в Р. м. д. устанавливаются неявно, по совпадению значений атрибутов в разных таблицах.

Иерархическая модель данных строится по принципу иерархии типов объектов, т. е. один тип объекта является главным, а остальные, находящиеся на низших уровнях иерархии,— подчиненными. Эта структура строится из узлов и ветвей. Узел представляет собой совокупность атрибутов данных, описывающих некоторый объект.

В сетевой модели данных понятия главного и подчиненных объектов несколько расширены. Любой объект может быть и главным, и подчиненным (в сетевой модели главный объект обозначается термином «владелец набора», а подчиненный — термином «член набора»). Один и тот же объект может одновременно выступать и в роли владельца, и в роли члена набора.

Объектно – реляционные БД. Реляционные модели данных и созданные на их основе реляционные СУБД имеют ограниченный набор типов данных и хранят информацию в двумерных таблицах. Сложные структуры данных должны быть разбиты и распределены между этими таблицами. При этом логические связи между таблицами не хранятся.

Постреляционная модель – это качественное и количественное расширение реляционной модели. Если в реляционных моделях используется первая нормальная форма, то в постреляционных моделях данные описываются не первой нормальной формой, не требуется определять для поля специфический тип и длину. Благодаря этому, можно задать таблицу, в которую вложены другие таблицы.

Моделью многомерной БД является многомерный куб, где на измерениях определены некоторые иерархии, а в клетках этого куба находятся числовые значения. Операции извлечения данных из такого куба описываются в терминах поворотов, срезов, и иерархического "схлопывания" измерений с агрегированием значений (суммирование, взятие среднего и др.).


2.
Коллизии и их разрешение. Форматы кадров Ethernet. Спецификации физического уровня: 10Base-2, 10-Base-T, 100Base-TX.

Возникновение коллизии: Механизм прослушивания среды и пауза между кадрами не гарантируют исключения такой ситуации, когда две или более станции одновременно решают, что среда свободна, и начинают передавать свои кадры. Говорят, что при этом происходит коллизия, так как содержимое обоих кадров сталкивается на общем кабеле и происходит искажение информации.

Коллизия — это нормальная ситуация в работе сетей Ethernet. В примере на рис. 12.8 коллизию породила одновременная передача данных узлами 3 и 1. Для возникновения коллизии не обязательно, чтобы несколько станций начали передачу абсолютно одновременно, такая ситуация маловероятна. Более вероятна ситуация, когда один узел начинает передачу, а через некоторое (короткое) время другой узел, проверив среду и не обнаружив несущую (сигналы первого узла еще не успели до него дойти), начинает передачу своего кадра. Таким образом, возникновение коллизии является следствием распределения узлов сети в пространстве.

Чтобы корректно обработать коллизию, все станции одновременно наблюдают за возникающими на кабеле сигналами. Если передаваемые и наблюдаемые сигналы отличаются, то фиксируется факт обнаружения коллизии (Collision Detection, CD). Для увеличения вероятности скорейшего обнаружения коллизии всеми станциями сети станция, которая обнаружила коллизию, прерывает передачу своего кадра (в произвольном месте, возможно, и не на границе байта) и усиливает ситуацию коллизии посылкой в сеть специальной последовательности из 32 бит, называемой jam-последовательностью.

После этого обнаружившая коллизию передающая станция обязана прекратить передачу и сделать паузу в течение короткого случайного интервала времени. Затем она может снова предпринять попытку захвата среды и передачи кадра. Случайная пауза выбирается по следующему алгоритму:

Пауза = L * (интервал отсрочки).

В технологии Ethernet интервал отсрочки выбран равным значению 512  битовых интервалов. Битовый интервал соответствует времени между появлением двух последовательных битов данных на кабеле; для скорости 10 Мбит/с величина битового интервала равна 0,1 мкс, или 100 нc.

L представляет собой целое число, выбранное с равной вероятностью из диапазона [О, 2N], где N — номер повторной попытки передачи данного кадра: 1, 2,..., 10. После 10-й попытки интервал, из которого выбирается пауза, не увеличивается.

Таким образом, случайная пауза в технологии Ethernet может принимать значения от 0 до 52,4 мс.

Если 16 последовательных попыток передачи кадра вызывают коллизию, то передатчик должен прекратить попытки и отбросить этот кадр. Описанный алгоритм носит название усеченного экспоненциального двоичного алгоритма отсрочки.

Время оборота и распознавание коллизий.

Надежное распознавание коллизий всеми станциями сети является необходимым условием корректной работы сети Ethernet. Если какая-либо передающая станция не распознает коллизию и решит, что кадр данных передан ею верно, этот кадр будет утерян. Из-за наложения сигналов при коллизии информация кадра исказится, и он будет отбракован принимающей станцией из-за несовпадения контрольной суммы. Скорее всего, недошедшие до получателя данные будут повторно переданы каким-либо протоколом верхнего уровня, например транспортным или прикладным, работающим с установлением соединения, или протоколом LLC, если он работает в режиме LLC2. Но повторная передача сообщения протоколами верхних уровней произойдет гораздо позже (иногда по прошествии нескольких секунд), чем повторная передача средствами сети Ethernet, работающей с микросекундными интервалами. Поэтому если коллизии не будут надежно распознаваться узлами сети Ethernet, то это приведет к заметному снижению полезной пропускной способности сети.

Для надежного распознавания коллизий должно выполняться следующее соотношение:

Здесь Tmin — время передачи кадра минимальной длины, a PDV (Path Delay Value) — время оборота, то есть время, за которое сигнал коллизии успевает распространиться до самого дальнего узла сети. В худшем случае сигнал должен пройти дважды между наиболее удаленными друг от друга станциями сети (в одну сторону проходит неискаженный сигнал, а в обратном направлении распространяется уже искаженный коллизией сигнал).

При выполнении этого условия передающая станция должна успеть обнаружить коллизию, которую вызвал переданный ее кадр, еще до того, как она закончит передачу этого кадра.

Очевидно, что выполнение этого условия зависит, с одной стороны, от длины минимального кадра и скорости передачи данных протокола, а с другой стороны, от длины кабельной системы сети и скорости распространения сигнала в кабеле (для разных типов кабеля эта скорость несколько отличается).

Все параметры протокола Ethernet подобраны таким образом, чтобы при нормальной сети коллизии четко распознавались.

Форматы кадров технологии Ethernet

Стандарт технологии Ethernet, определенный в документе IEEE 802.3, дает описание единственного формата кадра уровня MAC. Тем не менее на практике в сетях Ethernet на канальном уровне используются кадры 4-х различных форматов (типов). Форматы всех этих четырех типов кадров Ethernet приведены на рис. 12.9.

Кадр 802.3/LLC

  •  Поле преамбулы состоит из семи синхронизирующих байтов — 10101010.
  •  Начальный ограничитель кадра (Start-of-Frame-Delimiter, SFD) состоит из одного байта 10101011. Появление этой комбинации битов является указанием на то, что следующий байт — это первый байт заголовка кадра.
  •  Адрес назначения (Destination Address, DA) может быть длиной 2 или 6 байт. На практике всегда используются МАС-адреса из 6 байт.
  •  Адрес источника (Source Address, SA) — это 2- или 6-байтовое поле, содержащее МАС-адрес узла — отправителя кадра. Первый бит адреса всегда имеет значение 0.
  •  Длина (Length, L) — 2-байтовое поле, которое определяет длину поля данных в кадре.
  •  Поле данных может содержать от 0 до 1500 байт. Но если длина поля меньше 46 байт, то используется следующее поле — поле заполнителя, дополняющее кадр до минимально допустимого значения в 46 байт.
  •  Поле заполнителя состоит из такого количества байтов заполнителя, которое обеспечивает минимальную длину поля данных в 46 байт. Это позволяет корректно работать механизму обнаружения коллизий. Если длина поля данных больше или равна минимальной, то поле заполнителя в кадре не появляется.
  •  Поле контрольной последовательности кадра (Frame Check Sequence, FCS) состоит из 4 байт контрольной суммы. Это значение вычисляется по алгоритму CRC-32.

Кадр Raw 802.3/Novell 802.3

Кадр Raw 8023, называемый еще кадром Novell 8023, также представлен на рис. 12.9. Из рисунка видно, что он представляет собой кадр подуровня MAC стандарта 802.3, но без вложенного кадра подуровня LLC.

Кадр Ethernet DIX/ Ethernet II

Кадр Ethernet DIX, называемый также кадром Ethernet II, имеет структуру, совпадающую со структурой кадра Raw 802.3 (см. рис. 12.9). Однако 2-байтовое поле длины (L) кадра Raw 802.3 в кадре Ethernet DIX используется в качестве поля типа (Туре, Т) протокола. Это поле предназначено для тех же целей, что и поля DSAP и SSAP кадра LLC — для указания типа протокола верхнего уровня, вложившего свой пакет в поле данных этого кадра.

Кадр Ethernet SNAP

Кадр Ethernet SNAP (см. рис. 12.9) представляет собой расширение кадра 802.3/ LLC за счет введения дополнительного заголовка протокола SNAP, состоящего из двух полей: OUI и типа.

Поле типа состоит из 2 байт и повторяет по формату и назначению поле типа кадра Ethernet II.

Поле OUI определяет  уникальный идентификатор — то есть идентификатор организации, которая контролирует коды протоколов в поле типа.

Спецификации физической среды Ethernet

Стандарт 10Base-2

В стандарте 10Base-2 в качестве передающей среды используется «тонкий» коаксиал Ethernet. Максимальная длина сегмента без повторителей составляет 185 м, сегмент должен иметь на концах согласующие терминаторы 50 Ом.

Максимальное количество станций, подключаемых к одному сегменту, — 30. Минимальное расстояние между станциями — 1м. Кабель «тонкого» коаксиала имеет разметку для подключения узлов с шагом в 1 м.

Стандарт 1OBase-2 также предусматривает использование повторителей по правилу 5-4-3.

В этом случае сеть будет иметь максимальную длину в 5*185 = 925 м. Очевидно, что это ограничение является более сильным, чем общее ограничение стандарта Ethernet в 2500 м.

Типичный состав сети стандарта 10Base-2, состоящей из одного сегмента кабеля, показан на рис. 12.13.

Общим недостатком стандартов 10Base-5 и 10Base-2 является отсутствие оперативной информации о состоянии моноканала. Повреждение кабеля обнаруживается сразу же (сеть перестает работать), но для поиска отказавшего отрезка кабеля необходим специальный прибор — кабельный тестер.

10-Base-T

В сетях 10Base-T в качестве среды используются две неэкранированные витые пары. Многопарный кабель на основе неэкранированной витой пары категории 3 телефонные компании уже достаточно давно применяли для подключения телефонных аппаратов внутри зданий. Этот кабель носит также название Voice Grade, говорящее о том, что он предназначен для передачи голоса.

Конечные узлы соединяются с помощью двух витых пар по двухточечной топологии со специальным устройством — многопортовым повторителем. Одна витая пара требуется для передачи данных от станции к повторителю (выход Тх сетевого адаптера), а другая — для передачи данных от повторителя к станции (вход Rx сетевого адаптера). На рис. 12.14 показан пример трехпортового  повторителя.

Многопортовые повторители в данном случае обычно называются концентраторами, или хабами. Концентратор осуществляет функции повторителя сигналов на всех отрезках витых пар, подключенных к его портам, так что образуется единая среда передачи данных — логический моноканал (логическая общая шина). Концентратор обнаруживает коллизию в сегменте в случае одновременной передачи сигналов по нескольким своим Rх-входам и посылает jam-последовательность на все свои Тх-выходы. Стандарт определяет битовую скорость передачи данных 10 Мбит/с и максимальное расстояние отрезка витой пары между двумя непосредственно связанными узлами (станциями и концентраторами) не более 100 м при наличии витой пары качества не ниже категории 3. Это расстояние определяется полосой пропускания витой пары — на длине 100 м она позволяет передавать данные со скоростью 10 Мбит/с при использовании манчестерского кода.

Концентраторы 10Base-T можно соединять друг с другом с помощью тех же портов, которые предназначены для подключения конечных узлов. При этом нужно позаботиться о том, чтобы передатчик и приемник одного порта были соединены соответственно с приемником и передатчиком другого порта.

В стандарте 10Base-T определено максимальное число концентраторов между любыми двумя станциями сети, а именно 4. Это правило носит название правила 4-х хабов.

Правило 4-х хабов подобно служит для гарантированной синхронизации станций при реализации процедур доступа CSMA/CD и надежного распознавания станциями коллизий. При создании сети 10Base-T с большим числом станций концентраторы можно соединять друг с другом иерархическим способом, образуя древовидную структуру.

Общее количество станций в сети 10Base-T не должно превышать общего предела в 1024.

Очевидно, что если между любыми двумя узлами сети не должно быть больше 4-х повторителей, то, учитывая, что максимальная длина кабеля между повторителями равна 100 м, получаем, что максимальный диаметр сети 10Base-T составляет 5 х 100 = 500 м.

Технология Fast Ethernet

Физический уровень технологии Fast Ethernet

Все отличия технологий Fast Ethernet и Ethernet сосредоточены на физическом уровне (рис. 13.1).

Организация физического уровня технологии Fast Ethernet является более сложной, поскольку в ней используются три варианта кабельных систем:

  •  волоконно-оптический многомодовый кабель (два волокна);
  •  витая пара категории 5 (две пары);
  •  витая пара категории 3 (четыре пары).

Сети Fast Ethernet на разделяемой среде подобно сетям 10Base-T/10Base-F имеют иерархическую древовидную структуру, построенную на концентраторах. Основным отличием конфигураций сетей Fast Ethernet является сокращение диаметра сети примерно до 200 м, что объясняется сокращением времени передачи кадра минимальной длины в 10 раз за счет увеличения скорости передачи в 10 раз по сравнению с 10-мегабитной сетью Ethernet.

Тем не менее это обстоятельство не очень препятствует построению крупных сетей на технологии Fast Ethernet. При использовании коммутаторов протокол Fast Ethernet может работать в дуплексном режиме, в котором нет ограничений на общую длину сети, а остаются только ограничения на длину физических сегментов, соединяющих соседние устройства (адаптер-коммутатор и коммутатор-коммутатор).

Официальный стандарт 802.3 установил три различных спецификации для физического уровня Fast Ethernet и дал им следующие названия (рис. 13.2);

  •  100Base-TX для двухпарного кабеля на неэкранированной витой паре UTP категории 5 или экранированной витой паре STP типа 1;
  •  100Base-T4 для четырехпарного кабеля на неэкранированной витой паре UTP категории 3, 4 или 5;
  •  100Base-FX для многомодового оптоволоконного кабеля с двумя волокнами.

Для всех трех стандартов справедливы перечисленные ниже утверждения и характеристики.

Форматы кадров технологии Fast Ethernet не отличаются от форматов кадров технологий 10-мегабитной сети Ethernet

Межкадровый интервал равен 0,96 мкс, а битовый интервал — 10 нс. Все временные параметры алгоритма доступа (интервал отсрочки, время передачи кадра минимальной длины и т.п.), измеренные  в битовых интервалах остались прежними.

Признаком свободного состояния среды является передача по ней символа простоя источника — соответствующего избыточного кода (а не отсутствие сигналов, как в стандартах Ethernet 10 Мбит/с).

100Base-TX 

Спецификация 100Base-FX определяет работу протокола Fast Ethernet по  модовому оптоволокну в полудуплексном и дуплексном режимах. D стандарте Fast Ethernet определен метод кодирования — 4В/5В.

Существование запрещенных комбинаций символов позволяет отбраковывать ошибочные символы, что повышает устойчивость работы сетей с 100Base-FX/TX. Так, в Fast Ethernet признаком того, что среда свободна, стала повторяющаяся передача одного из запрещенных для кодирования пользовательских данных символа, а именно символа простоя источника Idle (11111). Такой способ позволяет приемнику всегда находиться в синхронизме с передатчиком.

После преобразования 4-битовых порций кодов MAC в 5-битовые порции физического уровня их необходимо представить в виде оптических или электрических сигналов в кабеле, соединяющем узлы сети. В спецификациях 100Base-FX и 100Base-TX для этого используются различные методы физического кодирования — NRZI и MLT-3 соответственно.

В спецификации 100Base-TX в качестве среды передачи данных используется витая пара UTP категории 5 или STP типа 1. Основным отличием от спецификации 100Base-FX — наряду с использованием метода кодирования MLT-3 — является наличие функции автопереговоров для выбора режима работы порта.

Всего в настоящее время определено 5 различных режимов работы, которые могут поддерживать устройства 100Base-TX/T4 на витых парах:

  •  10Base-T;
  •  дуплексный режим 10Base-T;
  •  100Base-TX;
  •  100Base-T4;
  •  дуплексный режим 100Base-TX.


 

А также другие работы, которые могут Вас заинтересовать

62197. Сложение векторов. Разложение вектора по двум неколлинеарным векторам. Скалярное произведение двух векторов 76.56 KB
  Сложение векторов. Тип урока: Закрепления знаний. Ход урока: Организационный момент; Актуализация знаний; Решение задач; д з. Этапы урока Деятельность учителя Психологический анализ Организационный момент Все ли получилось в домашней работе.
62199. Психологічний аналіз уроку 18.77 KB
  Вчителька розповідає учням новий матеріал показує практичне значення матеріалу. Вчителька пояснює суть нового матеріалу. На певних етапах увага учнів розсіювалася і вчителька старалась привернути їх увагу використовуючи різні таблиці. Вчителька вміло переключала учнів з одної уваги на іншу.
62200. Психологічний аналіз уроку. Практичне заняття 18.63 KB
  Мета: ознайомити з гігієнічними вимогами до проведення уроку опрацювати схему психологічного аналізу уроку. План Гігієнічні вимогами до проведення уроку. Схема психологічного аналізу уроку.