7596
Моделі даних. Загальні поняття
Лекция
Информатика, кибернетика и программирование
Моделі даних Загальні поняття. Термін база данихговорить про те, що йдеться про дані, тобто про інформацію, яка характеризує певний об’єкт, та, що ці дані є базовими, основними. З погляду користувача, який екс...
Украинкский
2013-01-26
105.5 KB
7 чел.
PAGE 7
Моделі даних
Загальні поняття. Термін “база даних” говорить про те, що йдеться про дані, тобто про інформацію, яка характеризує певний обєкт, та, що ці дані є базовими, основними. З погляду користувача, який експлуатує базу даних (БД), вона є моделлю предметної області (ПО), обєкта, наприклад, підприємства або його частини, підрозділу. Найважливішою вимогою, яка ставиться до моделі, є її адекватність, тобто вірне відображення звязків і відношень між елементами того обєкта, який вона описує. Як правило, кожний обєкт з плином часу розвивається, змінюється. Тому БД, як модель обєкта, являє собою живий організм, який перебуває в постійному русі, вона теж змінюється в часі.
В сучасних БД практично не існує обмежень на вигляд даних. Це можуть бути числа (облік кількості товарів, працівників, коштів), літерні або символьні дані (назва та опис властивостей товару, прізвище працівника), календарна дата протікання події, текст великого розміру (текст книги), малюнок, кіно та відеофільм, адреса мережі Internet, математичний або логічний вираз і т. д. Тобто даними є будь-яка інформація, яка відображає стан обєкта протягом заданого проміжка часу і яку можна зберігати в памяті компютера.
З погляду програміста, який будує нову або веде (забезпечує супровід у ході експлуатації) готову БД, і в межах цього посібника ми будемо її розглядати саме з цього погляду, БД являє собою сукупність даних та програм, призначених для їх обробки.
Обробка даних передбачає виконання таких робіт:
Моделі даних. Велика кількість даних затрудняє роботу з ними, тому з метою її спрощення дані слід якимось чином упорядкувати, як на логічному, смисловому рівні, так на рівні розташування їх у памяті обчислювальної машини. Зрозуміло, що спосіб цього впорядкування безпосередньо впливає на сам характер обробки даних. Розглянемо моделі даних, які в ході історичного розвитку БД застосовувалися для логічного впорядкування даних.
Ієрархічна модель найбільш придатна для впорядкування даних про предметну область (ПО), які мають ієрархічну структуру звязків між собою за своєю природою. Прикладом таких даних може бути схема підпорядкування один одному підрозділів підприємства, зміна в часі властивості обєкта, територіально-адміністративний устрій держави, будова машини, яка складається з вузлів, підвузлів та деталей і т.д.
Одиничним, елементарним значенням ієрархічної структури є поіменоване поле. Сукупність полів утворює сегмент, який є одиницею доступу до даних. На найвищому рівні ієрархічної схеми розташування даних знаходиться єдиний сегмент, який називається кореневим або батьківським. Він може бути звязаний з одним або декількома сегментами нижчого рівня, які називають дочірніми. Декілька дочірніх сегментів, які мають одного батька називаються близнюками. Сегменти, які не мають дочірніх, називаються листками.
Ця модель передбачає наявність лише строго вертикальних звязків між даними типу один до одного або один до багатьох (зверху вниз) та багато до одного (знизу вверх). Допускаються горизонтальні звязки типу один до одного лише між сегментами одного рівня підпорядкування, що дозволяє виконувати пошукові операції на цьому рівні без повернення до батьківського сегмента.
Однією із систем, що базувалася на ієрархічній моделі даних, була система IMS, яка використовувала мову DL/1.
До головних переваг ієрархічної моделі можна віднести такі:
Найбільш суттєвими недоліками цієї моделі є такі:
Мережна модель даних має практично ті ж переваги та недоліки, що й ієрархічна, проте дозволяє простіше відображати складніші звзки між даними, зокрема типу багато до багатьох, описувати цикли та петлі. Одиницею доступу до даних мережної структури є запис, який теж складається з полів. Запис є аналогом сегмента ієрархічної структури даних. Прикладом звязку типу багато до багатьох може бути мережа багатьох газопроводів, кожний з яких експлуатує декілька підприємств, причому кожне підприємство експлуатує декілька газопроводів. Циклом називається форма звязку, де предок одночасно є нащадком. Прикладом циклу може бути підприємство, яке одночасно є власником газопроводу, який експлуатує інше підприємство. У петлі підприємство є власником газопроводу, який же й експлуатує.
Ієрархічна і мережна моделі даних застосовувалися переважно в ранніх СУБД. Загальним їхнім недоліком є те, що вони залежать від фізичної організації БД і вимагають від програміста, який складає прикладні програми для її обслуговування, знань про цю організацію. Тому логіка маніпулювання даними стає, як правило, перевантаженою деталями про реалізацію способу доступу до даних.
Реляційну модель даних запропонував американський математик Едгар Кодд на початку 70-тих років ХХ століття. (У 1981 році Е. Ф. Кодд одержав за створення реляційної моделі і реляційної алгебри престижну премію Тюринга Американської асоціації з обчислювальної техніки). З часом ця модель набувала все більшої популярності й сьогодні стала найбільш поширеною. Вона має ряд переваг, з яких відзначимо такі:
Відповідно до понять реляційної моделі вся інформація про ПО зберігається у вигляді таблиць, які можна звязувати між собою за допомогою кодових (ключових) полів. Звідси й походить її назва: слово relation означає звязок.
Реляційна модель даних застосовується не тільки для обробки власне даних, але й знань, якими оперують системи штучного інтелекту, інформаційно-пошукові, експертні та інші системи. Але можливості її використання в цих системах обмежені, тому подальший розвиток моделювання даних відбувається саме в цьому напрямку. Найбільш поширеними моделями знань можна вважати такі, як формально-логічна, продукційна, фреймова та ін.
Кожна модель даних передбачає застосування певного математичного апарату та набору операцій над даними. Вони будуть показані нижче в прикладах робіт з обєктами БД реляційного типу.
Системи управління базами даних. Перші БД беруть свій початок з 50-х років ХХ століття. Це були файлові системи, в яких застосовувалися універсальні програмні засоби, такі як Фортран, Алгол, Кобол та ін. У 60-х роках появилися перші системи управління базами даних (СУБД) це сукупність спеціальних програм, призначених для побудови та обслуговування БД. Для прикладу можна назвати такі СУБД, як спочатку IMS, яка підтримувала ієрархічну модель даних, а пізніше dBASE, FoxPro, Delphi, Informix, Oracle, PostgreSQL, MS Access, MySQL, SyBase та ін. реляційного типу. СУБД розвиваються в напрямку взяття на себе все більшої кількості фукцій, але лише загальних, які стосуються всіх або більшості робіт. Вони не можуть враховувати специфіку конкретних потреб, тому виглядають стандартними. Таким чином, програмне забезпечення БД можна умовно поділити на стандартне, яке постачається разом із СУБД, та прикладне, виготовлене програмістами під час побудови та ведення БД за допомогою спеціальних програмних засобів, які має СУБД.
Таблиця 1 Порівняльна характеристика найбільш поширених СУБД
Сервер |
Переваги |
Недоліки |
|
IBM DB2 Universal Database |
Найбагатша мова запитів, добрий оптимізатор, можливість писати функції на різих мовах. |
Висока ціна. |
|
Oracle Database |
Дуже багато додаткових можливостей. Версійний сервер. |
Дуже висока вартість сервера і підтримки. |
|
Microsoft SQL Server |
Швидко розвивається, вже впритул наближається до своїх більш розвинених конкурентів. Середня вартість. |
Існує лише для однієї платформи (Win32). |
|
IBM Informix Dynamic Server |
Досить розвинений швидкий сервер. |
|
|
Sybase Adaptive Server Enterprise |
Досить розвинений сервер. Середня вартість. |
|
|
Sybase Adaptive Server Anywhere |
Використовується під багато платформ, включаючи экзотичні. Низька вартість. |
|
|
Borland InterBase |
Досить багатий набір можливостей. Версійний сервер. Безплатний. |
Відносно повільно працює. |
|
PostgreSQL |
Підтримує історичну модель. Можливість створювати власні типи даних. Безплатний. |
|
|
MySQL |
Швидко працює на простих запитах. Безплатний. |
Дуже бідна мова запитів. Ма-ло додаткових можливостей. |
Всі СУБД, як правило, мають власні програмні засоби для побудови та ведення БД. Універсальною і найбільш поширеною мовою, яка застосовується практично ними всіма, є SQL (Structured Query Lanquage структурна мова запитів), розроблена (започаткована) Е. Коддом, засновником реляційних БД. В таблиці 1 приведена характеристика найбільш поширених SQL-серверів.
Етапи розвитку СУБД. Історія розвитку СУБД налічує більше половини століття. У 1968 році була введена в експлуатацію перша промислова СУБД система IMS фірми IBM. У 1975 році зявився перший стандарт асоціації з мов систем обробки даних Conference of Data System Languages (CODASYL), який визначив ряд фундаментальних понять в теорії баз даних.
У подальший розвиток теорії баз даних великий внесок був зроблений американським математиком Едгаром Франком Коддом, який є творцем реляційної моделі даних. Прийнято вважати, що реляційний підхід до організації баз даних був закладений наприкінці 1960-х рр. Едгаром Коддом. В останні десятиліття цей підхід є найбільш поширеним.
Переваги реляційного підходу та розвиток методів і алгоритмів організації та управління реляційними базами даних спричинили те, що до кінця 80-х років реляційні системи на світовому ринку СУБД стали домінуючими. Виділяють такі етапи розвитку систем управління базами даних:
Коротка характеристика PostgreSQL. В межах цього конспекта лекцій ознайомимося з СУБД PostgreSQL. Вона порівняно проста в користуванні, тому вигідна на перших етапах вивчення організації БД, і належить до найбільш потужних сучасних СУБД, що забезпечує знакомство з практично всіма тонкощами, що стосуються побудови та адміністрування БД.
PostgreSQL обєктно-реляційна система управління базами даних (ОРСУБД), розробка якої у різних формах ведеться з 1977 року. Робота почалася з проекту Ingres в Каліфорнійському університеті (Берклі). Пізніше проект Ingres був переведений на комерційну розробку в корпорації Relational Technologies/Ingres.
У 1986 році інша група, яку очолював Майкл Стоунбрейкера (Michael Stonebraker) з Берклі, продовжила роботу над Ingres і створила обєктно-реляційну СУБД Postgres. У 1996 році через удосконалення пакета і переходу на поширення з відкритими вихідними текстами було прийнято нову назву PostgreSQL (протягом нетривалого часу використовувалася назва Postgres95). В даний час над проектом PostgreSQL активно працює група розробників зі всього світу.
PostgreSQL вважається найдосконалішою СУБД, в якій реалізовано багато можливостей, які традиційно зустрічалися тільки у потужних комерційних продуктах, таких, наприклад, як DВ2 та Oracle. Вона розповсюджується на умовах відкритих вихідних текстів, тобто користувач може взяти вихідний текст програми, використовувати його і вільно модифікувати без обмежень, які встановлюються для закритих програмних продуктів.
Спільнота PostgreSQL забезпечує активну підтримку продукта через списки розсилки. Існує декілька списків розсилки, на які можна підписатися, вони містять досить детальну інформацію від загальних питань до розробки програмних інтерфейсів PostgreSQL. Повний перелік списків розсилки з докладними описами наведено на сайті http://www.postgresql.org.
Проте доводиться враховувати час і зусилля, витрачені на вивчення пакета і подальший супровід БД, тому можна скористатися й послугами відповідних комерційних організацій.
Нижче перераховані основні можливості PostgreSQL:
PostgreSQL може одночасно надавати доступ до декількох баз даних, у кожної з яких є свій власник, свої таблиці, подання, індекси та функції.
Для створення таблиці, функції або іншого обєкта бази даних, слід підключитися до конкретної бази даних за допомогою клієнта PostgreSQL. Після підключення створюється обєкт, який належить цій базі даних і недоступний для всіх інших баз даних (хоча клієнт може одночасно відкрити кілька підключень до різних баз).
Жорстка ізоляція основних обєктів даних в різних базах даних знижує небезпеку виникнення конфліктів імен при виборі імені, раніше зарезервованого для іншої мети (наприклад, якщо два користувача захочуть створити таблицю з імям products для двох різних цілей). Це повязано з тим, що ні одна база даних не має інформації про компоненти інших баз і не намагається встановлювати з ними будь-які логічні звязки. Більш того, це правило поширюється й на обєкти даних обєктно-реляційних баз, тому створені користувачем функції та мовні визначення недоступні для інших користувачів, що підключаються до інших баз даних через PostgreSQL.
А также другие работы, которые могут Вас заинтересовать | |||
86013. | Организация системы бухгалтерского учета и пути ее совершенствования в страховых организациях (на примере ОАО «РОСГОССТРАХ») | 114.68 KB | |
В бухгалтерии страховой организации аккумулируется вся информация о фактах хозяйственной деятельности, происходит их документальное подтверждение и фиксирование, начиная с создания страховой услуги, привлечения в этих целях необходимых средств, калькулирования фактических издержек до формирования годовой бухгалтерской отчетности. | |||
86014. | Организация и технология документационного обеспечения управления | 43.35 KB | |
Перспективы развития правил оформления управленческих документов предложена дополнительная информация об основных положениях и составлении инструкции по делопроизводству и должностных инструкций сотрудников. Деятельность учреждения фиксируется в разных видах документов. Все эти виды составляют группу организационных документов. Инструкция по делопроизводству является нормативным документом регламентирующим организацию правила приемы и процессы создания документов порядок работы с ними осуществление контроля за их исполнением. | |||
86015. | Организация и управление связей с общественностью в клубной сфере | 683.5 KB | |
Особо следует отметить, что рынок развлечении до сих пор характеризуется устойчивой тенденцией к росту и является наиболее динамичным среди регионов Восточной Европы. «Сегодня в Москве работает около 450-500 заведений клубного сегмента, а объем столичного рынка ночных клубов растет... | |||
86016. | Бизнес-план фирмы ООО «Инфо-Нью(Info-New)» | 161.13 KB | |
Важнейшей задачей разработки бизнес-планов является проблема привлечения и обоснования инвестиций и кредитов в том числе зарубежных необходимых для осуществления проектов технического перевооружения и реконструкции предприятий. | |||
86017. | Определение сметной стоимости строительства | 90.72 KB | |
Сметная стоимость является основой для определения размера капитальных вложений финансирования строительства формирования договорных цен на строительную продукцию расчетов за выполненные подрядные строительно-монтажные ремонтно-строительные работы оплаты расходов по приобретению оборудования... | |||
86018. | Норма права и правоотношение | 316.21 KB | |
Актуальность проблемы анализа взаимосвязи правовой нормы и правоотношения как раз и связана с введением в юридическую практику общепризнанных оценок выступающих не только мерой но и ориентиром в общественном развитии с позиции эффективности правового регулирования общественных отношений... | |||
86020. | Эффективность производства и реализации производства льнопродукции | 686 KB | |
Теоритические основы эффективности производства и реализации льнопродукции Понятие сущность и показатели эффективности производства Основные показатели характеризующие эффективность производства льнопродукции Основные направления повышения производства и реализации льнопродукции... | |||
86021. | ОТБОР В ФУТБОЛЬНЫХ КЛУБАХ ПЕРВОЙ И ПРЕМЬЕР ЛИГИ | 878 KB | |
Проблема спортивного отбора является одной из основных проблем физической культуры и спорта. Развитие теории спортивного отбора влияет на уровень спортивных достижений и на развитие спортивной науки в целом. | |||