98858

Мова XML. Області використання XML. Недоліки та переваги

Реферат

Информатика, кибернетика и программирование

Я поетапно досліджувала структуру і коректність XML-документів а також присвятила частину роботи для вивчення обробки XML-документів окремо виділивши всі три стандартні технології та розглянувши новіші технології що почали здобувати поширення останнім часом а саме – активний аналіз і зв'язування даних.

Украинкский

2016-07-13

111.5 KB

0 чел.

Міністерство освіти і науки, молоді та спорту України

Київський національний торговельно-економічний університет

Факультет економіки, менеджменту і права

Реферат

на тему: "Мова XML. Області використання XML.

Недоліки та переваги."

Студентки 3 курсу

11-с групи

заочної форми навчання

спеціальності "Маркетинг"

Белєвої Ольги Степанівни

Робота виконана: 10.01.13 р.

2013

Анотація

гіперпосилання інформація документ

У даній роботі я розглянула розширювану мову розмітки тексту XML (eXtensible Markup Language). Вивчила і дослідила її історію створення, визначила основні поняття і функції цієї мови. Зясувала, що мова розмітки документів - це набір спеціальних інструкцій, називаних тегами, призначених для формування в документах якоїсь структури і визначення відношень між різноманітними елементами цієї структури.

Я поетапно досліджувала структуру і коректність XML-документів, а також присвятила частину роботи для вивчення обробки XML-документів, окремо виділивши всі три стандартні технології та розглянувши новіші технології, що почали здобувати поширення останнім часом, а саме – активний аналіз і зв'язування даних.

З`ясувала:

як звилася ця мова;

як вона розвивалася;

що вона представляє;

для чого вона призначена;

які вона має можливості;

виявила ії переваги та недоліки.

Вступ

Розширювана мова розмітки (англ. Extensible Markup Language, скорочено XML) — запропонований консорціумом World Wide Web (W3C) стандарт побудови мов розмітки ієрархічно структурованих даних для обміну між різними застосунками, зокрема, через Інтернет.[1] Є спрощеною підмножиною мови розмітки SGML. XML документ складається із текстових знаків, і придатний до читання людиною.

Стандарт XML (англ. Recommendation, перше видання від 10 лютого 1998, останнє, четверте видання 29 вересня 2006) визначає набір базових лексичних та синтаксичних правил для побудови мови описання інформації шляхом застосування простих тегів. Цей формат достатньо гнучкий для того, аби бути придатним для застосування в різних галузях. Іншими словами, запропонований стандарт визначає метамову, на основі якої, шляхом запровадження обмежень на структуру та зміст документів визначаються специфічні, предметно-орієнтовані мови розмітки даних. Ці обмеження описуються мовами схем (англ. Schema), таких як DTD, RELAX NG або XML Schema. Прикладами мов, основаних на XML є: RSS, MathML, GraphML, XHTML, Scalable Vector Graphics, і також XML Schema.

Мета роботи:

  •  Мова XML;
  •  Визначити області використання XML;
  •  Зробити висновок щодо переваг і недоліків XML.

Для досягнення поставленої мети, я звернулася до різноманітних джерел інформації, вивчила та проаналізувала дане питання і на основі цього зробила висновки.


Загальні відомості про мову
XML

XML (eXtensible Markup Language) - це розширювана мова розмітки тексту, запропонована W3C у 1996 році. Це мова, яка повною мірою визначає логічну структуру документа. Задача XML полягає в тому, щоб дані: тексти, зображення або інші частини Web-документа могли бути визначені і структуровані незалежно від платформи , що їх відтворює, постачальника і його програмного забезпечення, наприклад Web-браузерів.

Особливості XML - розширеної мови розмітки

  •  Гнучкість. XML дозволяє обробляти унікальні дані, і незалежно від їх характеру надає адекватні методи для їх зберігання і обробки.
  •  Можливість налаштування. Гнучкість XML безпосередньо пов'язана з можливістю визначати власні дескриптори, необхідність в яких виникає в процесі рішення задачі.
  •  Узгодженість. XML відрізняється синтаксичною цілісністю і строгою структурою.

При створенні документів із використанням XML, можна використовувати власні елементи і структури для розмітки вмісту ваших документів. Можливо визначити DTD (a Document Type Definition), тобто визначення типу документа. DTD визначає те, що можна назвати "граматикою" документа - це список різноманітних елементів і їхніх утворень для використання у визначених документах, у чомусь це нагадує використанняCSS, тобто ви можете зробити посилання на DTD, що знаходиться або в мережі або написати його безпосередньо у вашому документі.

Таким чином, вміст документа, його структура, типи використвуваних у ньому елементів і його видгляд визначаться окремо, тобто незалежно один від одного.

Потрібно сказати, що XML корисний для автоматизованих програмних засобів, що шукають у Web. Недосконалість HTML призвела до того, що мережа перетворилася в мішанину тексту, повну різноманітних елементів і тегів, часто використовуваних, що називається Pro Forma і нічого не значущих.

XML має величезний потенціал для удосконалення гіпертекста. Наприклад у HTML для створення зв'язку використовується елемент A, XML же дозволяє створити не просто посилання, а наприклад, двонаправлений зв'язок.

Перспектива XML полягає в тому, що він буде використовуватися для опису інших мов розмітки, наприклад, JavaScript, що використовується в HTML-документах.

XML розроблений для того, щоб спростити і полегшити використання SGML, при цьому зберігши його великі можливості по створенню, поширенню і публікації Web-документів мережі.

Незважаючи на те, що XML дуже молода (W3C затвердила специфікацію "Extensible Markup Language(XML) 1.0" на початку лютого 1998 г) і окремі компоненти цієї мови знаходяться ще в стадії доробки, уже сьогодні з'являються нові мови, створені на основі XML, виникають численні Web-сервери, що використовують цю технологію для організації інформації , що зберігається на них.

Історія виникнення мови XML

Основні причини створення XML:

  •  Спроба надати могутні засоби форматування і структуризації даних для широкого кола розробників.
  •  Необхідність в стабільній реалізації мови структуризації документів, де можна легко створювати допоміжні інструменти, що є доступними для звичайних користувачів.

Роком народження XML можна вважати 1996, в кінці якого з'явився чорновий варіант специфікації мови, або 1998, коли ця специфікація була затверджена. А почалося все з появи в 1986 мови SGML.

SGML ( англ. Standard Generalized Markup Language - Стандартний узагальнений мову розмітки) заявив про себе як гнучкий, комплексний і всеосяжний мета-мова для створення мов розмітки. Незважаючи на те, що поняття гіпертексту з'явилося в 1965, SGML не має гіпертекстової моделі. Створення SGML можна з упевненістю назвати спробою осягнути неосяжне, так як він об'єднує в собі такі можливості, які вкрай рідко використовуються всі разом. У цьому й полягає його головний недолік - складність і, як наслідок, дорожнеча цієї мови обмежує його використання тільки великими компаніями, які можуть дозволити собі купити відповідне програмне забезпечення і найняти високооплачуваних фахівців. Крім того, у невеликих компаній рідко виникають настільки складні завдання, щоб залучати до їх вирішення SGML.

Найбільш широко SGML застосовується для створення інших мов розмітки, саме з його допомогою була створена мова розмітки гіпертекстових документів - HTML, специфікація якого була затверджена в 1992. Його поява була пов'язана з необхідністю організації стрімко зростаючого масиву документів в мережі Інтернет. Бурхливе зростання кількості підключень до Інтернету і, відповідно, веб-серверів спричинив таку потребу в кодуванні

електронних документів, з якою не міг впоратися SGML внаслідок високої труднощі освоєння.

Поява HTML - дуже простої мови розмітки - швидко вирішило цю проблему: легкість у вивченні і багатство засобів оформлення документів зробили його найпопулярнішою мовою для користувачів Інтернет. Але, у міру зростання кількості та зміни якості документів в Мережі, росли і вимоги до них, і простота HTML перетворилася в його головний недолік. Обмеженість кількості тегів і повну байдужість до структури документа спонукали розробників в особі консорціуму W3C до створення такої мови розмітки, який був би не такий складний, як SGML, і не настільки примітивний, як HTML. В результаті на світ з'явилася мова XML, що поєднує в собі простоту HTML, логіку розмітки SGML і задовольняє вимогам Інтернету.

Можливості XML:

1) Кращий контроль над розміщенням інформації.

2) Менше завантаження Web-сервера завдяки можливостям щодо доступу до інформації на клієнтській стороні. (Незалежність від сервера)

3) Застосування різних типів гіперпосилань (hyperlinks).

4) Можливість поширення різних видів інформації в Internet і intranet.

5) Менша кількість проблем, що виникають при відображенні великих сторінок (long pages).

У XML інформація про компонування розташовується окремо від безпосереднього змісту, таким чином, коли дизайнер прийме рішення змінити вигляд сайту, він просто вносить зміни у використовувану таблицю стилів. Зміст при цьому залишається незмінним. У цьому полягає головна відмінність від концепції HTML, що дозволяє різним механізмам використовувати значно більш гнучкий формат обміну інформацією. Таблиці стилів можуть застосовуватися для форматування змісту документів у різних додатках.

XML дозволяє зіставляти стилі з конкретними структурними елементами. Це означає, що розробник може швидко застосувати стильової формат для визначення структурних елементів, наприклад, сутностей, що містять оголошення зображень, особливих форматів абзаців, і навіть стилів для різних типів механізмів зв'язування (linking mechanisms).

Однією з найбільш важливих функціональних можливостей XML є те, що документи не потребують жорсткої прив'язки до серверів. Використовуючи так звану об'єктну модель документа (Document Object Model, DOM) можна створювати XML-документи, в яких відображаються або всі дані, або лише частина цих даних. Припустимо, що ви створюєте ХМL документ - просту адресну книгу. За допомогою HTML ви могли створити форму, що дозволяє знаходити ім'я в адресній книзі. Зрозуміло, це б вимагало пересилання пошукового запиту з форми до сервера кожного разу, коли користувачеві необхідно звернутися до того чи іншого їм ні в адресній книзі.

Завдяки застосуванню DOM в XML у документі може міститися весь повний список, і якщо підключена таблиця стилів, то з цього списку буде відображатися, лише затребувана інформація. Усі інші елементи документа можуть бути при цьому приховані. Якщо ж користувачеві потрібна більш повна інформація, то замість того, щоб посилати запит до сервера, знадобиться, лише відобразити іншу частину прихованої інформації за допомогою скрипта, що виконується браузером. Такий механізм таблиць стилів дозволяє працювати з адресною книгою як в Internet, так і поза ним.

Ви коли-небудь намагалися переглянути велику Web-сторінку за допомогою сучасних браузерів? HTML не дозволяє відзначити і вибрати з окремий розділ для перегляду.

XML дозволяє просто вирішити цю проблему, оскільки всі XML-документи структуровані і правильно оформлені. У XML вам не доведеться "зрізати гострі кути", як у HTML, застосовуючи різні елементи розділів, ви можете розбити єдиний документ на розділи. Така багаторівнева структура нагадує ієрархічне уявлення папок (folders) в Windows Explorer. З цього випливає, що XML забезпечує можливість пошуку по всьому документу, не вдаючись до створення окремих скриптів.

Отже, XML надає стандартну модель зв'язування, засновану на власній специфікації - розширювана мова зв'язування (Extensible Linking Language, Xlink). B HTML в якості покажчика зв'язку, або URL, можуть застосовуватися лише символьні типи даних. Сутності не застосовуються. У URL не можуть міститися умовні позначення (notations), що розділяють різні типи даних. А внутрішні зв'язки, що застосовуються для зв'язку з іншими посиланнями в тому ж самому документі, використовують атрибут NAME типу елемента, наприклад, <А NAME = "bottom">. Це відносно просте зв'язування. Зв'язування в XML є, однак, більш складним, ніж в HTML. Завдяки XLL (extensible Link Language) - мови опису зв'язків для впровадження інших документів XML і двонаправлених посилань.

Структура XML

XML-документи мають як фізичну, так і логічну структуру.

Приклад XML-документа:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.3/" xml:lang="uk">

<page>

<title>Фукідід</title>

<id>1529</id>

<revision>

<id>4382</id>

<timestamp>2006-09-18T22:11:53Z</timestamp>

<minor />

<comment>Interwiki</comment>

<text xml:space="preserve">{{Wikipedia}}

*Історія — це філософія в прикладах.

</text>

</revision>

</page>

</mediawiki>

Фізична структура

  •  Сутності (англ. Entity). Головною сутністю є зміст документа. Інші можливі сутності вказуються із допомогою
  •  Посилання на сутності (&назва; в самому документі, та, наприклад %назва; у визначені його типу) можуть слугувати в якості як позначення спеціальних символів, посилань на спеціальні символи (вказуючи коди символів &#десяткове;, або &#xшістнадцяткове;) або окремих документів чи фрагментів тексту.
  •  XML декларація, в ній вказується версія XML, кодування, та інша допоміжна інформація.
  •  Декларація типу документа може застосовуватись для того, аби додавати нові типи сутностей, та визначати логічну структуру документа.

Логічна структура

XML документ має ієрархічну логічну структуру, і може представлятись у вигляді дерева. Вузлами цього дерева можуть бути:

  •  Елементи, фізична структура яких складається із:
  •  коректної пари відкриваючого та закриваючого тегів (<Назва-тега>) та (</Назва-тега>), або
  •  тега порожнього елемента (<Назва-тега />),

  •  Атрибути, що мають вигляд пар ключ-значення (назва атрибута="значення атрибута") і знаходяться або у відкриваючому, або у порожньому тезі (подібно до метаданих),
  •  Вказівки щодо обробки документа (англ. Processing Instruction) (<?Обробник параметр ?>)
  •  Коментарі (<!-- Текст коментаря -->)
  •  Текст, або у вигляді простого тексту, або фрагментів CDATA (<![CDATA[ довільний текст]]>).

XML-документ повинен мати лише один кореневий елемент. Решта елементів є піделементами цього кореневого елемента.

Деякі веб-браузери здатні безпосередньо відображати XML-документи. Це може досягатись шляхом застосування таблиці стилів (англ. Stylesheet). Вказані у таблиці стилів операції можуть призводити до перетворення XML-документа в інший, відмінний від XML формат.

Правила створення XML- документа

У загальному випадку XML- документи повинні задовольняти таким вимогам:

У заголовку документа поміщається оголошення XML, у якому вказується мова розмітки документа, номер її версії і додаткова інформація

Кожний відкриваючий тег, що визначає деяку область даних у документі обов'язково повинний мати відповідний закриваючий тег

У XML враховується регістр символів

Всі значення атрибутів, використовуваних у визначенні тегів, повинні бути взяті в лапки

Вкладеність тегів у XML строго контролюється, тому необхідно стежити за порядком слідування відкриваючих і закриваючих тегів

Вся інформація, що розташовується між початковим і кінцевими тегами, розглядається в XML як дані і тому враховуються всі символи форматування

Якщо XML- документ не порушує приведені правила, то він називається формально-правильним і всі аналізатори, призначені для розбору XML- документів, зможуть працювати з ним коректно.

З XML-документом пов'язані три рівні коректності:

Правильно побудований XML-документ - це такий, у якому елементи правильно структуровані у вигляді дерева з коректно розставленими відкриваючих і закриваючих тегами.

Діючий XML-документ правильно побудований і містить теги, що відповідають оголошенню типу документа. Він містить тільки елементи і значення атрибутів, що відповідають DTD. Хоча XML-документ може підготовлятися і читатися без DTD, DTD істотно для встановлення дієвості.

Синтаксически коректний XML-документ знаходиться поза контролем XML. Розробник такого документа відповідає за його логічну структуризацію.

Проте крім перевірки на формальну відповідність граматиці мови, у документі можуть бути присутнім засоби контролю над вмістом документа, за дотриманням правил, що визначають необхідні співвідношення між елементами і формуючою структурою документа. Наприклад, наступний текст, будучи цілком правильним XML- документом, буде абсолютно безглуздим:

<country><title>Russia</title><city><title>Novosibirsk</country></title></city>

Для того, щоб забезпечити перевірку коректності XML-документів, необхідно використовувати аналізатори, що роблять таку перевірку і називаються верифікованими.40

На сьогоднішній день існує два способи контролю правильності XML-документа: DTD - визначення (Document Type Definition) і схеми даних (Semantic Schema). Визначення DTD- правил у XML не є необхідністю.

Конструкції мови

Вміст XML- документа являє собою набір елементів, секцій CDATA, директив аналізатора, коментарів, спецсимволів, текстових даних.

Елементи даних

Елемент - це структурна одиниця XML- документа. Вкладаючи слово rose в у тэги <flower> </flower> , ми визначаємо непустий елемент, названий <flower>, вмістом якого є rose. У загальному випадку в якості вмісту елементів можуть виступати як простий текст, так і інші, вкладені, елементи документа, секції CDATA, інструкції з опрацювання, коментар, - тобто практично будь-які частини XML- документа.

Любий непустой елемент повинний складатися з початкового, кінцевого тегов і даних, між ними заключених. Наприклад, наступні фрагменти будуть бути елементами:

<flower>rose</flower>

<city>Novosibirsk</city>

,а ці - ні:

<rose>

<flower>

rose

Набором всіх елементів, що містяться в документі, задається його структура і визначаються всі ієрархічні співвідношення. Плоска модель даних перетворюється з використанням елементів у складну ієрархічну систему з множиною можливих зв'язків між елементами. Наприклад, у такому прикладі описуємо місце розташування Новосибірських університетів (вказуємо, що Новосибірський Університет розташований у місті

Новосибірську, що, у свою чергу, знаходиться в Росії), використовуючи для цього вкладеність елементів XML :

<country id="Russia">

<cities-list>

<city>

<title>Новосибірськ</title>

<state>Siberia</state>

<universities-list>

<university id="2">

<title>Новосибірський Державний Технічний Університет</title>

<noprivate/>

<address URL="www.nstu.ru"/>

<description>дуже гарний інститут</description>

</university>

<university id="2">

<title>Новосибірський Державний Університет</title>

<noprivate/>

<address URL="www.nsu.ru"/>

<description>теж не поганої</description>

</university>

</universities-list>

</city>

</cities-list>

</country>

Проводячи пошук у цьому документі, програма клієнта буде спиратися на інформацію, закладену в його структуру - використовуючи елементи документа. Тобто, якщо, наприклад, потрібно знайти потрібний університет у потрібному місті, використовуючи приведений фрагмент документа, то

необхідно буде переглянути вміст конкретного елемента <university>, що знаходиться всередині конкретного елемента <city>. Пошук при цьому, природно, буде набагато більш ефективним, ніж знаходження потрібної послідовності по всьому документу.

У XML документі, як правило, визначається хоча б один елемент, названий кореневим і з нього програми-аналізатори починають перегляд документа. У приведеному прикладі цим елементом є <country>

У деяких випадках теги можуть змінювати й уточнювати семантику тих або інших фрагментів документа, по різному визначаючи ту саму інформацію, тим самим надаючи додатку-аналізатору цього документа зведення про контекст використання описуваних даних.

У випадку, якщо елемент не має вмісту, тобто немає даних, які він повинний визначати, він називається порожнім. Необхідно тільки пам'ятати, що початковий і кінцеві теги порожнього елемента ніби об'єднується в один, і треба обов'язково ставити косу риску перед кутовою закриваючою (наприклад, <empty/>;)

Застосування XML

На цьому етапі я досліджувала всі області, де XML використовується. Отож в Ajax і XML в XMLHttpRequest все ж таки дуже реальні, і у вас є кілька опцій для використання XML у ваших Web-додатках. Отож, основними опціями є:

У асинхронних додатках можна знайти два основних застосування XML:

  •  Для відправлення запиту з Web-сторінки на сервер в XML-форматі
  •  Для отримання запиту з сервера на вашу Web-сторінку в XML-форматі

Перше застосування – для відправлення запиту в XML – вимагає, щоб ви формували ваш запит як XML, або застосовуючи для цього API, або просто пов'язуючи текст і потім відправляючи результат на сервер. У цьому способі головним завданням є побудова запиту згідно правилам XML, так, щоб він був зрозумілий сервером. Отже, основна увага в дійсності приділяється XML-формату; у вас є дані, які ви хочете відправити, і ви тільки повинні представити їх у XML-вираженні.

Друге застосування – для отримання запиту в XML – вимагає, щоб ви отримали запит з сервера і витягли дані з XML (знову ж за допомогою API або більш грубим методом). У цьому випадку вашим завданням буде витяг отриманих з сервера даних з XML, щоб можна було їх використовувати конструктивно.

Висновок

У цій роботі було описано, чому мова XML є найбільш перспективним мовою розмітки і незабаром займе лідируючу позицію серед подібних мов. Наведено можливості мови XML, серед яких головними можна визначити:

  •  Кращий контроль над розміщенням інформації.
  •  Менше завантаження Web-сервера завдяки можливостям щодо доступу до інформації на клієнтській стороні. (Незалежність від сервера).
  •  Застосування різних типів гіперпосилань (hyperlinks).
  •  Можливість поширення різних видів інформації в Internet і intranet.
  •  Менша кількість проблем, що виникають при відображенні великих сторінок (long pages).

Вивчивши і проаналізувавши дані про розширювану мову розмітки, я встановила переваги і перспективи цієї мови:

По-перше XML дозволяє здійснювати контроль за коректністю даних, що зберігаються в документах, робити перевірки ієрархічних співвідношень

усередині документа і встановлювати єдиний стандарт на структуру документів, умістом яких можуть бути самі різноманітні дані.

По-друге очевидною перевагою XML є можливість використання її в якості універсальної мови запитів до сховищ інформації.

По-третє на основі XML уже сьогодні створені такі відомі спеціалізовані мови розмітки, як SMIL, CDF, MathML, XSL, і список робочих проектів нових мов, що знаходяться на розгляді W3C, постійно поповнюється.

Список використаної літератури

1. Мазуркевич А., Меловой Д., Настольная книга программиста - К.: Новое знание, 2004г..-123с

2. Эферган М. Java: справочник. – СПб.: Питер, 1998. -248с.

3. Ульман Лари, Основы программирования на РНР: Пер. с англ. - М.: ДМК Пресс, 2001.-67с.

5. Ковалюк Т.В., Основи програмування. – К.:Видавнича група BHV, 2005. – 107с.

6. http://uk.wikipedia.org/wiki/XML

7.http://www.rusnauka.com/33_DWS_2010/33_DWS_2010/Informatica/74061.doc.htm

8. http://www.lib.mdpu.org.ua/e-book/web/lec9.html


 

А также другие работы, которые могут Вас заинтересовать

70859. Этика отношений преподавателя и студента 98.5 KB
  Этические кодексы поведения запрещает преподавателю узурпировать свою власть над студентом особенно в форме эксплуатации или насилия в различных видах: сексуальном расовом религиозном интеллектуальном принуждать студентов делать то что не является предметом изучения его дисциплины.
70860. Обучение студентов и школьников навыкам изучения правовых наук 104.5 KB
  Творческие работы как элемент мотивации студентов к изучению правовых наук. Обучение студентов и школьников работе с текстом книгой Учебный текст как модель представления научных знаний это обобщенное содержание учебного процесса. Студентов следует учить как работать с текстом.
70861. Основные требования к преподавателю общественных дисциплин 89 KB
  Педагоги используют различные способы мотивирования студентов к учебе. Первый использует собственный авторитет свою личность для того чтобы привлечь студентов а затем пытается перенести интерес студентов от себя к предмету.
70862. Дискуссия как эффективный метод проведения семинарского занятия по правоведческим наукам 120 KB
  Дискуссии и диалоги их преимущества и недостатки. Роль преподавателя в проведении дискуссии. Приемы и методы проведения дискуссии. Дискуссии и диалоги их преимущества и недостатки.
70863. Демократический идеал и методика преподавания общественно- правовых дисциплин 57 KB
  По содержанию гуманитарное образование можно определить как учебно-воспитательный процесс преподавания и усвоения широкого круга гуманитарных дисциплин исторических философских политологических социологических экономических культурологических филологических...
70864. Использование семинаров и школьных уроков в преподавании правовых дисциплин 116.5 KB
  Помогает расширить закрепить и обогатить знания студентов по отдельным темам курса активизировать работу студентов привить им вкус к публичным выступлениям. Иные авторы подчеркивают что неформальная структура семинара дает возможность большему числу...
70865. Методика организации коллективно-творческого дела 18.83 KB
  Хотелось бы сразу отметить что методика КТД мало эффективна в условиях одновозрастных отрядов и скоротечности смен обычного ДОЛ в условиях которых коллектив как правило не успевает вызреть до реального использования данной методики поэтому в ДОЛ используются как правило хоть широко...