73187

ОСНОВНЫЕ СВЕДЕНИЯ О КОНЦЕПЦИИ СЕМАНТИЧЕСКОГО WEB

Лекция

Информатика, кибернетика и программирование

Возможность интегрировать в Интернет объекты реального мира благодаря унификации обмена данными. Организация такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей.

Русский

2014-12-05

24 KB

6 чел.

Лекция 3

ОСНОВНЫЕ СВЕДЕНИЯ О КОНЦЕПЦИИ СЕМАНТИЧЕСКОГО WEB

1) Проблемы традиционного Web:

- рост объемов информационного наполнения;

- представление информации, которое ориентированно преимущественно на людей;

- проблема нахождения необходимой пользователю информации;

- невозможность выделить смысл сообщений в автоматизированном режиме.

2) Основные идеи Семантического Web

Возможность интегрировать в Интернет объекты реального мира благодаря унификацииобмена данными. Организация такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей.

Создание непрерывного информационного поля, превращение его в систему семантического уровня. Семантический Web представляет собой расширение существующей сети Интернет, в котором информация представляется в четком и определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности.

3) Структура семантического Web

Рис.1. Семантический Web

В процессе реализации концепции Семантического Web получили широкое развитие синтаксические методы представления информации языковыми средствами XML и его дополнений, предназначенных для описания типовых свойств элементов XML-документов, их струк- туры и семантики: рекомендации W3C, регламентирующие DTD (Document Type Definition), XML Schema, XQuery (язык запросов к базам XML-данных) и т.д. К языкам представления дан- ных относятся также Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможно- стей, потому они уже обладают статусом рекомендаций W3C.

Другая ветвь Семантического Web связана с направлениями, близкими к области искусственного интеллекта, и названа онтологическим подходом. Этот подход включает в себя средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - Web-сервисы и агенты при обработке сложных пользовательских запросов. Модели предметных областей в терминологии Семантического Web называются онтологиями. 10 февраля 2004 года консорциумом W3C была утверждена и опубликована спецификация языка сетевых онтологий OWL (Web Ontology Language). Две ветви Семантического Web используют три ключевых языка (соответственно, технологий):

- спецификация XML, позволяющая определить синтаксис и структуру документов;

- механизм описания ресурсов RDF, обеспечивающий модель кодирования для значений понятий, определенных в онтологиях.

- язык онтологий OWL, позволяющий определять понятия и отношения между ними.

Семантический Web использует также и другие языки, технологии и концепции, в частности, универсальные идентификаторы ресурсов, цифровые подписи, системы логического вывода и т. д.

При этом самый нижний уровень Семантического Web — это Universal Resource Identifier (URI), унифицированный идентификатор, определяющий способ записи адреса произвольного ресурса.

Отдельный уровень в концепции Семантического Web ориентирован на работу с цифровой подписью, которая необходима, чтобы клиенты могли определять степень достоверности данных.

4) XML – синтаксическая основа Семантического Web

Исходная версия XML, разработанная в консорциуме W3C под руководством Джона Босака, была опубликована в феврале 1998 года и с тех пор развилась до уровня метаязыка, на базе которого определяются сотни новых предметно-ориентированных языков (к примеру, MathML, XLink, SMIL, XSL и др.)

В отличие от HTML, XML предназначен для разметки документов произвольной структуры. Универсальный синтаксис XML обусловил появление ряда технологий, таких как:

XSL и XPath, предназначенные для работы с древовидной структурой документов;

XML Schema – стандарт описания конкретных языков разметки, использующий синтаксис XML; XLink и XPointer – средства связи распределенных блоков информации в один общий документ;

XQuery – язык запросов к XML-данным

Формат любого тега XML прост: <идентификатор> содержание </идентификатор>.

Поскольку в XML не существует фиксированного словаря тегов, то они могут определяться независимо для каждой программы. В XML это было изначально предусмотрено с помощью определения типа документа DTD (Document Type Definitions), накладывающего ограничения на используемые теги и задающего грамматику, которая указывает допустимые комбинации и вложения имен тегов, имен атрибутов и т.д. Вместе с тем, языку DTD присущи два серьезных недостатка - ограниченность описания типов данных и синтаксис, отличный от XML. Поэтому в настоящее время консорциум W3C настоятельно рекомендует заменять использование DTD новым стандартом - XML-схем (XML Schema), который был утвержден в 2001 году (http://www.w3.org/TR/xmlschema-formal/).

5) Средства описания ресурсов RDF

RDF - язык формального описания содержания сетевых ресурсов, который согласно архитектуре Семантического Web представляет собой связующее звено между XML-документами и средствами, обеспечивающими поиск и навигацию на основе логических утверждений.

Принцип построения отношений между сетевыми ресурсами в спецификации RDF предусматривает наличие трех компонент - объекта, атрибута и значения (аналогичных классической схеме "подлежащее - сказуемое - дополнение").

Базовый строительный блок в RDF - триплет "объект - атрибут - значение" часто записывают в виде A(O,V), где О – объект (ресурс), А - атрибут (свойство) со значением (субъектом) V. RDF позволяет менять местами объекты и значения. Благодаря тому, что RDF использует URI-идентификаторы для кодирования информации в документе, обеспечивается возможная привязка понятия к единому определению, которое можно найти в Сети.

Модель данных RDF сама по себе является всего лишь синтаксической основой - для того чтобы описание обрело смысл, необходимо воспользоваться словарями терминов и понятий, которые задаются с помощью технологии – RDF схема (Schema), играющей для RDF такую же

роль, что и схема для XML.

RDF — это самый низкоуровневый из существующих языков описания метаданных, поскольку оперирует лишь понятиями связей примитивных сущностей, например, «объект A владеет субъектом Б».

6) Онтологии

В структуре Семантического Web предусмотрены и более эффективные

специальные средства описания содержания, чем RDF. Онтологии - это базы знаний, которые включают в себя сведения, необходимые для отождествления новых понятий с уже известными,  для определения принадлежности используемых терминов к той или иной предметной области

и, в результате, для приведения любых понятий к виду, пригодному для восприятия программами - электронными агентами.Отличия онтологий от XML:

- онтология отличается тем, что это представление знания, а не формат документов.

- одним из преимуществ онтологий будет доступность инструментов, которые обеспечат универсальную поддержку семантики, которая не является специфической для определенной предметной области.

Предполагается, что «интеллектуальные» приложения смогут использовать онтологии, чтобы получать в результате поиска информацию со связанной с ней структурой знаний и правилами вывода.

Разработан и стандартизирован язык описания структурированных онтологий OWL. В рамках OWL онтология – это совокупность утверждений, задающих отношения между понятиями и определяющих логические правила для рассуждений о них.

Онтология может включать описания классов, свойств и их примеры. OWL может использоваться, чтобы явно представлять значения терминов и отношения между этими терминами в словарях. OWL имеет больше средств для выражения значения и семантики, чем XML, RDF, и RDF-S, и, таким образом, OWL идет дальше этих языков в способности представить поддающийся машинной обработке контент Сети.

7) Знания

Семантический Web предполагает создание системы с элементами "искусственного интеллекта", которая бы позволила специальным приложениям качественно искать в Интернет необходимую информацию, а также обмениваться информацией друг с другом. При этом именно язык онтологий OWL выступил решающей компонентой интеллектуализации, базисом для построения семантических сетей.

Представлениям знаний в Семантическом Web присущи универсальные выразительные возможности, синтаксическая и семантическая интероперабельность, которая реализуется, например, в онтологиях путем установлением соответствия между используемыми терминами.

8) Агенты

Под агентами понимаются программы, работающие без непосредственного управления со стороны человека для достижения поставленных перед ней целей. Обычно агенты собирают, фильтруют и обрабатывают информацию, найденную в Сети, иногда путем взаимодействия с другими агентами. В соответствии с документами W3C, Семантический Web заработает в полную силу тогда, когда люди создадут множество программ, которые, знакомясь с содержимым Сети из различных источников, смогут обрабатывать полученную информацию и обмениваться результатами с другими программами.

Основные принципы функционирования агентов:

- агент не имеет полной информации, необходимой для решения поставленной задачи;

- обрабатываемые данные распределены в сети;

- вычисления выполняются агентами асинхронно;

- взаимодействие агентов друг с другом и с человеком происходит на высоком семантическом уровне;

- отсутствует глобальный контроль за деятельностью всей системы агентов.


 

А также другие работы, которые могут Вас заинтересовать

66904. КУЛЬТУРА ДРЕВНЕЙШЕГО МИРА 62.5 KB
  Литературоведение — наука о художественной литературе, ее происхождении, сущности и развитии. Современное литературоведение состоит из трех самостоятельных, но тесно связанных между собой дисциплин (разделов): теории литературы, истории литературы и литературной критики
66905. Логические элементы 441 KB
  Рассматриваются принципы работы, характеристики и типовые схемы включения простейших логических элементов — инверторов, буферов, элементов И и ИЛИ, а также приводятся схемотехнические решения, позволяющие реализовать на их основе часто встречающиеся функции.
66906. Модели и процессы управления проектами программных средств 257.5 KB
  Назначение методологии СММ/CMMI – системы и модели оценки зрелости – состоит в предоставлении необходимых общих рекомендаций и инструкций предприятиям, производящим ПС, по выбору стратегии совершенствования качества процессов и продуктов, путем анализа степени их производственной зрелости и оценивания факторов...
66907. ФУНКЦИИ ГОСУДАРСТВА 149.5 KB
  Научное познание государства любого исторического типа обязательно предполагает рассмотрение его функций представляющих собой важнейшие качественные характеристики и ориентиры не только собственно государства как особой организации публичной власти но и общества в целом.
66908. ДЕСМУРГИЯ 81.5 KB
  Под повязкой понимается один из способов закрепления перевязочного материала обычная повязка поддержание постоянного давления на определенную часть тела давящая повязка удержание части тела в неподвижном положении иммобилизирующая повязка лечение вытяжением.
66909. ПРИКЛАДНА КРИПТОЛОГІЯ 305.66 KB
  Основою побудування сучасних систем обробки інформації є застосування інформаційних систем(ІС) та інформаційно – телекомунікаційних систем(ІТС). ІС це система, в якій реалізується технологія обробки інформації за допомогою технічних і програмних засобів.
66910. Особливості розвитку української культури в литовсько-руську та польсько-литовську добу (XIV-перша половина XVII ст.) 277 KB
  Більша частина українських земель знаходиласяу складі Литовської та Польської держав. Разом із тим ХІV – ХVІ ст. – це час подальшого формування українського народу, активізація його боротьби проти польсько-литовського панування, поява на історичній арені України такого самобутнього...
66911. Целевой маркетинг 33.83 KB
  Сегментация по географическому признаку разделение рынка на разные географические объекты страны регионы города. Сегментирование по демографическому признаку разделение рынка на потребительские группы на основе демографических переменных: пол возраст размер семьи этапы жизненного цикла семьи род занятий образование уровень дохода...
66912. Статичні члени класу та їх оголошення 48 KB
  Оголошуючи член-даних класу статичним, ми тим самим повідомляємо компілятор про те, що, незалежно від того, скільки обєктів цього класу буде створено, існує тільки одна копія цього static-члена. Іншими словами, static-член розділяється між всіма обєктами класу.