73187

ОСНОВНЫЕ СВЕДЕНИЯ О КОНЦЕПЦИИ СЕМАНТИЧЕСКОГО WEB

Лекция

Информатика, кибернетика и программирование

Возможность интегрировать в Интернет объекты реального мира благодаря унификации обмена данными. Организация такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей.

Русский

2014-12-05

24 KB

5 чел.

Лекция 3

ОСНОВНЫЕ СВЕДЕНИЯ О КОНЦЕПЦИИ СЕМАНТИЧЕСКОГО WEB

1) Проблемы традиционного Web:

- рост объемов информационного наполнения;

- представление информации, которое ориентированно преимущественно на людей;

- проблема нахождения необходимой пользователю информации;

- невозможность выделить смысл сообщений в автоматизированном режиме.

2) Основные идеи Семантического Web

Возможность интегрировать в Интернет объекты реального мира благодаря унификацииобмена данными. Организация такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей.

Создание непрерывного информационного поля, превращение его в систему семантического уровня. Семантический Web представляет собой расширение существующей сети Интернет, в котором информация представляется в четком и определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности.

3) Структура семантического Web

Рис.1. Семантический Web

В процессе реализации концепции Семантического Web получили широкое развитие синтаксические методы представления информации языковыми средствами XML и его дополнений, предназначенных для описания типовых свойств элементов XML-документов, их струк- туры и семантики: рекомендации W3C, регламентирующие DTD (Document Type Definition), XML Schema, XQuery (язык запросов к базам XML-данных) и т.д. К языкам представления дан- ных относятся также Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможно- стей, потому они уже обладают статусом рекомендаций W3C.

Другая ветвь Семантического Web связана с направлениями, близкими к области искусственного интеллекта, и названа онтологическим подходом. Этот подход включает в себя средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - Web-сервисы и агенты при обработке сложных пользовательских запросов. Модели предметных областей в терминологии Семантического Web называются онтологиями. 10 февраля 2004 года консорциумом W3C была утверждена и опубликована спецификация языка сетевых онтологий OWL (Web Ontology Language). Две ветви Семантического Web используют три ключевых языка (соответственно, технологий):

- спецификация XML, позволяющая определить синтаксис и структуру документов;

- механизм описания ресурсов RDF, обеспечивающий модель кодирования для значений понятий, определенных в онтологиях.

- язык онтологий OWL, позволяющий определять понятия и отношения между ними.

Семантический Web использует также и другие языки, технологии и концепции, в частности, универсальные идентификаторы ресурсов, цифровые подписи, системы логического вывода и т. д.

При этом самый нижний уровень Семантического Web — это Universal Resource Identifier (URI), унифицированный идентификатор, определяющий способ записи адреса произвольного ресурса.

Отдельный уровень в концепции Семантического Web ориентирован на работу с цифровой подписью, которая необходима, чтобы клиенты могли определять степень достоверности данных.

4) XML – синтаксическая основа Семантического Web

Исходная версия XML, разработанная в консорциуме W3C под руководством Джона Босака, была опубликована в феврале 1998 года и с тех пор развилась до уровня метаязыка, на базе которого определяются сотни новых предметно-ориентированных языков (к примеру, MathML, XLink, SMIL, XSL и др.)

В отличие от HTML, XML предназначен для разметки документов произвольной структуры. Универсальный синтаксис XML обусловил появление ряда технологий, таких как:

XSL и XPath, предназначенные для работы с древовидной структурой документов;

XML Schema – стандарт описания конкретных языков разметки, использующий синтаксис XML; XLink и XPointer – средства связи распределенных блоков информации в один общий документ;

XQuery – язык запросов к XML-данным

Формат любого тега XML прост: <идентификатор> содержание </идентификатор>.

Поскольку в XML не существует фиксированного словаря тегов, то они могут определяться независимо для каждой программы. В XML это было изначально предусмотрено с помощью определения типа документа DTD (Document Type Definitions), накладывающего ограничения на используемые теги и задающего грамматику, которая указывает допустимые комбинации и вложения имен тегов, имен атрибутов и т.д. Вместе с тем, языку DTD присущи два серьезных недостатка - ограниченность описания типов данных и синтаксис, отличный от XML. Поэтому в настоящее время консорциум W3C настоятельно рекомендует заменять использование DTD новым стандартом - XML-схем (XML Schema), который был утвержден в 2001 году (http://www.w3.org/TR/xmlschema-formal/).

5) Средства описания ресурсов RDF

RDF - язык формального описания содержания сетевых ресурсов, который согласно архитектуре Семантического Web представляет собой связующее звено между XML-документами и средствами, обеспечивающими поиск и навигацию на основе логических утверждений.

Принцип построения отношений между сетевыми ресурсами в спецификации RDF предусматривает наличие трех компонент - объекта, атрибута и значения (аналогичных классической схеме "подлежащее - сказуемое - дополнение").

Базовый строительный блок в RDF - триплет "объект - атрибут - значение" часто записывают в виде A(O,V), где О – объект (ресурс), А - атрибут (свойство) со значением (субъектом) V. RDF позволяет менять местами объекты и значения. Благодаря тому, что RDF использует URI-идентификаторы для кодирования информации в документе, обеспечивается возможная привязка понятия к единому определению, которое можно найти в Сети.

Модель данных RDF сама по себе является всего лишь синтаксической основой - для того чтобы описание обрело смысл, необходимо воспользоваться словарями терминов и понятий, которые задаются с помощью технологии – RDF схема (Schema), играющей для RDF такую же

роль, что и схема для XML.

RDF — это самый низкоуровневый из существующих языков описания метаданных, поскольку оперирует лишь понятиями связей примитивных сущностей, например, «объект A владеет субъектом Б».

6) Онтологии

В структуре Семантического Web предусмотрены и более эффективные

специальные средства описания содержания, чем RDF. Онтологии - это базы знаний, которые включают в себя сведения, необходимые для отождествления новых понятий с уже известными,  для определения принадлежности используемых терминов к той или иной предметной области

и, в результате, для приведения любых понятий к виду, пригодному для восприятия программами - электронными агентами.Отличия онтологий от XML:

- онтология отличается тем, что это представление знания, а не формат документов.

- одним из преимуществ онтологий будет доступность инструментов, которые обеспечат универсальную поддержку семантики, которая не является специфической для определенной предметной области.

Предполагается, что «интеллектуальные» приложения смогут использовать онтологии, чтобы получать в результате поиска информацию со связанной с ней структурой знаний и правилами вывода.

Разработан и стандартизирован язык описания структурированных онтологий OWL. В рамках OWL онтология – это совокупность утверждений, задающих отношения между понятиями и определяющих логические правила для рассуждений о них.

Онтология может включать описания классов, свойств и их примеры. OWL может использоваться, чтобы явно представлять значения терминов и отношения между этими терминами в словарях. OWL имеет больше средств для выражения значения и семантики, чем XML, RDF, и RDF-S, и, таким образом, OWL идет дальше этих языков в способности представить поддающийся машинной обработке контент Сети.

7) Знания

Семантический Web предполагает создание системы с элементами "искусственного интеллекта", которая бы позволила специальным приложениям качественно искать в Интернет необходимую информацию, а также обмениваться информацией друг с другом. При этом именно язык онтологий OWL выступил решающей компонентой интеллектуализации, базисом для построения семантических сетей.

Представлениям знаний в Семантическом Web присущи универсальные выразительные возможности, синтаксическая и семантическая интероперабельность, которая реализуется, например, в онтологиях путем установлением соответствия между используемыми терминами.

8) Агенты

Под агентами понимаются программы, работающие без непосредственного управления со стороны человека для достижения поставленных перед ней целей. Обычно агенты собирают, фильтруют и обрабатывают информацию, найденную в Сети, иногда путем взаимодействия с другими агентами. В соответствии с документами W3C, Семантический Web заработает в полную силу тогда, когда люди создадут множество программ, которые, знакомясь с содержимым Сети из различных источников, смогут обрабатывать полученную информацию и обмениваться результатами с другими программами.

Основные принципы функционирования агентов:

- агент не имеет полной информации, необходимой для решения поставленной задачи;

- обрабатываемые данные распределены в сети;

- вычисления выполняются агентами асинхронно;

- взаимодействие агентов друг с другом и с человеком происходит на высоком семантическом уровне;

- отсутствует глобальный контроль за деятельностью всей системы агентов.


 

А также другие работы, которые могут Вас заинтересовать

41697. Определение затрат мощности на перемешивание в аппарате с мешалкой 4.72 MB
  При увеличении скорости движения происходит отрыв пограничного слоя от поверхности тела в точках где скорость жидкости является наибольшей например у кромок вертикальной пластины и образование турбулентного кормового следа за движущимся телом. Начало отрыва пограничного слоя характеризуется резким возрастанием сопротивления среды движению тела. Описание экспериментальной установки Лабораторная установка схема которой изображена на рисунке 4 состоит из циклона 4 внутренний диаметр циклона 02м размер входного патрубка 013005 м...
41698. Позиционные системы счисления. Перевод чисел из одной позиционной системы счисления в другую. Арифметические операции с числами в позиционных системах счисления 48.78 KB
  Перевод чисел из одной позиционной системы счисления в другую. Арифметические операции с числами в позиционных системах счисления. Цели работы: Освоение алгоритма перевода чисел из произвольной системы счисления в десятичную систему счисления.
41700. Изучение приборов для измерения давления. Определение гидростатического давления 370.32 KB
  Определение гидростатического давления Цель работы: освоение способов измерения гидростатического давления. Приборы для измерения давления Методы измерения гидростатического давления так же разнообразны как и конструкции приборов предназначенных для этого. Приборы для измерения давления носят общее название манометров.
41701. Операционная система Linux. Работа в консольном режиме 907.12 KB
  Чтобы выполнить команду ее надо записать после приглашения и нажать Enter. Тогда следует дать команду cl 2009. Если написать команду без параметра то она выдаст пустую строку. Если команду ls использовать с ключом l то вывод будет более информативным.
41702. Построение паспорта прочности породы. Определение сцепления и угла внутреннего трения 43.68 KB
  Произвести краткую статическую обработку результатов испытаний; Построить паспорт прочности горной породы в координатах σ – τ; По паспорту прочности определить сцепление и угол внутреннего трения породы. Результаты испытаний представляют собой ряд равноточных измерений поэтому их обработку ведем в следующей последовательности: Определяем среднее значение σр σсж результатов испытаний: ...
41703. ОПЕРАЦИОННАЯ СИСТЕМА MS-DOS 115 KB
  Целью работы является изучение файловой структуры диска и основных ее элементов, основных сервисных функции операционной системы MS-DOS и приобретение практических навыков их использования.
41704. РАСЧЕТ ЦЕПИ ПОСТОЯННОГО ТОКА 182.5 KB
  Я исследовал токи, напряжения и мощности в цепи постоянного тока с помощью пакета прикладных программ PSpise. Так же я составили описание схемы на внутреннем языке PSpice, предварительно заменив источники тока, источниками напряжений и упростил схему.