73187

ОСНОВНЫЕ СВЕДЕНИЯ О КОНЦЕПЦИИ СЕМАНТИЧЕСКОГО WEB

Лекция

Информатика, кибернетика и программирование

Возможность интегрировать в Интернет объекты реального мира благодаря унификации обмена данными. Организация такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей.

Русский

2014-12-05

24 KB

6 чел.

Лекция 3

ОСНОВНЫЕ СВЕДЕНИЯ О КОНЦЕПЦИИ СЕМАНТИЧЕСКОГО WEB

1) Проблемы традиционного Web:

- рост объемов информационного наполнения;

- представление информации, которое ориентированно преимущественно на людей;

- проблема нахождения необходимой пользователю информации;

- невозможность выделить смысл сообщений в автоматизированном режиме.

2) Основные идеи Семантического Web

Возможность интегрировать в Интернет объекты реального мира благодаря унификацииобмена данными. Организация такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей.

Создание непрерывного информационного поля, превращение его в систему семантического уровня. Семантический Web представляет собой расширение существующей сети Интернет, в котором информация представляется в четком и определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности.

3) Структура семантического Web

Рис.1. Семантический Web

В процессе реализации концепции Семантического Web получили широкое развитие синтаксические методы представления информации языковыми средствами XML и его дополнений, предназначенных для описания типовых свойств элементов XML-документов, их струк- туры и семантики: рекомендации W3C, регламентирующие DTD (Document Type Definition), XML Schema, XQuery (язык запросов к базам XML-данных) и т.д. К языкам представления дан- ных относятся также Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможно- стей, потому они уже обладают статусом рекомендаций W3C.

Другая ветвь Семантического Web связана с направлениями, близкими к области искусственного интеллекта, и названа онтологическим подходом. Этот подход включает в себя средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - Web-сервисы и агенты при обработке сложных пользовательских запросов. Модели предметных областей в терминологии Семантического Web называются онтологиями. 10 февраля 2004 года консорциумом W3C была утверждена и опубликована спецификация языка сетевых онтологий OWL (Web Ontology Language). Две ветви Семантического Web используют три ключевых языка (соответственно, технологий):

- спецификация XML, позволяющая определить синтаксис и структуру документов;

- механизм описания ресурсов RDF, обеспечивающий модель кодирования для значений понятий, определенных в онтологиях.

- язык онтологий OWL, позволяющий определять понятия и отношения между ними.

Семантический Web использует также и другие языки, технологии и концепции, в частности, универсальные идентификаторы ресурсов, цифровые подписи, системы логического вывода и т. д.

При этом самый нижний уровень Семантического Web — это Universal Resource Identifier (URI), унифицированный идентификатор, определяющий способ записи адреса произвольного ресурса.

Отдельный уровень в концепции Семантического Web ориентирован на работу с цифровой подписью, которая необходима, чтобы клиенты могли определять степень достоверности данных.

4) XML – синтаксическая основа Семантического Web

Исходная версия XML, разработанная в консорциуме W3C под руководством Джона Босака, была опубликована в феврале 1998 года и с тех пор развилась до уровня метаязыка, на базе которого определяются сотни новых предметно-ориентированных языков (к примеру, MathML, XLink, SMIL, XSL и др.)

В отличие от HTML, XML предназначен для разметки документов произвольной структуры. Универсальный синтаксис XML обусловил появление ряда технологий, таких как:

XSL и XPath, предназначенные для работы с древовидной структурой документов;

XML Schema – стандарт описания конкретных языков разметки, использующий синтаксис XML; XLink и XPointer – средства связи распределенных блоков информации в один общий документ;

XQuery – язык запросов к XML-данным

Формат любого тега XML прост: <идентификатор> содержание </идентификатор>.

Поскольку в XML не существует фиксированного словаря тегов, то они могут определяться независимо для каждой программы. В XML это было изначально предусмотрено с помощью определения типа документа DTD (Document Type Definitions), накладывающего ограничения на используемые теги и задающего грамматику, которая указывает допустимые комбинации и вложения имен тегов, имен атрибутов и т.д. Вместе с тем, языку DTD присущи два серьезных недостатка - ограниченность описания типов данных и синтаксис, отличный от XML. Поэтому в настоящее время консорциум W3C настоятельно рекомендует заменять использование DTD новым стандартом - XML-схем (XML Schema), который был утвержден в 2001 году (http://www.w3.org/TR/xmlschema-formal/).

5) Средства описания ресурсов RDF

RDF - язык формального описания содержания сетевых ресурсов, который согласно архитектуре Семантического Web представляет собой связующее звено между XML-документами и средствами, обеспечивающими поиск и навигацию на основе логических утверждений.

Принцип построения отношений между сетевыми ресурсами в спецификации RDF предусматривает наличие трех компонент - объекта, атрибута и значения (аналогичных классической схеме "подлежащее - сказуемое - дополнение").

Базовый строительный блок в RDF - триплет "объект - атрибут - значение" часто записывают в виде A(O,V), где О – объект (ресурс), А - атрибут (свойство) со значением (субъектом) V. RDF позволяет менять местами объекты и значения. Благодаря тому, что RDF использует URI-идентификаторы для кодирования информации в документе, обеспечивается возможная привязка понятия к единому определению, которое можно найти в Сети.

Модель данных RDF сама по себе является всего лишь синтаксической основой - для того чтобы описание обрело смысл, необходимо воспользоваться словарями терминов и понятий, которые задаются с помощью технологии – RDF схема (Schema), играющей для RDF такую же

роль, что и схема для XML.

RDF — это самый низкоуровневый из существующих языков описания метаданных, поскольку оперирует лишь понятиями связей примитивных сущностей, например, «объект A владеет субъектом Б».

6) Онтологии

В структуре Семантического Web предусмотрены и более эффективные

специальные средства описания содержания, чем RDF. Онтологии - это базы знаний, которые включают в себя сведения, необходимые для отождествления новых понятий с уже известными,  для определения принадлежности используемых терминов к той или иной предметной области

и, в результате, для приведения любых понятий к виду, пригодному для восприятия программами - электронными агентами.Отличия онтологий от XML:

- онтология отличается тем, что это представление знания, а не формат документов.

- одним из преимуществ онтологий будет доступность инструментов, которые обеспечат универсальную поддержку семантики, которая не является специфической для определенной предметной области.

Предполагается, что «интеллектуальные» приложения смогут использовать онтологии, чтобы получать в результате поиска информацию со связанной с ней структурой знаний и правилами вывода.

Разработан и стандартизирован язык описания структурированных онтологий OWL. В рамках OWL онтология – это совокупность утверждений, задающих отношения между понятиями и определяющих логические правила для рассуждений о них.

Онтология может включать описания классов, свойств и их примеры. OWL может использоваться, чтобы явно представлять значения терминов и отношения между этими терминами в словарях. OWL имеет больше средств для выражения значения и семантики, чем XML, RDF, и RDF-S, и, таким образом, OWL идет дальше этих языков в способности представить поддающийся машинной обработке контент Сети.

7) Знания

Семантический Web предполагает создание системы с элементами "искусственного интеллекта", которая бы позволила специальным приложениям качественно искать в Интернет необходимую информацию, а также обмениваться информацией друг с другом. При этом именно язык онтологий OWL выступил решающей компонентой интеллектуализации, базисом для построения семантических сетей.

Представлениям знаний в Семантическом Web присущи универсальные выразительные возможности, синтаксическая и семантическая интероперабельность, которая реализуется, например, в онтологиях путем установлением соответствия между используемыми терминами.

8) Агенты

Под агентами понимаются программы, работающие без непосредственного управления со стороны человека для достижения поставленных перед ней целей. Обычно агенты собирают, фильтруют и обрабатывают информацию, найденную в Сети, иногда путем взаимодействия с другими агентами. В соответствии с документами W3C, Семантический Web заработает в полную силу тогда, когда люди создадут множество программ, которые, знакомясь с содержимым Сети из различных источников, смогут обрабатывать полученную информацию и обмениваться результатами с другими программами.

Основные принципы функционирования агентов:

- агент не имеет полной информации, необходимой для решения поставленной задачи;

- обрабатываемые данные распределены в сети;

- вычисления выполняются агентами асинхронно;

- взаимодействие агентов друг с другом и с человеком происходит на высоком семантическом уровне;

- отсутствует глобальный контроль за деятельностью всей системы агентов.


 

А также другие работы, которые могут Вас заинтересовать

73727. Динамика тела с одной неподвижной точкой 1.29 MB
  Будем рассматривать движение тела под действием системы n заданных сил показанных на рис. Для составления дифференциальных уравнений движения тела с одной неподвижной точкой применим теорему об изменении кинетического момента системы теорему моментов относительно неподвижной точки...
73728. Методика преподавания руского языка во вспомогательной школе 222.97 KB
  Языковыми средствами для их отображения являются слова словосочетания простые предложения нераспространенные и распространенные осложненные однородными членами. Ключевые слова: грамота аналитикосинтетический метод речедвигательный анализатор синтагма. Пишущий должен оформить свою мысль в виде предложения точно подобрав для этой цели слова и спрогнозировав место каждого предложения среди других единиц текста осуществить звуковой анализ отобранных слов соотнести звук и букву учитывая при этом правила графики и орфографии выполнить...
73730. Основні поняття алгоритмізації та програмування 543.5 KB
  Основы программирования: Учебник для вузов. В связи с эти знание языков программирования и умение составлять на их основе эффективные программы является насущной потребностью современного специалиста. Цели данной лекции заключаются в ознакомлении студентов с предметом целями и задачами учебной дисциплины Технологии программирования основными понятиями программирования историей возникновения и развития языков программирования изучение свойств алгоритмов знакомство с основными приемами составления алгоритмов вычислительных задач. Языки...
73731. Тепловое излучение и люминесценция 346 KB
  Окисляющийся на воздухе фосфор светится за счет энергии выделяемой при химическом превращении. Если распределение энергии между телом и излучением остается неизменным для каждой длины волны состояние системы тело излучение будет равновесным. Нарушено и тело излучает энергии больше чем поглощает. Это в свою очередь обусловит уменьшение количества излучаемой телом энергии.
73732. Взаимодействие с виртуальными объектами 48 KB
  Средства визуализации на базе расширенной и виртуальной реальности активно используются для анализа и интерпретации данных, полученных при компьютерном моделировании. Возникает задача создания соответствующих средств взаимодействия с виртуальными объектами и навигации в виртуальном пространстве.
73733. Причины, этапы и последствия разводов 58.74 KB
  Развод – формальное прекращение (расторжение) действительного брака между живыми супругами. От развода следует отличать признание брака недействительным в судебном порядке и прекращение брака впоследствии кончины одного из супругов.
73735. Спектральный анализ и синтез детерминированных сигналов 431.5 KB
  функций времени и спектрального разложения на синусоидальные и косинусоидальные составляющие это преобразования Фурье . Обобщенная спектральная теория исследует общие закономерности спектрального анализа для систем базисных функций и рассматривает особенности выбора базисных систем при решении задач передачи и обработки сигналов. Представление 1 называют разложением сигнала по системе базисных функций. К системе базисных функций предъявляют следующие требования : для любого сигнала ряд 1 должен сходиться; функции кt должны иметь...