700

Общая характеристика WWW

Реферат

Информатика, кибернетика и программирование

История возникновения WWW, понятие гипертекста. Интерфейс Web-приложений при работе в сети Internet. Гипертекстовая информационная система World Wide Web. Базы данных Gopher и поисковая система Veronica.

Русский

2013-01-06

124.5 KB

40 чел.

Министерство Высшего образования РФ

“Брянский государственный технический университет”

Кафедра “Экономика организации, производства и управление”

Реферат

по дисциплине: Сетевые информационные технологии

Тема: “ Общая характеристика WWW

зачетная книжка № 10.1546

Студент                                                                                                   Родионова Д.Г.

Группа                                                                                                            З-10 ПИЭ

Преподаватель                                                                                        Демиденко А.И.

Брянск 2012г

СОДЕРЖАНИЕ

Введение 3

1. WEB-технологии 4

1.1 История возникновения WWW 4

1.2 Понятие гипертекста 8

1.3 Архитектура построения WWW 10

2. WEB-технологии в интернете………..…………………………………..14

2.1 Типы ресурсов Internet 14

2.2 Интерфейс Web-приложений при работе в сети Internet 18

Заключение…………………….……………………………………………..22

Список используемой литературы………………………………………….23


Введение

Сеть Internet можно описать как огромную цифровую магистраль - систему, связывающую миллионы компьютеров, подключенных к тысячам сетей по всему миру. Ее яркое прошлое уходит своими корнями в эпоху холодной войны, конец 60-х начало 70-х годов. Первоначально данные разработки финансировались правительством США, и сеть, ставшая предшественницей Internet, была специально спроектирована таким образом, чтобы обеспечить коммуникации между правительственными узлами в том случае, если часть ее выйдет из строя в результате ядерной атаки. Применяемый в ней протокол TCP/IP (Transmission Control Protocol/Internetwork Protocol - протокол управления передачей/межсетевой протокол) разработан с учетом того, чтобы компьютеры всех видов могли совместно использовать сетевые средства и непосредственно взаимодействовать друг с другом как одна эффективно интегрированная компьютерная сеть.

Сегодня Internet сильно разрослась и связывает уже десятки миллионов пользователей компьютеров во всем мире.

Идея создания универсальной базы данных прорабатывалась в течение длительного периода. Многие рассматривают Internet и Всемирную паутину (WorldWideWeb, WWW) как экспериментальный образец такой базы данных. Технология, разработанная для WWW, воплощает идею глобальной информационной базы данных, реализованную в пределах современных возможностей.

Как правило, эти сведения воспринимаются скорее как признак эрудиции, чем как практически полезная вещь. Действительно, информационный объем Web-пространства удовлетворяет многих пользователей. Однако, как только поиск ставится на профессиональную основу и заставляет нести ответственность за выполненную работу контроль за полнотой охвата ресурсов выдвигается на передний план.

  1.  WEB-технологии

  1.  История возникновения WWW

В 1960-е годы фирма RAND Corporation впервые предложила создать децентрализованную компьютерную сеть, покрывающую всю страну. Проект включал в себя объединение компьютеров военных, научных и образовательных учреждений в сеть, которая могла бы сохранить работоспособность в условиях ядерной атаки. Основной идей проекта была децентрализация управления и подчинения, чтобы выход из строя одного или нескольких сегментов сети не привел бы к коллапсу. Сеть должна состоять из отдельных сегментов и не быть централизованной, а любое сообщение должно разделяться на пакеты и передаваться по разным ветвям сети, собираясь в единое целое на системе-получателе. Первый вариант предложения увидел свет в 1964 году благодаря усилиям Пола Бэрана (Paul Baran).

В конце 1960-х годов корпорация RAND, Массачусетский технологический институт и Калифорнийский университет Лос-Анджелеса начали экспериментировать с концепцией децентрализованной сети. В 1968 году подразделение Пентагона ARPA (Advanced Research Projects Agency, Агентство по работе с исследовательскими проектами в области перспективных исследований) открыло финансирование этого проекта в США.

В осени 1969 года на свет появился «младенец» — сеть ARPANET, состоящая к тому моменту из четырех узлов. Первые испытания ARPANET оказались крайне успешными. Ученые исследовательских учреждений, послуживших испытательными полигонами, получили возможность передавать данные и совместно пользоваться удаленным доступом к компьютерам.

К 1971 году ARPANET разрослась до 15 узлов. К 1972 году она насчитывала уже 37 узлов, а в 1973 к сети впервые были подключены зарубежные узлы.

В конце 1974 года была документирована первая весия протокола TCP. В 1978 году протокол TCP был разделен на 2 подуровня – TCP и IP. Первое время ученые действительно использовали сеть только для координации своих исследований и обмена сообщениями со своими коллегами. Однако весьма быстро сеть превратилась в высокоскоростную компьютеризированную «веревочку», которую многие стали использовать для передачи личных сообщений, сплетен и просто разговоров.

Децентрализованная структура ARPANET, существенно отличающаяся от структур существовавших в то время корпоративных сетей, позволяла подключать к сети компьютеры практически любого типа.

К 1983 году ARPANET получила общепринятое имя Internet. Хотя в 1991 году сеть ARPANET прекратила свое существование, название Internet осталось, т.к. Сеть стала объединять в себе уже международные сети.

1980-е годы стали периодом бурного роста Internet.

Схема соединения компьютеров в децентрализованную сеть распространялась по миру, и организаторы многих зарубежных сетей пожелали подключиться к американской сети.

В конце 1980-х годов наиболее влиятельные учреждения США на средства, выделенные NSF (National Science Foundation, Государственный фонд научных исследований — аналог нашего Министерства Науки), основали NSFNET — пять суперкомпьютерных центров в Принстоне, Питтсбурге, Калифорнийском университете Санта-Барбары и университете Корнели. Сеть из этих пяти центров обычно называется «магистральным хребтом Internet США» (Internet Backbone). Почему только пять? Потому что данные центры очень дороги даже для богатой Америки. Именно поэтому вычислительные мощности данных центров следовало использовать кооперативно — они были доступны для любых научных учреждений США.

Сеть подверглась крупной модернизации в 1988 году. Этот процесс остался незаметным для пользователей — Internet не утратил своей работоспособности. К слову, процесс совершенствования Сети идет непрерывно. Вся деятельность Internet-сообщества того времени приводила к постоянному росту числа пользователей Глобальной сети. Это, в свою очередь, приводило к возникновению и решению проблем, связанных с постоянным развитием и экспансией Internet, развитию технологий и систем безопасности.

В 1987 году число компьютеров, подключенных к Internet, составило более 10 000. К 1989 году это число достигло 100 000.

В ноябре 1990 года Тим Бернерс-Ли (Tim Berners-Lee) из CERN (Европейского центра ядерных исследований, также известного как Европейский центр физики частиц) создал первый прототип WWW-сервера. Всемирная паутина как активно функционирующая система не выходила в свет вплоть до 1992 года.

1990 первый браузер для платформы NeXT (APPLE) Первый браузер был создан отцом World Wide Web Тимом Бернерсом-Ли в 1990 г. Первая его демонстрация состоялась в Европейском центре ядерных исследований (CERN) в 1991 г. Браузер, называвшийся просто WorldWideWeb, был создан на платформе NeXT. Затем этот браузер был переписан на языке C и получил название libwww.

1992 год примечателен тем, что в этом году число компьютеров, подключенных к Internet, перевалило за миллион. Однако, без сомнения, наиболее серьезным развитием Сети в 1990-х годах (а, по мнению многих, и вовсе критическим в смысле самого существования Сети) стало создание WWW (World Wide Web, Всемирная паутина). В основу всей системы легло понятие гипертекста – т.е. множество отдельных текстов, имеющих ссылки друг на друга. Для работы с этими текстами был создан протокол HTTP. Для создания текстов был использован язык разметки HTML, который базировался на языке разметки SGML (Standard Generalized Markup Language), придуманном в 1965 году Ted Nelson

В 1992 году был создан браузер CELLO для IBM PC, его создателем был Том Брюс

К октябрю 1993 года порядка двухсот WWW-серверов было запущено в эксплуатацию.

1994 год – создание организации W3C (World Wide Web Consortium)разработка стандартов для развития www. Данная организация осуществляет координацию разработки Internet-стандартов, обеспечивающих более быстрое и эффективное развитие сети Internet.

В последующие годы развитие Internet и WWW происходило еще более быстрыми темпами. Реальную статистику числа компьютеров в Сети и WWW-серверов получить весьма трудно, т. к. эти данные изменяются практически ежедневно. Разумной оценкой числа компьютеров на июнь 1995 года можно считать число 6,5 миллионов.

Между тем Дэйв Рэггетт, специалист W3C, трудился над третьей версией HTML 3.0 (известной также как HTML+). Эта спецификация из-за конкуренции между производителями Web-приложений, оказывавших давление на W3C, так и не была закончена, а консорциум сосредоточил усилия не на технологической, а на политической стороне вопроса, стараясь примирить враждовавших разработчиков браузеров. В результате была достигнута договоренность о выпуске в январе 1997-го стандарта HTML 3.2, объединившего наборы тегов, поддерживаемые и Netscape Navigator, и Internet Explorer. На скорейшем выходе HTML 3.2 настаивали также IBM, Novell и Sun.

Не выдержав давления софтверной империи Билла Гейтса, Netscape стала допускать новые ошибки. Все еще веря в собственное влияние на рынок, она не отнеслась с должным вниманием к новой технологии Cascading Style Sheets (CSS, аналог таблиц стилей DSSSL, только для HTML), реализовав ее поддержку в виде не очень удобной технологии JASS (JavaScript Accessible Style Sheets), требовавшей знания программирования. Microsoft же наоборот выделила возможность создания сценариев в HTML-документах, предложив пользователям сразу два скрипт-языка – JScript и VBScript. Эта корпорация также начала финансировать подразделение W3C, ответственное за разработку новых рекомендаций HTML, фактически взяв под свой контроль процесс стандартизации браузеров.

CSS мгновенно завоевала популярность. Она позволила разделять логическую структуру HTML-документов и способы их форматирования и отображения на экране. При этом технология CSS оказалась весьма гибкой и дала возможность создавать вложенные (каскадные) стили с иерархической системой подчинения и наследования возможностей. Симпатии пользователей окончательно переместились к браузеру Internet Explorer. А компания Netscape была куплена сетевым гигантом America Online за 8,98 млрд. долл.

Продолжалась подготовка нового стандарта HTML 4.0. Его рабочая версия стала доступной 8 июня 1997 г., а в декабре появилась и официальная рекомендация W3C. Война браузеров и наборов тегов закончилась, поэтому HTML 4.0 оказался на удивление стабильным. Он действует до сего дня, вышла только одна небольшая промежуточная версия 4.01 с исправленными ошибками спецификации. Интересно, что HTML 4 был снова признан W3C языком логической разметки, хотя всего три года назад казалось, что главное назначение этого языка – форматирование документов. Но теперь существовала технология CSS, по поводу которой W3C высказалась однозначно: все, что связано с визуальными аспектами отображения HTML-документа, разработчики должны выносить в CSS-таблицы.

1.2 Понятие гипертекста

В предыдущем разделе речь шла об истории и основных вехах развития World Wide Web. В последнее время часто приходится слышать, что WWW - это очень просто. Однако за этой кажущейся простотой скрывается хорошо продуманная сложная система. При этом следует заметить, что система бурно развивается.

В 1989 году, когда Т. Бернерс-Ли предложил свою систему, в мире информационных технологий наблюдался повышенный интерес к новому и модному в то время направлению - гипертекстовым системам. Сама идея, но не термин, была введена В.Бушем (Vannevar Bush) в 1945 году в предложениях по созданию электромеханической информационной системы Memex. Несмотря на то, что Буш был советником по науке президента Рузвельта, идея не была реализована. В 1965 году Т.Нельсон (Ted Nelson) ввел в обращение сам термин "гипертекст", развил и даже реализовал некоторые идеи, связанные с работой с "нелинейными" текстами. В 1968 году изобретатель манипулятора "мышь" Д. Енжильбард (Doug Engelbart) продемонстрировал работу с системой, имеющей типичный гипертекстовый интерфейс, и, что интересно, проведена эта демонстрация была с использованием системы телекоммуникаций. Однако внятно описать свою систему он не смог. В 1975 году идея гипертекста нашла воплощение в информационной системе внутреннего распорядка атомного авианосца "Карл Винстон", которая получила название ZOG. В коммерческом варианте система известна как KMS. Работы в этом направлении продолжались и, время от времени, появлялись реализации типа HyperCard фирмы Apple или HyperNode фирмы Xerox. В 1987 была проведена первая специализированная конференция Hypertext'87, материалам которой был посвящен специальный выпуск журнала "Communication ACM".

Идея гипертекстовой информационной системы состоит в том, что пользователь имеет возможность просматривать документы (страницы текста) в том порядке, в котором ему это больше нравится, а не последовательно, как это принято при чтении книг. Поэтому Т.Нельсон и определил гипертекст как нелинейный текст. Достигается это путем создания специального механизма связи различных страниц текста при помощи гипертекстовых ссылок, т.е. у обычного текста есть ссылки типа "следующий-предыдущий", а у гипертекста можно построить еще сколь угодно много других ссылок. Любимыми примерами специалистов по гипертексту являются энциклопедии, Библия, системы типа "help".

Простой, на первый взгляд, механизм построения ссылок оказывается довольно сложной задачей, т.к. можно построить статические ссылки, динамические ссылки, ассоциированные с документом в целом или только с отдельными его частями, т.е. контекстные ссылки. дальнейшее развитие этого подхода приводит к расширению понятия гипертекста за счет других информационных ресурсов, включая графику, аудио- и видео-информацию, до понятия гипермедиа.


1.3 Архитектура построения WWW

От описания основных компонентов перейдем к архитектуре взаимодействия программного обеспечения в системе World Wide Web. WWW построена по хорошо известной схеме "клиент-сервер". На рисунке ниже показано, как разделены функции в этой схеме.

Программа-клиент выполняет функции интерфейса пользователя и обеспечивает доступ практически ко всем информационным ресурсам Internet. В этом смысле она выходит за обычные рамки работы клиента только с сервером определенного протокола, как это происходит в telnet, например. Отчасти, довольно широко распространенное мнение, что Mosaic или Netscape, которые, безусловно, являются WWW-клиентами, это просто графический интерфейс в Internet, является верным. Однако, как уже было отмечено, базовые компоненты WWW-технологии (HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и поэтому мультипротокольные клиенты должны быть отнесены именно к World Wide Web, а не к другим информационным технологиям Internet. Фактически, клиент - это интерпретатор HTML. И как типичный интерпретатор, клиент в зависимости от команд (разметки) выполняет различные функции. В круг этих функций входит не только размещение текста на экране, но и обмен информацией с сервером по мере анализа полученного HTML-текста, что наиболее наглядно происходит при отображении встроенных в тексте графических образов. При анализе URL-спецификации или по командам сервера клиент запускает дополнительные внешние программы для работы с документами в форматах, отличных от HTML, например GIF, JPEG, MPEG, Postscript и т.п. Вообще говоря, для запуска клиентом программ независимо от типа документа была разработана программа Luncher, но в последнее время гораздо большее распространение получил механизм согласования запускаемых программ через MIME-типы.

Другую часть программного комплекса WWW составляет сервер протокола HTTP, базы данных документов в формате HTML, управляемые сервером, и программное обеспечение, разработанное в стандарте спецификации CGI.

До самого последнего времени (до образования Netscape) реально использовалось два HTTP-сервера: сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов расширилось. Появился очень неплохой сервер для MS-Windows и Apachie-сервер для Unix- платформ.

Существуют и другие, но два последних можно выделить из соображений доступности использования. Сервер для Windows - это shareware, но без встроенного самоликвидатора, как в Netscape. Учитывая распространенность персоналок в нашей стране, такое программное обеспечение дает возможность попробовать, что такое WWW. Второй сервер - это ответ на угрозу коммерциализации. Netscape уже не распространяет свой сервер Netsite свободно и прошел слух, что NCSA-сервер также будет распространяться на коммерческой основе. В результате был разработан Apachie, который, по словам его авторов, будет freeware, и реализует новые дополнения к протоколу HTTP, связанные с защитой от несанкционированного доступа, которые предложены группой по разработке этого протокола и реализуются практически во всех коммерческих серверах.

База данных HTML-документов - это часть файловой системы, которая содержит текстовые файлы в формате HTML и связанные с ними графику и другие ресурсы. Особое внимание хотелось бы обратить на документы, содержащие элементы экранных форм. Эти документы реально обеспечивают доступ к внешнему программному обеспечению.

Прикладное программное обеспечение, работающее с сервером, можно разделить на программы-шлюзы и прочие. Шлюзы - это программы, обеспечивающие взаимодействие сервера с серверами других протоколов, например FTP, или с распределенными на сети серверами Oracle. Прочие программы - это программы, принимающие данные от сервера и выполняющие какие-либо действия: получение текущей даты, реализацию графических ссылок, доступ к локальным базам данных или просто расчеты.

Все, что было сказано до этого момента, можно отнести к классической схеме World Wide Web. В настоящее время следует говорить об изменении общей архитектуры.

Как видно на рисунке ниже к середине 1996 года произошли некоторые изменения в архитектуре сервиса World Wide Web.

Произошел возврат к модульной структуре сервера World Wide Web. Этот возврат был реализован в виде спецификации API. API - это спецификация разработки прикладных модулей, которые встраиваются в сервер, точнее редактируются совместно с модулями сервера. Применение во всех серверах многопотоковой технологии выполнения подзадач делает такой способ расширения возможностей сервера более экономичным с точки зрения ресурсов вычислительной установки, чем разработка CGI-скриптов.

В дополнение к HTML активно стал применяться еще один язык разметки - VRML (Virtual Reality Modeling Language). В данном случае речь идет об описании трехмерных сцен и возможности "бродить" по этим мирам. При этом в VRML также, как и в HTML предусмотрены гипертекстовые ссылки, что позволяет создавать смешанные базы данных, где информационный архив, например, можно представить в виде книг в библиотеке, среди которых может путешествовать автор, выбирая нужную ему тематику и источник, которые затем представляются в формате документа HTML.

Java-апплеты - это мобильные коды Java, ссылки на которые вмонтированы в тело документа. При доступе к такому документу программа просмотра пользователя предварительно анализирует документ на предмет наличия в нем такого типа ссылок, и, если они существуют, то подкачивает мобильные коды в свою память. Коды могут сразу выполняться по мере размещения их на компьютере пользователя, но могут активироваться и при помощи специальных команд.

Как видно из рисунка, изменения коснулись и клиентской части технологии. В настоящее время происходит постепенный переход от простой классической архитектуры клиент-сервер к архитектуре с сервером приложений, в роли которого выступает программа-клиент. В частности, NCSA опубликовала спецификацию CCI (Common Client Interface) для разработки приложений для работы с сервисами World Wide Web через программу Mosaic.


2. WEB-технологии в интернете

2.1 Типы ресурсов Internet

Сегодня информация в Интернете оказывается доступной из источников разного типа. Планировать поиск без полного представления об их спектре и особенностях функционирования невозможно. Перечень основных типов ресурсов, который можно использовать как карту при планировании поисковой процедуры. Фактически вопрос ставится более широко - об основных способах представления, передачи и обработки информации в Сети.

Электронная почта и почтовые роботы. Адрес электронной почты отдельного лица или организации традиционно используются для идентификации владельца. В коммуникационных ресурсах Сети - онлайновых средствах коммуникации пользователей и системе телеконференций нередко он оказывается необходимым атрибутом каждого участника. Специальная URL-схема mailto позволяет вставлять в Web-страницу гиперссылку на e-mail, автоматически открывающую почтового клиента. В этом виде она широко применяется в WWW. Сами адреса при этом свободно индексируются поисковыми системами и доступны для поиска через поисковые машины общего назначения. AltaVista, например, показывает, что адреса электронной почты встречаются почти на 100 миллионах Web-страниц из 150 миллионов заиндексированных ей документов.

Адреса e-mail активно накапливаются и в специальных системах поиска людей и организаций, о которых пойдет речь ниже. Серьезное неудобство для поиска по e-mail составляет то, что при получении адреса допускается регистрации пользователя под псевдонимом. Эта практика особенно широко распространена на серверах, предоставляющих бесплатные почтовые ящики.

Почтовые роботы - это специальные программы, способные отвечать определенными действиями на команды, поступающие им по электронной почте. Их основное назначение - пересылка данных по запросу в случае, когда те не доступны иным способом, а также как альтернатива работы в режиме on-line с каким-либо из известных ресурсов, например, FTP-архивами. Адрес почтового робота имеет обычный формат, например, mailserv@turbo.nsk.su (файловый сервер Новосибирского узла TURBO). Справка о перечне допустимых команд обычно высылается роботами на адрес пользователя в ответ на сообщение с пустым полем subject и единственным словом help, набранном в теле сообщения с первой позиции. При поиске почтовые роботы обычно используются лишь как посредники при получении информации. Иногда приходится сталкиваться с тем, что они оказываются единственным средством получения нужных сведений.

Глобальная система телеконференций Usenet, региональные и специализированные телеконференции. Система построена по принципу электронных досок объявлений, когда пользователь может разместить свою информацию в одной из тематических групп новостей. Затем эта информация передается пользователям, которые подписаны на данную группу. Полное число групп новостей Usenet превышает 20 тысяч и сведения о них можно найти, например, на Yahoo. Все они одновременно не поддерживаются ни одним сервером, так что труднее бывает отыскать не название соответствующей группы, а сервер телеконференций, с которого ее можно загрузить. Usenet - ключевое слово именно для глобальной системы телеконференций. Региональные и специализированные системы также имеют распространение. Ресурс наиболее значим для быстрого накопления информации по узкому вопросу, а при поиске - чаще для получения частной, неофициальной информации. Списки рассылки подразумевают более или менее систематическую рассылку сообщений информации по электронной почте. Если пользователь сам может поместить информацию в список рассылки, то это начинает напоминать систему телеконференции, однако не требует специального клиента. Небольших по охвату адресов узкоспециальных или рекламных списков рассылки в Сети насчитывается огромное количество. Здесь стоит обратить внимание на те, авторитет которых получил международное признание. Если не говорить о каких-то специальных интересах, то они необходимы поисковику, главным образом, для того, чтобы быть в курсе последних событий, происходящих в жизни Интернета. Владение сетевой лексикой по широкому спектру тем и осведомленность о крупнейших проектах, реализуемых в Сети, которые можно почерпнуть из списков рассылки, позволяют более результативно строить поисковые запросы.

Онлайновые средства коммуникации пользователей (chat, ICQ и другие) предполагают возможность обмена информацией между двумя или большим количеством пользователей Сети в режиме реального времени через посредство специального чат-сервера. Частью такого обмена может становиться текстовый диалог, передача графики прямо в процессе ее создания, голосовая и видео связь, обмен файлами. Долгое время ресурсы этого типа крайне редко использовались в решении поисковых задач, однако ситуацию изменило появление в 1996 году нового сервиса этого типа, а именно службы ICQ, известной среди российских пользователей как "Аська" (http://www.icq.com).

В отличие от существовавших ранее чатов, где регистрация участников, как правило, носила анонимный характер и действовала лишь на протяжении сеанса связи, разработчики ICQ предложили каждому пользователю регистрационный номер-идентификатор, который сохранялся бы за ним постоянно. Это решение имело грандиозные последствия в области компьютерного общения людей. Уникальный ICQ номер грозит появиться на визитных карточках рядом с телефоном, адресом электронной почты и домашней страницей. При поиске людей и организаций можно с успехом использовать поисковую службу ICQ, которая становится доступной сразу после установки ICQ-клиента на компьютер.

В регистрационных списках чатов обычно присутствуют сведения о месте проживания участников, и они редко указываются неверно.

Системы поиска людей и организаций в современной Сети характеризуются двумя важными моментами: большинство этих ресурсов уже перенесено на Web-сервера и все более широкое присутствие получает в них информация о людях и организациях, которые не имеют прямого или вообще никакого отношения к Интернету. С последним утверждением связаны известные факты появления в Сети телефонных, адресных и других баз данных, как отдельных организаций, так и целых регионов. Тем не менее, такой чисто сетевой идентификатор пользователя как адрес e-mail остается доминирующим поисковым атрибутом для многих сервисов этого типа. Источником пополнения их баз данных становятся материалы телеконференций, Web-сервера, а также самостоятельная регистрация пользователей.

Наряду c переориентированием сервисов под WWW в Сети продолжает работать одна из самых старых поисковых служб подобного типа - Whois, доступная по протоколу telnet с сервера whois.internic.net после входа по login: whois.

Базы данных Hytelnet, с доступные по протоколу telnet в ряде случаев представляют собой совершенно уникальную информацию, прежде всего по библиотечным каталогам европейских и американских университетов, а также государственных учреждений. Наиболее внушительный перечень баз данных этого типа, превышающий 1600 единиц можно найти на Web-сервере по адресу http://www.lights.com/hytelnet/. Каждая из них обладает оригинальной системой навигации и поиска, реализуемой через команды, которые вводятся с клавиатуры в алфавитно-цифровом режиме.

Система файловых архивов FTP, системы поиска в FTP-архивах глобального и регионального охвата. Ресурсы этого типа не отступили так безоговорочно под натиском Web-технологий, как большинство остальных. Одна из причин в огромном количестве информации, накопленной в FTP-архивах за десятилетия эксплуатации компьютерных систем, которая по-прежнему ценна для специалистов. Социального заказа на ее перенос в Web-пространство в полном объеме не существует. Другая причина кроется в простоте доступа, навигации и передачи файлов по FTP. Так или иначе, сегодня FTP-ресурсы востребованы и даже характеризуются развитием не только своей единственной глобальной поисковой системы Archie (адрес одного из стабильно доступных Web-шлюзов к ней - http://ftpsearch.ntnu.no), но и региональных систем, в частности российской - http://ftpsearch.city.ru , охватывающей более 2000 серверов.

FTP-архивы - это в первую очередь источники программного обеспечения, успешно конкурирующие с Web-узлами, которые специализируются на продаже и представлении коллекций программ. В отличие от Web-узлов на них гораздо чаще можно столкнуться с нарушением авторских прав в виде пиратских копий программ и отдельных материалов, продаваемых на других узлах за деньги. Как следствие теневых сторон FTP-сервиса - опасность заражения вирусом из непроверенного источника. Поиски, какой же информации стоит начинать с поисковой системы FTP? Универсальный ответ прост: поскольку ключевым словом при оформлении запроса является текст, входящий в название файла или каталога на FTP-сервере, то наибольшего успеха можно добиться в поиске информации, которая, будучи оформлена в виде файла, либо уже имеет определенное кем-либо имя, либо существует реальная возможность его угадать. Известных автору случаев делового применения FTP-поиска немало. Один из них следующий. Поисковик, разыскивающий один из американских стандартов ASTM по материаловедению с помощью поисковой системы HotBot быстро локализовал головной Web-сервер. Там ему удалось выяснить точное название стандарта. Полное описание стандарта предоставлялось за плату, а краткая аннотация - бесплатно. По техническим причинам аннотация на сервере была не доступна. Человек принял решение исследовать FTP-архивы с помощью поисковой системы и использовать алфавитно-цифровую последовательность, кодирующую название материала. Вскоре была найдена версия стандарта, близкая к полной, что исчерпало проблему. Достоверность информации вызывала у поисковика некоторые сомнения, однако была легко установлена специалистами.

Базы данных Gopher и поисковая система Veronica, сканирующая ресурсы Gopher-пространства на текущий момент перестали играть сколько-нибудь существенную роль в информационном поле Интернета. Тем не менее, мать Гоферов всего мира - сервер, на котором зарегистрировано большинство gopher-серверов Сети (gopher://gopher2.tc.umn.edu), остается в рабочем состоянии и по сей день. Выйти на тот или иной gopher-сервер случается и через коллекции ссылок на Web-страницах, и через "бумажные" Желтые страницы. Как правило, если gopher-сервер еще работает, то в одном из файлов на нем указан адрес Web-узла, на который перенесена информация.

2.2 Интерфейс Web-приложений при работе в сети Internet

Гипертекстовая информационная система World Wide Web (WWW) и ее технологии на сегодняшний день наиболее значительны в Сети и продолжают свой подъем. По своей навигационной картине WWW фактически скопировала Gopher-ресурсы, но следствия одной мелкой детали, мало кто мог предугадать. Эта деталь - использование Web-страницы как легко создаваемого составного объекта, в тело которого монтируется более простые объекты, предназначенные для одновременного отображения. То, что сегодня в списке последних присутствуют текст, гиперссылки, графика, мультимедиа, программный код, диалоговые формы и многое другое в конечном итоге и предопределило широкое коммерческое использование WWW. Паутина заставила поисковые системы Web-пространства тонко подстроиться под себя и фактически обозначила ключевую тенденцию их развития. Речь идет с одной стороны о том, что при индексировании ресурсов все более детальной проработке поисковыми системами подвергаются поля Web-страниц, формируемые контейнерами языка HTML. С другой стороны интенсивно развиваются те элементы информационно-поисковых языков, которые поддерживают поиск внутри этих полей. Сегодня можно констатировать глубокую интеграцию поисковых систем и ресурсов WWW на базе единой технологии. Помимо этого чудовищный объем информационной базы WWW впервые с особой остротой поставил вопрос о необходимости параллельного существования целого ряда идентичных поисковых сервисов, обслуживающих интересы пользователей.

Каталоги ресурсов - глобальные, локальные, специализированные (в среде WWW); представляют собой размещаемые в Сети базы данных с адресами ресурсов и самым разным масштабом накопленной информации и охватом тематики. Обычно они имеют иерархическую структуру, перемещаясь по которой, можно локализовать нужный объект. Скорость накопления информации такими системами оказывается сравнительно низкой, поскольку в классификации ресурсов предполагается непосредственное участие человека. Для поисковика получение информации о ресурсе из известного каталога всегда является некоторой гарантией достоверности. При решении более или менее стандартной поисковой задачи именно каталог, а не поисковая машина оказываются стартовой площадкой для начала поиска.

Поисковые машины, или автоматические индексы - глобальные, локальные, специализированные (в среде WWW) представляют собой мощные информационно-поисковые системы, размещаемые на серверах свободного доступа. Их специальные программы-роботы, или пауки, в автоматическом режиме непрерывно сканируют информацию Сети на основе заданных алгоритмов, проводя индексацию документов. В последующем на основе созданных индексных баз данных поисковые машины предоставляют пользователю доступ к распределенной на узлах Сети информации. Это реализуется через выполнение поисковых запросов в рамках соответствующего интерфейса. Последние исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista, или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной Паутины отдельной такой системой не превышает 30%. Планирование поисковой процедуры в пространстве WWW является нетривиальным, и его, безусловно, следует рассмотреть отдельно.

Баннерные системы (в среде WWW) предполагают различные варианты размещения специальных объектов - баннеров, обычно небольших графических изображений с рекламной целью на Web-узле, принимающем рекламу. Баннеры отсылают пользователя по гиперссылке на сервер рекламодателя и зачастую могут не иметь вообще никакого отношения к основному содержимому страницы. Баннеры не используются напрямую при проведении поиска, но являются неплохими индикаторами состояния информационного рынка Сети.

Активные информационные каналы (в среде WWW) представляют собой специализированные Web-сервера, предназначенные для поступления данных прямо на рабочее место пользователя. Ресурсы этого типа принято связывать с push-технологией (технология проталкивания информации). Фактически активный Web-канал является информационным источником периодически обновляемых данных. Можно как подписаться на канал, так и остановить подписку, что многим напоминает работу со списками рассылки. Методика поддержки каналов основными на сегодняшний день браузерами Netscape Communicator и Internet Explorer оказывается различной. С информацией каналов после ее обновления можно позднее ознакомиться в автономном режиме. Сама технология не получила ожидаемого широкого распространения и в контексте проблемы поиска не играет заметной роли.

Страницы World Wide Web по функциональному назначению можно разделить на несколько типов: информационные страницы, навигационные страницы, страницы обмена данными. Во многих случаях эти функции можно объединить в одной странице.

Информационные страницы – это последовательное изложение информации с возможностью гипертекстовых контекстных переходов. Пользователь просматривает их последовательно. Гипертекстовые ссылки обычно применяют для создания сносок, примечаний или отсылок к спискам литературы и других ассоциативных материалов. Типичными примерами таких страниц являются подсказки, руководства, описание компаний, исторические справки и т.п.

Навигационные страницы – это совокупность гипертекстовых ссылок, которые позволяют ориентироваться в материалах Web-узла. Типичный пример такой страницы – Home page. Как правило, на ней нет пространных текстовых описаний и иллюстраций, она состоит из совокупности различных меню. Эти меню можно реализовать через списки, таблицы ссылок или imagemap.

Страницы обмена данными позволяют передать на сервер некоторый объем информации, отличные от стандартного адреса (URL) ресурса. При просмотре и навигации пользователь просто выбирает гипертекстовые ссылки, по которым загружаются новые страницы. При обмене данными на сервер передается не только адрес ресурса, но и дополнительная информация, которую вводит пользователь.

В зависимости от функционального назначения страниц изменяется вид интерфейса ресурса, с которым пользователь имеет дело. В первых двух случаях достаточно манипулятором “мышь” выбрать гипертекстовую ссылку, как тут же загрузится новая страница. В случае страниц обмена данными следует заполнить поля HTML – форм и отправить данные на сервер.При  этом  формы обеспечивают практически все необходимые виды полей ввода и меню. Единственное, чего не позволяют реализовать HTML – формы, так это вложенные в меню. Формы можно применять не только при обмене данными. Достаточно развитые механизмы обработки форм присутствуют в JavaScript.

 


Заключение

 Трудно себе представить человека XXI века без Internet, с его появлением есть возможность быстро и удобно найти необходимую информацию. Теперь можно не заниматься подбором и изучением огромного количества литературы в книжных магазинах и библиотеках. Нужную для себя информацию можно получить, не выходя из дома или офиса.

 Благодаря разнообразию поисковых систем, специально разработанных для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.


Список используемой литературы

  1.  http://www.nчtc.ee/e-oppe/Ija/b_4_5/__www.html
  2.  http://www.wч3.org/


 

А также другие работы, которые могут Вас заинтересовать

23760. Признак делимости на 3 и на 9 48 KB
  Основные цели:– тренировать способность к доказательству общих утверждений на примере признаков делимости на 3 и на 9; повторить и закрепить изученные свойства и признаки делимости решение текстовых задач решение примеров на порядок действий построение формул зависимости между величинами. – Какие признаки делимости мы изучили Признаки делимости на 2 на 5 на 10 на 4 на 8 на 25. – А зачем нам нужны признаки делимости Что бы быстрее определять делится ли число на данное или нет.
23761. Признак делимости на 3 и на 9 57.5 KB
  – А зачем нам нужны признаки делимости Что бы быстрее определять делится ли число на данное или нет. Затруднения могут быть при выполнении задания тех случаях где множитель не делится ни на 3 ни на 9 или делится только на 3. 54 делится на 3 и третье т. 15 делится на 3.
23762. Признак делимости на 9 43 KB
  – А зачем нам нужны признаки делимости – Что бы быстрее определять делится ли число на данное или нет. Будет ли число представленное выражением d 235 делиться на5 – Всё зависит от того какое значение принимает d потому что если каждое слагаемое делится на 5 то и вся сумма разделится на 5 ели одно слагаемое делится на 5 а другое не делится на 5 то вся сумма не разделится на 5. 2 Будет ли число представленное выражением 271k делится на 2 –Всё зависит какое значение принимает k т. по свойству делимости произведения...
23763. Признаки делимости на 10, на 2, на 5 87.5 KB
  1 Выберите из множества A = числа кратные: а 2 б 5 в 10 г и 2 и 5 и 10. Кратные 2: 110; 300; 404; 706 т. П1 Кратные 5: 110; 215; 300 т. На доске: П2 Кратные 10: 110; 300 т.
23764. Признаки делимости на 10, на 5, на 2 42 KB
  – Выясните делится ли: 1 на 10; – Делится на 10 т. 10 делится на 10 а произведение делится на число если один из множителей делится на число. 2 100a 10b на 5; – Делится на 5 т. 100 делится на 5 а значит 100a делится на 5 10 делится на 5 а значит 10b делится на 5 следовательно вся сумма делится на 5 по свойству делимости суммы на число.
23765. Отрицание общих высказываний 39 KB
  – Что вы ещё знаете о высказываниях Высказывания бывают разного вида. – Какие бывают высказывания Высказывания бывают общие высказывания о существовании и высказывания не относящиеся ни к одному ни к другому виду. Индивидуальное задание: – Постройте отрицание следующего высказывания: Сумма простого числа и составного является составным числом. то его можно отнести к высказываниям о существовании.
23766. Отрицание общих высказываний 38.5 KB
  Основные цели: –тренировать способность к построению отрицания общих высказываний; повторить и закрепить приёмы устных и письменных вычислений с десятичными дробями приближения чисел с точностью до данного разряда с недостатком и избытком признаки делимости. – Здравствуйте ребята Какую тему мы начали изучать Отрицание общих высказываний. – Сегодня мы продолжим работать с отрицанием высказываний.