4937

Поиск информации в World Wide Web

Реферат

Информатика, кибернетика и программирование

Поиск информации в World Wide Web Основные понятия всемирной паутины К основным видам сервиса Интернет относят WWW, электронную почту, группы новостей, чат, FTP, Gopher, Wais, Telnet,IP-телефония и др. Рассмотрим  подробнее  наиболее популярны...

Русский

2012-11-29

255 KB

16 чел.

Поиск информации в World Wide Web

Основные понятия всемирной паутины

К основным видам сервиса Интернет относят WWW, электронную почту, группы новостей, чат, FTP, Gopher, Wais, Telnet, IP-телефония и др. Рассмотрим  подробнее  наиболее популярные виды сервиса WWW и электронная почта.

WWW (World Wide Web, Web) – всемирная паутина – одна из последних по времени появления (первые программы, демонстрирующие работу системы, были закончены в 1992 году) среди услуг Интернет, но наиболее динамично и быстро развивающаяся. Технология WWW была разработана в Женеве в лаборатории физики элементарных частиц Европейского центра ядерных исследований (CERN) и первоначально предназначалась для создания единой сети, которая позволила бы ученым, занимающимся физикой высоких энергий, обмениваться результатами исследований. В марте 1989 сотрудник лаборатории Тим Бернерс-Ли предложил использовать для этой цели систему гипертекста. Успех World Wide Web был предопределен простотой в использовании и универсальностью, хотя еще не было возможности использовать мультимедиа-технологии, не рассматривалась возможность передачи изображений. До появления World Wide Web сеть Интернет была доступна только квалифицированным пользователям, система же WWW дала возможность реализовывать все возможности этой сети людям, не имевшим большого компьютерного опыта.

Гипертекст – документ или множество документов, непременной составной частью которых являются гиперссылки.

Гиперссылка – это текст, выделенный цветом или подчеркиванием, графическое изображение или кнопка, заключенные в подсвеченную рамку, при выборе которого осуществляется переход к другому документу или к определенному месту в данном документе. Если подвести указатель мыши к гипертекстовой ссылке, он примет вид «указывающей руки». Щелчок по гипертекстовой ссылке позволяет открывать другие Web-страницы или перемещаться по уже открытому документу.

Любое слово в гипертекстовом документе может быть указателем или ссылкой (link, hyperlink) на другой документ, содержащий более подробную информацию по данной теме. Подобные документы могут быть подготовлены различными средствами, разными авторами и храниться на различных серверах (в том числе и физически удаленных друг от друга, часто находящихся в другом городе, в другой стране, на другом континенте). Для того чтобы открыть следующий документ, достаточно выбрать нужную ссылку.

Постепенно принцип гипертекста был распространен и на другие виды объектов. Появилось понятие «гипермедиа». Гипермедиа-документы имеют связи не только с иными фрагментами текста, но и с разнообразными средствами мультимедиа (звуком, изображением, видео).

Для создания и оформления гипертекстовых документов используется язык разметки гипертекста HTML (Hypertext Markup Language). Созданным  файлам присваивается расширение .html или .htm. Мультимедиа-элементы, рисунки (стандартно поддерживаются только форматы картинок .GIF и .JPEG) и другие нетекстовые компоненты не вставляются в документ непосредственно и хранятся отдельно. Вместо этого в текст вставляется ссылка, указывающая программе просмотра имя файла, содержащего необходимый объект.

Web-страница – это гипертекстовый документ в формате .html. Он может содержать текст, графические иллюстрации, мультимедийные и другие вставные объекты. Группа Web-страниц, размещенных на одном узле, связанных вместе единой темой, общим стилем оформления и взаимными гипертекстовыми ссылками называется Web-сайтом. Информация в виде гипертекстовых документов хранится на Web-серверах. Web-сервер представляет собой компьютер, на котором работает соответствующее программное обеспечение, позволяющее пользователям Интернет подсоединяться и пользоваться WWW-ресурсами этого компьютера для поиска и просмотра информации.

Адресация Web-страниц

Официально World Wide Web описывается как «огромная база гипермедиа-документов, предназначенная для того, чтобы обеспечить универсальный доступ к различной информации». World Wide Web использует протокол передачи гипертекста – HTTP (Hypertext Transfer Protocol) в качестве основного протокола работы. Для доступа к объектам (Web-страницам) протокол НТТР использует их универсальный указатель ресурса – URL (Uniform Resource Locator). В общем виде формат URL можно представить следующим образом:

метод доступа://сетевой адрес компьютера/путь/имя файла,

где параметр метод доступа к Web-ресурсу имеет значение http; параметр сетевой адрес компьютера указывает доменный или IP-адрес компьютера (например, envila.by), содержащего данный ресурс в сети Интернет; путь/имя файла – полный путь к файлу на сервере. Очень часто URL не содержит имени файла и пути, например: http://www.microsoft.com.

Использование браузера Microsoft Internet Explorer 

Как и большинство видов сервиса Интернета, WWW построен на основе модели клиент – сервер. Со стороны Интернета работу службы WWW обеспечивают серверные программные средства – Web-серверы, основной функцией которых является прием поступающих от пользователей сети запросов по прикладному протоколу http и отправке им отдельных Web-страниц или ответов сервера на запросы. Информацию запрашивают, получают и отображают Web-клиенты. В качестве клиента выступает программа, называемая Web-браузером. Браузер (Browser) – программное обеспечение, предоставляющее графический интерфейс для интерактивного поиска, обнаружения, просмотра и обработки данных в сети Интернет. Наиболее широкое распространение получили браузеры Microsoft Internet Explorer корпорации Microsoft и Netscape Navigator корпорации Netscape. Они снабжены средствами просмотра текстовой, графической и мультимедиа информации, имеют редакторы для создания собственных гипертекстовых страниц в формате .html и их публикации на Web-серверах, предоставляют возможность доступа к электронной почте, телеконференциям и имеют ряд других средств.

К основным функциональным возможностям браузера Microsoft Internet Explorer относятся: просмотр документов, открытых одновременно в разных окнах; поддержка работы электронной почты; сохранение просматриваемого документа или его части на магнитном носителе; сохранение текста текущей страницы в текстовом формате, в формате .html; сохранение рисунков и объектов, расположенных на странице; сохранение Web-страницы целиком; остановка процесса загрузки страницы; ускорение процесса загрузки путем отключения загрузки мультимедийного содержимого; обновление (повторная загрузка) информации для текущей страницы; редактирование Web-страницы в Front Page.

Рассмотрим технологию работы с Web-браузером на примере Microsoft Internet Explorer 5.0.

1.    Для запуска Internet Explorer 5.0 выберите соответствующую пиктограмму на рабочем столе Windows или выполните команду Пуск► Программы►Internet Explorer.

Окно браузера Internet Explorer (рис. 1) обычно содержит: строку заголовка, в которой отображается название самого приложения и открытой в браузере Web-страницы; строку основного меню; панель инструментов; адресную строку, в которой указывается адрес открытой Web-страницы; значок состояния, который вращается, если происходит поступление данных с удаленного компьютера; строку состояния, в которой отображается информация о текущем состоянии программы; область просмотра Web-страниц, в которой отображается содержимое Web-страницы. При запуске Internet Explorer в области просмотра загружается страница, называемая домашней, то есть страница, с которой начинается просмотр.

 

Рис. 1. Окно браузера Internet Explorer

2.    Для получения доступа к сайту Белорусского государственного экономического университета укажите в поле Адрес URL-адрес http://www.envila.by и нажмите [Enter]. Также можно использовать команду Файл►Открыть основного меню Internet Explorer и в диалоговом окне Открытие ввести URL-адрес затем нажать [ОК].

3.    Установите текущую Web-страницу в качестве домашней. Для этого выберите команду меню Сервис►Свойства обозревателя► вкладка Общие, в группе Домашняя страница нажмите кнопку [С текущей]. Если нажать кнопку [C исходной], установится в качестве домашней страница фирмы-производителя Microsoft, при нажатии кнопки [С пустой] – пустая страница.

При необходимости остановки вывода страницы (например, если страница загружается слишком долго) используется кнопка [Остановить] панели инструментов или команда Вид►Остановить а для повторного открытия страницы (например, если связь оборвалась)по введенному адресу – кнопка [Обновить] или команда Вид►Обновить.

4.    Осуществите настройку отображения объектов, выбрав команду Сервис►Свойства обозревателя и вкладку Дополнительно. На вкладке Дополнительно, если не установлены, то установите флажки: Воспроизводить анимацию, Воспроизводить звуки, Воспроизводить видео, Отображать рисунки. Запустите Microsoft Internet Explorer и убедитесь в том, что после запуска программы на Web-странице отображаются все указанные объекты.

5.    Выберите гиперссылку Об институте, и ознакомьтесь с содержимым открытой Web-страницы.

6.    Просмотрите предыдущую Web-страницу, открытую в текущем сеансе работы, нажав кнопку панели инструментов [Назад] или выбрав команду меню Переход►Назад. Для просмотра следующих страниц (те, которые были открыты на предыдущем шаге, в нашем случае Web-страница с информацией об институте) – кнопку [Вперед] или команду меню Переход►Вперед. Для перехода к домашней странице нажмите кнопку [Домой] или выберите команду Переход►Домашняя страница.

7.    На панели инструментов нажмите кнопку [Журнал] для показа содержимого папки Журнал, которое отображается в левой части окна браузера. Папка Журнал содержит список ссылок за определенное количество дней на открытые ранее Web-страницы. Если папка содержит ссылки за достаточно большой промежуток времени, то они группируются по соответствующим неделям, дням недели и т.п. Выберите команду Сервис►Свойства обозревателя и на вкладке Общие в группе Журнал установите количество дней хранения ссылок равное 10 и нажмите кнопку [ОК]. (Если нажать кнопку [Очистить], то все предыдущие записи из журнала при подтверждении удаления будут удалены). Выберите Web-страницу с перечнем факультетов и откройте ее щелчком мыши по найденной ссылке. Повторно нажмите кнопку [Журнал], чтобы закрыть эту папку.

8.    Откройте домашнюю Web-страницу (см. п. 6). Для добавления ссылки на домашнюю Web-страницу в папку Избранное выберите команду основного меню Избранное►Добавить в избранное и в появившемся диалоговом окне нажмите кнопку [ОК]. Содержимое папки Избранное формирует сам пользователь, занося в нее необходимые ссылки на Web-страницы. Выберите следующую Web-страницу, нажав гиперссылку Специальности и занесите ссылку на нее в папку Избранное.

9.    Просмотрите содержимое папки Избранное, нажав кнопку [Избранное] панели инструментов. Содержимое папки Избранное как и папки Журнал отобразится в левой части окна браузера. В папке Избранное требуемая страница открывается щелчком мыши. Повторное нажатие кнопки [Избранное] закрывает ее. Для удаления, перемещения, переименования ссылок на Web-страницы в папке Избранное используется команда Избранное►Упорядочить избранное.

10. Сохраните в файл в своей папке на жестком диске домашнюю Web- страницу с помощью команды Файл►Сохранить как. В диалоговом окне Сохранение веб-страницы в поле Папка укажите свою папку, в поле Имя файлаЭнвила_домашняя, в поле Тип файла – одно из предлагаемых значений: Веб-страница полностью, текстовый файл .txt, Веб-страница, только HTML. Сначала сохраните файл в формате .txt, при этом сохраняется только текстовая информация. Этот же файл еще раз сохраните в формате .html. Откройте сохраненные файлы, просмотрите их и сравните их размер.

11. Сохраните рисунок на Web-странице с именем Мой_рисунок, щелкнув правой кнопкой мыши по выбранному рисунку и выбрав команду Сохранить рисунок как. Обычно Web-страницы содержат рисунки с форматом .jpeg и .gif.

Содержимое Web-страницы можно вывести на печать, применив команду Файл►Печать.

Технология поиска информации в WWW

Узнать адреса объектов Интернет можно, например, из средств печати и телевидения. Если URL-адрес ресурса, содержащий интересующую информацию, заранее не известен, используются специальные средства, называемые поисковыми системами. В табл.8.2 приведены наиболее популярные белорусские, российские, и зарубежные поисковые системы. Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность – это поисковые машины и поисковые каталоги.

Большинство поисковых машин включают как строку поиска, так и тематический каталог ресурсов, т.е. объединяют две модели поиска.

Основной принцип работы поисковой машины заключается в поиске Web-ресурсов с помощью ключевых слов.

Таблица 8.2

Поисковые системы и каталоги

URL-адрес

Название

http://www.tut.by 

Белорусская поисковая система tut.by 

http://open.by

Информационно-справочная система (каталог+машина) провайдера «Открытый контакт», почта, чат

http://www.zubr.com

Всеобщий регистр белорусских WWW-ресурсов

http://www.poisk.com/

Поиск (каталог+поиск) по белорусскому Интернету

http://www.yandex.ru

Российская поисковая система Яндекс

http://www.rambler.ru

Российская поисковая система Rambler

http://www.google.com

Англоязычная поисковая система Alta Vista
(поддерживаются запросы на русском языке)

http://www.yahoo.com

Англоязычный тематический каталог ресурсов Yahoo!

http://www.aport.ru

Российская поисковая система Апорт

При наличии первичных сведений по теме поиска, документы предпочтительнее разыскивать с помощью поисковых машин. Недостаток поиска заключается в том, что поисковая машина выдает слишком много документов, среди которых трудно найти наиболее подходящие. Можно сужать область поиска путем построения сложной фразы с использованием логических операторов для связи ключевых слов, но пока не существует единого стандарта на количество и синтаксис поддерживаемых операторов для различных поисковых систем.

Рассмотрим поиск информации на тему «Электронная Беларусь» с использованием строки запроса по ключевым словам (ключевому слову).

1.    Загрузите поисковую систему tut.by, набрав в поле Адрес браузера Internet Explorer адрес www.tut.by.

2.    Введите в строке запроса ключевые слова Электронная Беларусь (можно указывать одно или несколько ключевых слов) и нажмите кнопку поиска (это может быть кнопка или ссылка с названием Поиск, Найти, Search и т.п.). По результатам поиска на экран будет выведен список найденных ссылок на Web-страницы с фрагментом содержимого каждой.

3.    Просмотрите список найденных Web-ресурсов. Щелкните по гиперссылке первого из них. Оцените содержание найденного документа на соответствие запросу.

В поисковых каталогах вся информация разбита на множество категорий по наиболее популярным темам, таким как «спорт», «отдых», «наука» и т.д. Поиск информации с использованием поискового каталога осуществляется следующим образом:

·              выбрать интересующую категорию и ознакомиться с разделами, выделенными внутри нее;

·             выбрать в данной категории интересующий раздел;

·             если внутри раздела имеются подразделы, выбрать подраздел и так далее, пока не будет выведен список ссылок на Web-страницы;

·             в выведенном списке щелчком мыши по гипертекстовой ссылке открыть страницу.

Тематические поисковые каталоги создаются вручную людьми, которые лично просматривают информационное пространство WWW, отбирают то, что, по их мнению, представляет общественный интерес и заносят адреса в каталог. Поисковые каталоги содержат классические наиболее содержательные ресурсы. 


Значок состояния

трока заголовка

Строка основного меню

Панель инструментов

Адресная

строка

Область просмотра web-страницы

Строка состояния


 

А также другие работы, которые могут Вас заинтересовать

34847. ЧДД как критерий эффективности инвестиций 99 KB
  Здесь инвестициям приписывается знак а доходам проекта знак . Этот индекс показывает во сколько раз приведенная к определенному моменту времени доходы проекта больше приведенных к этому же моменту времени затрат капитальных вложений проекта. В формуле 4 доходы и затраты проекта приведены к нулевому году в формуле 5 к концу жизненного цикла проекта. При расчете этих показателей следует иметь ввиду 4 особенности инвестиционного проекта.
34848. Внутренняя норма доходности капитальных вложений простого проекта 36.5 KB
  ВНД проекта это единственный положительный корень уравнения NPV = ∑Tt=0NCFt 1xt = 0 Неудобство такого определения в том что если жизненный цикл проекта больше двух лет то необходимо искать корни уравнения третьей четвертой и т. ВНД это такая процентная ставка при которой чистый дисконтированный доход проекта обнуляется. Основной показатель эффективности проекта это показатель NPV.
34849. Внутренняя норма доходности капитальных вложений сложного проекта 60.5 KB
  это определение действует и для простых и сложных проектов Таким образом ВНД это максимальная величина процентных ставок которая может быть получена инвестором в данном проекте Определение 2 ВНД проекта это единственный положительный корень уравнения Неудобство такого определения в том что если жизненный цикл проекта более 2х лет то необходимо понять корень уравнения 3ей4ей и т. Определение 3 ВНД такая процентная ставка при которой ЧДДчистый дисконтированный доход проекта обнуляется. Основные показатели эффективности...
34850. Индекс рентабельности капитальных вложений. Лимитирование финансовых средств для инвестиций 131 KB
  Если бюджет капитальных вложений ограничен а проектов несколько то следует отобрать лучшие проекты. Отбор лучших проектов осуществляется по индексу PI. Если проекты являются взаимозависимыми то отбор проектов для портфеля инвестиций существенно усложняется. В этом случае придется рассчитать коэффициенты парных корреляций между доходами проектов включенных в портфель.
34851. Дисконтированный срок окупаемости капитальных вложений 31 KB
  NPV Т годы 1 2 3 4 5 DPP=24года Методика расчета DPP: 1. По графику определяем DPP. Он всегда больше простого срока окупаемости DPP PP потому что при расчете DPP чистые денежные потоки уменьшаются на величину процентов...
34852. Анализ чувствительности ЧДД к различным факторам 29.5 KB
  Переменные которые подвергают изменению: а переменные затраты проекта б постоянные затраты проекта в цена единицы продукции выпускаемой в рамках этого проекта. 2 Применяется для анализа чувствительности одного проекта при условии что известны нормативы отклонения всех переменных. на собственном опыте или из литературных источников установить примерное удорожание объекта в ходе строительства примерную величину роста инфляции и других параметров проекта. Переменные которые подвергаются изменению: а смета капитальных вложений б величина...
34853. Операторы 99 KB
  При этом каждый из операторов выполняет некоторое действие над данными. Операторы ТР подразделяются на две группы: простые и структурированные. Простые операторы не содержат в себе других операторов структурированные включают в себя другие операторы как простые так и структурированные.
34854. Операторы цикла 77 KB
  Для любого оператора цикла вход в цикл возможен только через его начало выход осуществляется как вследствие естественного окончания цикла так и путем выполнения оператора перехода GOTO или процедур выхода содержащихся внутри цикла. Счетный оператор цикла FOR реализует циклический процесс с известным числом повторений и имеет две формы записи: Первая форма позволяет наращивать параметр цикла на единицу: FOR параметр цикла := min.значение DO оператор ; параметр цикла это переменная целого либо любого порядкового типа min и mx...
34855. Процедуры прерываний 78 KB
  00 Типизированные константы Пример . c1 и c2 идентификаторы обычной и типизированной констант type тип константы данный элемент присутствует в описании только типизированной константы это и является её основной внешней отличительной особенностью; vlue значение...