36265

Интерфейсы ИПС. Особенности ИПС глобальных сетей. Поиск в Internet

Доклад

Информатика, кибернетика и программирование

Глобальные поисковые системы в отличие от локальных стремятся объять необъятное по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет. Следует отметить что поисковые системы WWW весьма оперативно индексируют группы новостей и содержат информацию о статьях реально существующих в сети. Локальные и глобальные сети Internet В зависимости от удаленности компьютеров сети условно разделяют на локальные и глобальные. Произвольная глобальная сеть может включать другие глобальные сети локальные сети а также...

Русский

2013-09-21

142.5 KB

6 чел.

Вопрос 4. Интерфейсы ИПС. Особенности ИПС глобальных сетей. Поиск в Internet.

Рассмотрим постановку задачи поиска в общем виде. Для этого нам необходимо ответить на три вопроса: что искать, то есть, какие источники информации, где искать (места размещение этих источников) и как искать (какие инструменты для этого использовать).

Каковы основные источники информации, представленные в Интернете? Это документы WWW, статьи в группах новостей и списках рассылки, файлы в библиотеках файлов, справочники адресной информации организаций и людей (электронная почта, адрес, телефон), статьи в тематических базах данных, энциклопедиях.

Где эти источники информации размещаются? Это такие популярные ресурсы Интернет, как WWW, группы новостей, списки рассылки и FTP-серверы.

Безусловно, можно искать нужные источники информации вручную, узнавать адреса из специализированных журналов по информатике и Интернету, использовать специальные бумажные справочники с классифицированными по категориям адресами. Однако для такого изменчивого пространства как Интернет необходимо научиться пользоваться специальными инструментами, цель которых - собирать данные об информационных ресурсах и предоставлять пользователям услугу быстрого поиска.

ИПС (информационно-поисковая система) - это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.

Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность.

Релевантность - это соответствие результатов поиска сформулированному запросу.

Далее мы будем, в основном, рассматривать ИПС для всемирной паутины (WWW). Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы, метапоисковые системы.


1. Каталог

Каталог - поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми.

Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.

Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник

.

Адреса популярных каталогов:

Зарубежные каталоги:

Yahoo - www.yahoo.com Magellan - www.mckinley.com

Российские каталоги:

@Rus - www.aport.ru Weblist - www.weblist.ru Улитка - www.ulitka.ru

2. Поисковая машина

Поисковая машина - поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах.

Отличительной чертой поисковых машин является тот факт, что база данных, содержащая информацию об Web-страницах, статьях Usenet и т.д., формируется программой-роботом.

Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы, заключенной в кавычки. Индекс формируется и поддерживается в актуальном состоянии роботами-индексировщиками.

В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов).

Что можно делать с полученными результатами? Если название и описание документа соответствует вашим требованиям, можно немедленно перейти к его первоисточнику по ссылке. Это удобнее делать в новом окне, чтобы иметь возможность далее анализировать результаты выдачи. Многие поисковые системы позволяют проводить поиск в найденных документах, причем вы можете уточнить ваш запрос введением дополнительных терминов. Если интеллектуальность системы высока, вам могут предложить услугу поиска похожих документов. Для этого вы выбираете особо понравившийся документ и указываете его системе в качестве образца для подражания. Однако, автоматизация определение похожести - весьма нетривиальная задача, и зачастую эта функция работает неадекватно вашим надеждам. Некоторые поисковики позволяют провести пересортировку результатов. Для экономии вашего времени можно сохранить результаты поиска в виде файла на локальном диске для последующего изучения в автономном режиме.

Адреса наиболее популярных поисковых машин за рубежом и в России.

Зарубежные поисковые машины:

Google - www.google.com. Altavista - www.altavista.com. Excite - www.excite.com. HotBot - www.hotbot.com. Nothern Light - www.northernlight.com. Go (Infoseek) - www.go.com (infoseek.com). Fast - www.alltheweb.com.

Российские поисковые машины:

Яndex - www.yandex.ru (или www.ya.ru). Рэмблер - www.rambler.ru. Апорт - www.aport.ru

3. Метапоисковая машина

Метапоисковая система. Обратите внимание на то, что различные поисковые системы описывают разное количество источников информации в Интернет. Поэтому нельзя ограничиваться поиском только в одной из указанных поисковых системах. Теперь познакомимся с инструментами поиска, которые не формируют собственный индекс, но умеют использовать возможности других поисковых систем. Это метапоисковые системы (поисковые службы) - системы, способные послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.

Адреса известных метапоисковых систем:

MetaCrawler - www.metacrawler.com. SavvySearch - www.savvysearch.com

4. Поиск источников информации

Обсудим проблему поиска такого источника информации, как статьи в группах новостей. Инструментами поиска в данном случае могут являться рассмотренные поисковые машины WWW, которые индексируют не только пространство WWW, но и статьи в телеконференциях и имеют специальный режим поиска именно в этом ресурсе. Поиск в группах новостей поддерживает, например, поисковый сервер Altavistа. Следует отметить, что поисковые системы WWW весьма оперативно индексируют группы новостей и содержат информацию о статьях, реально существующих в сети. Для поиска в архивах новостей существую специализированные системы, самой известной из которых является система Deja (www.deja.com). Эта система позволяет проводить как поиск отдельных статей, содержащих введенный термин, так и поиск определенных групп новостей, посвященных обсуждению заданной темы. Можно зарегистрироваться в Deja и подписаться на определенные группы новостей.

Теперь рассмотрим инструменты, позволяющие проводить поиск файлов. Многие поисковые системы WWW стали оказывать услугу поиска мультимедийных файлов (Altavista, Aport). Для этого вовсе нет необходимости знать специальные операторы, а достаточно перейти с домашней страницы по ссылкам Картинки (Images), MP3/Audio или Video к специальному режиму поиска. Поиск проводится по возможному имени файла или по тексту в комментарии к ссылке на мультимедийный файл.

Что касается поиска программного обеспечения, во всемирной паутине существуют поисковые Web-серверы с коллекциями условно-бесплатного ПО, некоторые из них специализируются на поиск программного обеспечения для Интернета или для конкретной операционной системы. Эти системы в конечном итоге приведут вас к конкретному серверу, с которого и можно скачать искомый программный продукт. Следует упомянуть серверы Archie, также оказывающие услугу поиска файлов на FTP-серверах, однако пользоваться Web-серверами гораздо удобнее.

Рассмотрим поисковые инструменты для поиска адресной информации. Введем понятие Белого(White) и Желтого (Yellow) поиска.

White-поиск - поиск адресной информации по заранее известному собственному имени адресата (имя человека или организации)

Yellow-поиск - поиск собственного имени по дополнительным признакам (по роду деятельности, по географическому признаку), а затем поиск его адресной информации.

Обычно Yellow Pages системы фактически сразу включают в себя и White Pages - у найденного адресата сразу видны его телефон и почтовый адрес. Кроме того, некоторые Yellow Pages позволяют искать просто в алфавитном списке своих абонентов (white-поиск). С другой стороны, White pages также содержат элементы yellow-поиска - кроме задания собственного имени они обычно позволяют указать название города, штата и другие, сужающие поиск, данные (что необходимо в случае многих однофамильцев). Возможно, именно поэтому многие on-line телефонные справочники, выполняющие, фактически white-поиск, называют себя Yellow pages.

Здесь приведены адреса Web-систем для поиска адресной информации для людей и организаций.

Поиск людей:

  •  Поиск людей на Yahoo (http://people.yahoo.com).
  •  Система WhoWhere (www.whowhere.com).
  •  Система Bigfoot (www.bigfoot.com).

Поиск организаций: раздел Желтые страницы (Yellow pages) на поисковых системах специализированные сервера www.yellowpages.com - для поиска в США и других странах.

Локальные и глобальные сети Internet

В зависимости от удаленности компьютеров сети условно разделяют на локальные и глобальные.

Произвольная глобальная сеть может включать другие глобальные сети, локальные сети, а также отдельно подключаемые к ней компьютеры (удаленные компьютеры) или отдельно подключаемые устройства ввода-вывода. Глобальные сети бывают четырех основных видов: городские, региональные, национальные и транснациональные. В качестве устройств ввода-вывода могут использоваться, например, печатающие и копирующие устройства, кассовые и банковские аппараты, дисплеи (терминалы) и факсы. Перечисленные элементы сети могут быть удалены друг от друга на значительное расстояние.

В локальных вычислительных сетях (ЛВС) компьютеры расположены на расстоянии до нескольких километров и обычно соединены при помощи скоростных линий связи со скоростью обмена от 1 до 10 и более Мбит/с (не исключается случай соединения компьютеров и с помощью низкоскоростных телефонных линий). ЛВС обычно развертываются в рамках некоторой организации (корпорации, учреждения). Поэтому их иногда называют корпоративными системами или сетями. Компьютеры при этом, как правило, находятся в пределах одного помещения, здания или соседних зданий.

Итак, для того, чтобы создать компьютерную сеть, нужны компьютеры, линии связи, а также специальные устройства для подключения компьютеров к линиям связи. Наконец, необходимо установить специальное программное обеспечение для управления совместной работы в сети.

На сегодняшний день для соединения компьютеров в сети используются самые разнообразные линии связи: всевозможные кабели (коаксиальный, витая пара), телефонные линии связи, оптоволоконные линии, радиосвязь, в том числе и спутниковая связь. Главной характеристикой линии связи является скорость передачи данных, измеряемая в битах в секунду. Для сравнения, кабели обеспечивают скорость порядка 10 Мбит/сек, телефонные линии существенно менее скоростные - несколько десятков Кбит/секунду. Оптоволоконные линии - самые скоростные (10-400 Мбит/секунду), но достаточно дорогостоящие, спутниковая связь обеспечивает скорость передачи в пределах 10-100 Мбит/секунду.

Для подключения компьютеров к линиям связи используются специальные устройства, назначение которых преобразование компьютерной цифровой информации в соответствующий сигнал, способный распространяться по данной линии связи. Для физического подключения компьютера к локальной сети используется сетевая карта (сетевой адаптер).

Сетевая карта (адаптер) - устройство для физического подключения компьютера к локальной сети.

Для подключения к другим линиям связи используются модемы. Наибольшее распространение получили модемы, ориентированные на подключение к коммутируемой телефонной линии.

Модем - устройство, предназначенное для обмена информацией между удаленными компьютерами по каналам связи. Модем для подключения к коммутируемой телефонной линии выполняет преобразование компьютерных данных в звуковой аналоговый сигнал для передачи по телефонной линии (модуляция), а также обратное преобразование (демодуляция).

Модемы бывают внутренние и внешние. Внутренние модемы, судя по названию, вставляются внутрь системного блока компьютера. Внешние модемы представлены в виде отдельного устройства, которое соединяется кабелем с последовательным портом компьютера, таким же, к какому часто подключают мышь. Внутренние модемы содержат встроенный последовательный порт и получают питание от компьютера, внешние имеют отдельный блок питания. Внутренние модемы дешевле внешних при прочих равных характеристиках, основной из которых является скорость. Если вы покупаете новый модем, необходимо, чтобы он поддерживал протокол V.34 (скорость до 33600 бит/с), и желательно, чтобы он поддерживал V.90 (до 57600 бит/с в сторону пользователя и до 33600 в обратную сторону). Из фирм-производителей модемов следует упомянуть US Robotics, Motorola, ZyXEL.

Для того, чтобы все компьютеры в сети понимали друг друга, разработаны единые правила передачи данных, называемые сетевыми протоколами. Введем следующее определение:

Сетевой протокол - набор правил и соглашений, используемый при передаче данных между компьютерами в сети.

Локальная компьютерная сеть - компьютерная сеть для ограниченного круга пользователей, объединяющая компьютеры в одном помещении или в рамках одного предприятия.

Локальные сети получили широкое распространение, начиная с 80-х годов. Локальная компьютерная сеть позволяет легко обмениваться информацией внутри отдельной организации. Локальные сети предоставляют своим пользователям прежде всего такие услуги, как совместное хранение файлов для коллективной работы, и совместное использование принтеров.

Основными аппаратными компонентами ЛВС являются:

  •  рабочие станции;
  •  серверы;
  •  интерфейсные платы;
  •  кабели.

Рабочие станции (PC) - это, как правило, персональные ЭВМ, которые являются рабочими местами пользователей сети.

Серверы в ЛВС выполняют функции распределения сетевых ресурсов. Обычно его функции возлагают на достаточно мощный ПК, мини-ЭВМ, большую ЭВМ или специальную ЭВМ-сервер. В одной сети может быть один или несколько серверов.

При наличии в ЛВС нескольких серверов каждый из них управляет работой подключенных к нему PC. Совокупность компьютеров сервера и относящихся к нему PC часто называют доменом. Иногда в одном домене находится несколько серверов. Обычно один из них является главным, а другие - выполняют роль резерва (на случай отказа главного сервера) или логического расширения основного сервера.

Конфигурация соединения элементов в сеть (топология) во многом определяет такие важнейшие характеристики сети, как ее надежность, производительность, стоимость, защищенность и т. д.

Существует два основных принципа управления в локальных сетях: централизация и децентрализация. Согласно этим принципам локальные сети бывают одноранговыми и серверными.

Одноранговая сеть - сеть, в которой компьютеры равноправны.

Серверная сеть - сеть с компьютерами, выполняющими разные роли.

Сервер - компьютер, выделенный для совместного использования участниками сети, поставляющий ресурсы и услуги.

Клиент - компьютер, использующий ресурсы и услуги сервера.

Каждый компьютер сети имеет уникальное сетевое имя, позволяющее однозначно его идентифицировать. Для каждого пользователя серверной сети необходимо иметь свое сетевое имя и сетевой пароль. Имена компьютеров, сетевые имена и пароли пользователей прописываются на сервере.

Для удобства управления локальной компьютерной сетью, несколько компьютеров, имеющих равные права доступа, объединяют в рабочие группы.

Совокупность приемов разделения и ограничения прав доступа участников компьютерной сети к ресурсам называется политикой сети. Обеспечением работоспособности сети и ее администрированием занимается системный администратор - человек, управляющий организацией работы локальной сети.

Естественно, в локальной сети ваше информационное пространство ограниченно ее ресурсами. Для выхода в мировое информационное пространство необходимо подключиться к глобальной компьютерной сети, самой известной из которых является Интернет. Введем определение.

Интернет (Internet) - всемирная информационная компьютерная сеть. Самая большая в мире совокупность разнотипных компьютерных сетей.

Примечание. Несмотря на то, что в переводе Internet означает межсеть, в русском языке слово Интернет мужского рода.

История Интернета начинается с 1969 года, когда была создана первая сеть национального масштаба в США под названием ARPANET для обеспечения связи и управления в условиях, приближенных к военным. В середине 70-х годов для ARPANET были разработаны новые стандарты передачи данных, которые позволяли объединять между собой сети произвольной архитектуры. В основе этих стандартов были реализованы две идеи. Первая идея заключалась в том, что любой компьютер должен всегда иметь альтернативный маршрут для отправки информации, чтобы выход из строя одного компьютера не приводил к разрыву всей сети. Вторая идея заключалась в том, что при передаче любого массива информации, он разбивается на нужное число небольших порций (пакетов), каждому пакету присваивается номер и он снабжается адресом отправителя, адресом получателя и некоторой служебной информацией. Далее пакеты передаются по сети независимо от всех остальных, и, в принципе, они могут следовать разными маршрутами. После прибытия всех пакетов на место назначения, из них, согласно полученным номерам, собирается исходное сообщение. Целостность пакетов проверяется, и если в процессе транспортировки произошло повреждение информации, встречающая система запрашивает повторную передачу только одного маленького пакетика, а не всего массива информации. Подобная модель передачи информации называется коммутацией пакетов. Для сравнения, в телефонной сети используется так называемая коммутация каналов. Это означает, что после дозвона между вами и вашим абонентом устанавливается постоянный канал связи, который больше никем не используется на все время ваших переговоров.

Именно эти стандарты, впоследствии получившие название протокола TCP/IP, заложили основу для роста глобальной компьютерной сети путем объединения уже существующих сетей. Следующим этапом в развитии Интернета было созданию глобальной сетевой инфраструктуры под названием NSFNET для системы высшего образования США (1985-88). Национальный научный фонд (NSF) создал сеть скоростных магистральных каналов связи и выделял средства на подключение к ней американских университетов, при условии, что университет обеспечивал доступ к сети для всех подготовленных пользователей. Настоящий расцвет Интернета начался в 1992 году, когда была изобретена новая служба, получившая название "Всемирная паутина" (World Wide Web, или WWW, или просто Web (веб)). WWW позволял любому пользователю Интернета представлять свою информацию в мультимедийной форме, связывая их с публикациями других авторов и предоставляя удобную систему навигации (быстрого перехода по ссылкам от одной публикации к другой).

Рассмотрим основные ресурсы (службы) Интернета. Самым популярным ресурсом Интернета является всемирная паутина или WWW, которая представляет собой огромное количество (свыше миллиарда) мультимедийных документов, отличительной особенностью которых кроме прекрасного внешнего вида является возможность ссылаться друг на друга. Это означает присутствие в текущем документе ссылки, реализующей переход на любой документ WWW, который физически может быть размещен на другом компьютере сети Интернет.

WWW (World Wide Web, всемирная паутина) - совокупность взаимосвязанных гипермедийных документов.

Следующим ресурсом сети является FTP, который является хранилищем и системой пересылки всевозможных файлов.

FTP (File Transfer Protocol, протокол передачи файлов) - хранилище и система пересылки всевозможных файлов.

Старейшим ресурсом Интернета является E-mail (электронная почта).

E-mail (электронная почта) - система пересылки электронных писем.

Для ведения дискуссий в сети предназначена глобальная распределенная система под названием Группы новостей.

Группы новостей - глобальная распределенная система для обмена сообщениями и ведения дискуссий. Одной из самых популярных систем подобного рода являются группы новостей Usenet.

Служба telnet позволяет вам подключиться к удаленному компьютеру и работать с его ресурсами.

Telnet - сервис для удаленного управления компьютерами.

Наконец, в Интернете есть система IRC (Chat), реализующая живое общение пользователей в реальном режиме времени посредством ввода текста с клавиатуры.

IRC (Chat) - служба для живого общения пользователей Интернета в реальном режиме времени посредством ввода текста с клавиатуры.

В профессиональной деятельности в Интернете можно проводить поиск информации по интересующей вас тематике, организовывать совместные проекты с профильными фирмами. В Интернете есть специализированные серверы, помогающие искать работу. Кроме того, фирмы, представленные во всемирной паутине, как правило, публикуют информацию о вакантных должностях.

По желанию можно разместить во всемирной паутине собственный документ с информацией, которую вы хотели бы сообщить миру о себе.

Интернет можно эффективно использовать в сфере образовательных услуг. Во-первых, вы можете найти материалы для диссертационной работы, курсовых и дипломных проектов. В отличие от зачастую ограниченных книжных ресурсов местной библиотеки к вашим услугам мировые информационные сокровища. Через Интернет можно найти коллег по работе в разных странах и организовать совместный научный проект. Обратившись напрямую через представительство образовательных учреждений в WWW, вы сможете найти информацию об интересующих научных конференциях, а также о возможности обучения или стажировки за рубежом.

С появлением Интернета новый импульс получило заочное образование. Использование современных сетевых технологий позволяет сейчас получить полноценное образование или пройти переподготовку. В Интернете появляется все больше и больше виртуальных университетов, предлагающих образовательные услуги. Этот способ получил название дистанционного обучения.

В сфере коммерческой деятельности через Интернет можно найти деловых партнеров, получить информацию о конкурентах, проводить со специальными мерами защиты биржевые и банковские операции, развернуть рекламную компанию, получать консультационную поддержку и проводить маркетинговые исследования. Наконец, вы можете совершить любые покупки в on-line или Интернет-магазинах.

В Интернете можно найти собеседника, познакомиться и подружиться с ним, завязать переписку. Библиотеки файлов содержат огромное количество компьютерных игр, которые можно чаще всего бесплатно переписать на свой компьютер. С помощью современных push-технологий можно организовать постоянно-периодическую доставку новостей прямо на рабочий стол вашего компьютера.

Для передачи информации в сети Интернет используется связка протоколов TCP/IP.

TCP/IP (Transmission Control Protocol/Internet Protocol, протокол управления передачей протокол Интернета/протокол Интернета) - протокол (семейство протоколов), являющийся стандартом для передачи данных между сетями, в том числе в Интернете.

Протокол TCP (протокол управления передачей) разбивает информацию на порции (пакеты) и нумерует их. Затем протокол IP (протокол Интернета) добавляет к каждой порции служебную информацию с адресами отправителя и получателя и обеспечивает доставку всех пакетов.

Благодаря такому способу передачи информации, в Интернете, как и в обычной почте, нет понятия "занято" - каждый компьютер может одновременно принимать пакеты от большого количества других компьютеров. В этом случае нет необходимости устанавливать отдельный канал связи межу двумя компьютерами.

Протоколы и службы Интернета можно использовать и в рамках локальной сети. В этом случае такая сеть имеет название intranet (интрасеть).

Intranet - локальная сеть, в которой для передачи информации используются средства, программное обеспечение и протоколы Интернета.

Для объединения нескольких локальных сетей, работающих по разным протоколам, используют специальные средства - шлюзы.

Шлюз - специальные средства (аппаратные или программные) для связи между собой локальных сетей, работающих по разным протоколам.

При любом виде соединения чрезвычайно важным фактором является безопасность. Интернет используют сотни миллионов людей и не все они исполнены добрых намерений. Поэтому для обеспечения сетевой безопасности между локальной и глобальной сетью устанавливают брандмауэр.

Брандмауэр - специальный компьютер или программа, препятствующая несанкционированному перемещению данных между сетями.

Брандмауэр предотвращает несанкционированный доступ к вашей сети, ограничивает входящий и исходящий трафик, распознает пользователей и регистрирует информацию о трафике.

Чтобы различать компьютеры в Интернет, каждому из них присваивается адрес, представляющий собой уникальную цепочку цифр или соответствующее этой цепочке символьное имя компьютера.

В Интернете есть специальная организация, занимающаяся проверкой и выдачей адресов.

При пересылке информации протоколами TCP/IP используется цифровой (IP-адрес) компьютера, представляющий собой четыре десятичных числа, разделенных точкой, например, 192.168.1.1.

IP- адрес - четырехбайтовое двоичное число, представляемое в виде четырех десятичных чисел, разделенных точкой и позволяющее однозначно идентифицировать компьютер, подключенный к Интернету.

Однако неискушенному пользователю этот адрес ровным счетом ничего не скажет, поэтому для удобства цифровой адрес можно представить в виде цепочки символов. Это означает, что у компьютера есть имя или доменный адрес. Каждая часть доменного имени называется доменом. Количество доменов может быть разным, но чаще всего их от трех до пяти. Читается доменное имя справа налево и расшифровывается как последовательное уточнение адреса подобно почтовой системе адресов. Домен верхнего уровня располагается в адресе правее. В нашем примере www.ulstu.ru домен верхнего уровня ru указывает на то, что компьютер размещен в России. Следующий уровень определяет домен организации, предоставляющей доступ к Интернету, в нашем случае, это домен ulstu принадлежит Ульяновскому государственному техническому университету.

Доменный адрес - представление адреса компьютера в Интернете в виде нескольких цепочек символов (доменов), разделенных между собой точкой.

Конечно, пользователю Интернета гораздо удобнее использовать доменные адреса, однако компьютерам все равно нужен цифровой формат. Поэтому в Интернете существует база данных DNS, хранящая информацию о соответствии доменных и цифровых адресов, а также программа DNS-сервер, осуществляющая автоматическое преобразование адресов.

Сервер DNS - программа, осуществляющая преобразование доменного адреса в цифровой (IP-адрес).

В Интернете существует соглашение для доменов верхнего уровня. Как правило, это либо двухбуквенный код страны или трехбуквенный код, обозначающий область деятельности фирмы в США.

Например: com -коммерческие организации США; edu - учебные заведения; gov - правительственные организации; net - сервисные центры Интернет; mil - военные организации; org - прочие организации или ru (Россия) ua (Украина) и т.д.

Как и в серверной локальной компьютерной сети, в Интернете есть два сорта компьютеров - серверы и клиенты.

Серверы- это мощные, надежные компьютеры, работающие круглосуточно. Они постоянно подключены Интернету, способны хранить и пересылать информацию по запросу других компьютеров, отвечая при этом на десятки и сотни запросов одновременно. Как правило, серверы защищены от сбоев электропитания. Чаще всего они работают под управлением того или иного варианта операционной системы Unix.

Клиенты - это те персональные компьютеры пользователей Интернета, на которых можно составлять и посылать запросы к серверам, получать и отображать информацию. Часто такой компьютер не соединен с Интернетом постоянно, а подключается по мере необходимости.

Терминология клиент/сервер применяется также для программного обеспечения ресурсов Интернета. Это означает, что существует клиентское программное обеспечение, которое взаимодействует с пользователем и формирует запрос, и серверное программное обеспечение, которое отвечает на такие запросы.

Сервер - программное обеспечение, хранящее соответствующую своему ресурсу информацию и отвечающее на запросы клиентского программного обеспечения.

Клиент - программа, устанавливаемая на компьютере пользователя Интернета для составления и посылки запросов соответствующему серверу, получения и отображения информации на компьютере пользователя.

Эти запросы формируются в соответствии с некоторым протоколом. Протокол исполняет роль стандарта, он позволяет корректно взаимодействовать программам, написанным разными авторами для разных типов компьютеров и операционных систем. Для каждого ресурса Интернета существует свой прикладной протокол.

Таким образом, для каждого ресурса Интернета есть своя программа-сервер, соответствующая клиентская программа и свой протокол прикладного уровня, обеспечивающий взаимодействие программы-клиента с сервером.

Для подключения к Интернету необходимо обратиться к услугам специальных организаций - провайдеров услуг Интернета. Это фирмы, которые специализируются на предоставлении услуг по доступу в Интернет. Они соединены с Интернетом постоянными высокоскоростными линиями связи и имеют несколько модемов, которые дежурят на определенных телефонных номерах или на одном многоканальном номере, ожидая звонков пользователей.

В Интернете существуют следующие режимы работы:

On-line - режим работы, означающий непосредственное подключение к сети на все время запроса, поиска, обработки, получения и просмотра информации.

В таком режиме работают большинство служб Интернета, например, WWW.

Off-line - режим работы, подразумевающий подключение к сети только на время отправки запроса или получения информации по запросу режим работы.

В таком режиме работает, например, электронная почта.

Среди способов подключения к Интернету, предлагаемых провайдерами, можно выделить следующие:

  •  Коммутируемое IP-соединение (Dial-Up IP) - подключение через модем к коммутируемой телефонной линии (временное подключение в режиме on-line). Большинство пользователей подключается к Интернету, именно так. В этом случае вы в удобное для вас время подключаетесь через модем к вашему провайдеру. При этом ваш модем через обычную телефонную линию связывается с одним из модемов провайдера. После установки связи вы становитесь полноправным пользователем Интернета, и вам доступны абсолютно все его ресурсы. Обычно, в этом случае за ежемесячную абонентскую плату предоставляется определенное количество часов пребывания в Интернете, а также вас ждет повременная оплата свыше оговоренных часов.
  •  Постоянное подключение по выделенной линии (режим on-line). Этот режим обеспечивает существенно более высокие скорости, чем подключение по коммутируемой линии. В качестве выделенных линий можно использовать телефонные или оптоволоконные линии. Стоимость этого варианта настолько велика, что этот вариант используют, как правило, для подключения локальных сетей. В этом случае все клиенты локальной сети могут выходить в Интернет через свой сервер. При подключении локальной сети к глобальной важную роль приобретает обеспечение безопасности данных. Для обеспечения сетевой безопасности между локальной и глобальной сетью устанавливают специальный компьютер или программу (брандмауэр), ограничивающую доступ в локальную сеть извне и несанкционированный выход за пределы локальной сети.

Трафик - это объем информации, передаваемый по сети за определенный период времени.

Некоторые провайдеры услуг Интернет ведут учет трафика своих клиентов и даже взимают дополнительную плату него.

С понятием трафика тесно связано понятие скорости передачи и получения информации. Скорость измеряется в битах в секунду и зависит от многих параметров: от способа подключения к провайдеру, скорости модема и характеристик соединения вашего провайдера с Интернетом. Также скорость получения информации зависит от степени занятости удаленного компьютера, то есть от количества желающим одновременно с вами получить от него информацию.

Как упоминалось выше, одним из направлений использования Интернета является обмен информацией. Рассмотрим основные средства обмена информацией, доступные через глобальную сеть:

  •  Электронная почта, позволяющая очень быстро отправлять электронные письма на электронные адреса пользователей Интернета.
  •  Списки рассылки, на которые можно подписаться, как на журнал, и затем периодически получать на свой электронный адрес подборку статей на заданную тему. Впоследствии можно отправлять свои сообщения всем подписчикам.
  •  Группы новостей, которые позволяют публиковать сообщения по интересам на специальных серверах в сети. Сообщения можно читать, подключившись к серверу и выбрав тему для себя. Далее, по желанию, вы можете ответить автору статьи или послать собственное сообщение. Таким образом, организовывается сетевая дискуссия, носящая новостной характер, поскольку сообщения хранятся небольшой период времени.
  •  Чрезвычайно популярным ресурсом является IRC, который служит для прямого общения группы людей в режиме реального времени с помощью ввода текста с клавиатуры и немедленного появления его на общей доске.

Разработаны специальные программы для общения в реальном режиме времени, позволяющие после установления связи передавать текст, вводимый с клавиатуры, а также звук, свое изображение и любые файлы. С помощью этих программ можно организовать совместную работу удаленных пользователей с программой, запущенной на локальном компьютере.

  •  С помощью специального оборудования и программного обеспечения через Интернет можно проводить аудио- и видеоконференции, то есть передавать звук и изображение от одного ко многим.
  •  В Интернете есть свои пейджинговые системы, в которых можно зарегистрироваться и получить свой персональный номер. Зная персональный номер другого человека, можно через центральный сервер пейджинговой службы отправить ему сообщение с предложением установить соединение и пообщаться. Самой популярной пейджинговой системой в Интернете является система ICQ.
  •  Интернет-телефонией называется система, позволяющая вести разговор в реальном времени через сеть Интернет.

WWW - ресурсы Internet

После того, как мы ответили на вопрос, что представляет собой Интернет, и разобрались в технических подробностях его реализации, попробуем определить для себя, каковы основные направления использования Интернета для пользователя. Здесь можно выделить три направления:

  •  Источник информации.
  •  Средство обмена информацией.
  •  Место размещения личной информации.

Можно рассматривать WWW как единое распределенное информационное пространство, состоящее из сотен миллионов гипермедийных документов. Понятие гипермедиа означает объединение двух понятий: мультимедиа и гипертекст.

Мультимедиа - документ включает в себя не только текст, но и двух- и трехмерную графику, видео и звук.

Информация в WWW представляется в виде документов, каждый из которых может содержать как внутренние перекрестные ссылки, так и ссылки на другие документы, хранящиеся на том же самом или на любом другом сервере.

Гипертекст - множество отдельных документов (страниц), которые имеют ссылки друг на друга.

Гипертекстовая ссылка - выделенная часть документа, реализующая переход к другому документу. Реализуется в виде подчеркнутого текста, кнопки или картинки.

Web-страница - документ в WWW, содержащий:

  •  форматированный текст;
  •  мультимедийные объекты (графика, звук, музыка, видеоклипы);
  •  ссылки на любой файл или на другую Web-страницу;
  •  активные компоненты, способные выполнять работу на компьютере клиента по заложенной в них программе.

Пожалуй, в рамках одной единственной страницы трудно изложить информацию даже об отдельной личности, поэтому, как правило, информацию представляют в виде набора из нескольких десятков или сотен, связанных вместе единой темой, общим стилем оформления и взаимными гипертекстовыми ссылками. Такой набор называется Web-site или Web-узел.

Web-site (Web-узел, Web-сайт) - группа Web-страниц, связанных вместе единой темой, общим стилем оформления и взаимными гипертекстовыми ссылками.

Каждый Web-узел имеет свою стартовую страницу, которая называется начальной или домашней или Home Page.

Обычный Web-узел отправляет запрошенный документ только по обращению клиента. В WWW существуют Web-узлы, способные самостоятельно передавать обновленную информацию при условии регистрации и подписки клиента.

Web-канал - Web-узел, способный автоматически в заданное время передавать обновленную информацию на компьютер зарегистрированного клиента.

Многочисленные Web-узлы и Web-страницы хранятся на огромном множестве так называемых WWW-серверов, то есть компьютеров, на которых установлено специальное программное обеспечение.

Web-сервер - программа, позволяющая хранить и пересылать Web-страницы.

Пользователи, имеющие доступ к сети, получают эту информацию при помощи программ-клиентов для просмотра Web-документов, которые получили специфическое название Web-браузер (броузеры, обозреватели).

При этом браузер посылает по компьютерной сети запрос Web-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает программе просмотра требуемый файл или сообщение об отказе, если файл по тем или иным причинам недоступен. Взаимодействие клиент-сервер происходит по определенным правилам, или, как говорят иначе, по прикладному протоколу. Протокол, принятый в WWW, называется HyperText Transfer Protocol, сокращенно - HTTP.

HTTP (HyperText Transfer Protocol, протокол передачи гипертекста) - протокол, который использует Web-клиент для получения Web-страницы с Web-сервера.

Этот протокол для передачи гипертекста в Сети был предложен швейцарским физиком Тимом Бернерсом-Ли (Tim Berners-Lee) в 1989 году.

WWW-документ может содержать стилизованный и форматированный текст, графику и гиперсвязи с различными ресурсами Internet. Чтобы реализовать все эти возможности, был разработан специальный язык, названный HyperText Markup Language (HTML), то есть, Язык Разметки Гипертекста.

HTML (HyperText Markup Language, язык разметки гипертекста) - специальный язык описания WWW-документов. Описание Web-страницы на HTML представляет собой набор инструкций, интерпретируемый программой-браузером.

Документ, написанный на HTML, представляет собой текстовый файл, содержащий собственно текст, несущий информацию читателю, и теги разметки (markup tags). Последние представляют собой определенные стандартом HTML последовательности символов, являющиеся инструкциями для программы просмотра; согласно этим инструкциям программа располагает текст на экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и формирует гиперсвязи с другими документами или ресурсами Internet. Таким образом, файл на языке HTML приобретает облик Web-документа только тогда, когда он интерпретируется браузером.

Всем пользователям компьютера хорошо знакомо понятие полного имени файла на локальном компьютере, которое включает в себя краткое имя файла с расширением и полный путь к файлу, начиная с имени устройства. Таким образом, мы однозначно идентифицируем файл в пределах данного компьютера.

Каждый файл в Интернете также имеет свой уникальный адрес. Он называется URL.

URL (Universal Resource Locator, универсальный указатель ресурсов) - адрес любого файла в Интернете. Кроме адреса компьютера содержится указание о протоколе, по которому нужно обращаться к файлу, какую программу-сервер на сервере запустить и к какому конкретному файлу следует обратиться.

Общий вид URL:

протокол://адрес_сервера:порт/имя_каталога/имя_файла

Рассмотрим примеры URL:

http://www.microsoft.com - обращение по протоколу HTTP к начальной (домашней) странице Web-сервера коммерческой фирмы Microsoft в США. Здесь самый левый домен в адресе www сразу указывает на тип информации.

ftp://www.comp.ru/business/index.html - адрес файла index.html, расположенного в каталоге business на сервере www.comp.ru в России, к которому нужно обращаться по протоколу передачи файлов FTP.

В 1994 году была основана корпорация Netscape Communications и практически сразу же выпущена первая версия браузера Netscape Navigator, завоевавшего огромную популярность.

В 1996 году у Netscape Navigator появился серьезный конкурент, Internet Explorer, браузер корпорации Microsoft. Протокол HTTP, язык разметки гипертекстов HTML, браузеры и веб-серверы беспрестанно совершенствуются, открывая перед своими пользователями все новые и новые возможности.

В 1999 был выпушен браузер Opera, (последняя версия 6.0) в настоящее время являющийся самым компактным и быстрым. Большинство тестов показывают, что этот браузер является и самым корректным при отображении web-страниц.

Конкурирующие между собой Netscape Navigator и Internet Explorer (IE) обладают примерно равными возможностями, правда Internet Explorer стал выходить в русифицированной версии немного раньше, кроме того, весь свой комплект интернетовских программ фирма Microsoft догадалась встроить в операционную систему Windows 98, поэтому многие предпочитают использовать именно Internet Explorer.

Браузер может работать не только с Web-серверами, но и с серверами сервиса FTP. Поэтому при выборе ссылки вида ftp://emf.ulstu.ru в текущем окне откроется содержимое папки FTP-архива файлов. Как правило, вместе с браузером на компьютер обычно устанавливается программа-клиент для пользования электронной почтой и чтения новостей. Поэтому, если ссылка выглядит как mailto:ivanov@emf.ulstu.ru, при ее выборе запускается прописанный в браузере почтовый клиент, и Вы сможете написать электронное письмо по указанному в ссылке адресу.

При выборе ссылки вида news://it.belsut.gomel.by запускается программа-клиент для чтения новостей с предложением загрузить список групп новостей, поддерживаемых сервером.

FTP - ресурсы Internet

Пространство всемирной паутины воистину безбрежно, и в нем можно найти самую разнообразную информацию. Как выяснилось, с помощью программы-браузера можно перекачать любой файл, на который есть ссылка с Web-страницы, однако при этом чаще всего будет использоваться не совсем стандартный протокол для передачи файлов - протокол HTTP. Более того, для копирования крупного файла может понадобиться слишком много времени, а если произойдет разрыв связи, процедуру перекачки придется начинать сначала. Поэтому мы подробнее познакомимся с другим ресурсом Интернета под названием FTP.

FTP (File Transfer Protocol, протокол передачи файлов) - раздел Интернет, являющийся хранилищем всевозможных файлов.

И в то же время FTP (File Transfer Protocol, протокол передачи файлов) - протокол передачи данных, используемый в разделе FTP для пересылки файлов.

Протокол FTP более удобен для передачи файлов, поскольку он может продолжать дозагрузку файлов после разрыва связи между компьютерами. Обращаем ваше внимание на тот факт, что многие фирмы помимо Web-сервера содержат и FTP-сервер, адрес которого можно элементарно составить. Для этого нужно просто протокол HTTP в URL поменять на FTP, а вместо www в имени сервера использовать ftp. Так, из http://www.microsoft.com получим ftp://ftp.microsoft.com.

Рассмотрим реализацию технологии клиент/сервер на примере FTP.

Сервис FTP имеет свои серверы в сети. Файлы, доступные в пространстве FTP, объединены в так называемые FTP-архивы.

FTP-архив - большая коллекция файлов, обычно объединенных общей тематикой, например, архивы общедоступных программ или архивы документов.

Внутри архива файлы обычно также структурированы в каталоги по тематикам, например, графические программы или утилиты. Практически все крупные и хорошо структурированные FTP-архивы обеспечивают пользователя индексом - списком всех файлов, имеющихся в архиве, обычно с описаниями и названиями каталогов, где эти файлы расположены. Такой индекс традиционно хранится в файле с названием index в корневом каталоге FTP-архива.

FTP-сервер - программа, позволяющая хранить файлы и передавать их по протоколу FTP.

FTP-клиент - программа, позволяющая подключаться к удаленному FTP-серверу и получать/передавать файлы по протоколу FTP.

В отличие от Web-сервера, к которому может получить доступ практически любой желающий, среди FTP-серверов есть две категории серверов. Некоторые серверы доступны только для ограниченного круга зарегистрированных пользователей и для подключения к себе требуют ввод идентификатора или имени пользователя (login) и пароля (password).

Другие серверы открыты для всех желающих. Их называют анонимными.

Анонимный FTP-сервер - сервер с открытым доступом. Стандартным именем пользователя для анонимных FTP-серверов является anonymous, в качестве пароля используется адрес электронной почты.

На FTP-серверах может храниться различное программное обеспечение. Различают два типа программ, которые можно скопировать через Интернет.

Freeware(свободно распространяемые программы) - распространяются бесплатно.

Эти программы можно не только копировать, но и использовать совершенно бесплатно.

Shareware (условно-бесплатные программы) - распространяются бесплатно с условием использования в течение ограниченного времени с последующей выплатой гонорара автору.

Иногда условно-бесплатные программы просто обладают не всеми возможностями коммерческой версии программы, но работают сколь угодно долго. Некоторые ведут отсчет количества запусков, и по достижению предельного числа просто перестают загружаться, настойчиво предлагая себя купить.

В качестве FTP-клиента может выступать уже хорошо знакомая нам программа-браузер, которая понимает не только свой законный протокол HTTP, но и протокол FTP. Однако с помощью браузера вы сможете только копировать файлы с удаленного сервера на локальный компьютер.

Почитатели интерфейса программы Norton Commander могут использовать для работы с FTP-серверами менеджер файлов FAR.

По мере развития Интернета и, соответственно, FTP, начали появляться гораздо более удобные версии FTP-клиентов, ориентированные на графическое представление FTP-архива. В качестве примера можно привести программу CuteFTP.

Какова общая схема работы с FTP-сервером? Во-первых, вы должны указать адрес (URL) конкретного сервера. Например, ftp://ftp.emf.ulstu.ru

Затем нужно пройти процедуру регистрации на сервере. Если сервер анонимный и вы работаете с программой-браузером, регистрация пройдет автоматически. При работе с графическим FTP-клиентом вы также заранее можете прописать необходимые параметры доступа к серверу, а именно, имя пользователя и пароль. При работе с символьным FTP-клиентом все вводится вручную.

После удачного подключения вы можете просматривать содержимое всех папок сервера, которые, в зависимости от типа FTP-клиента выглядят как в программе для просмотра файловой системы. Найдя нужный файл, можно скопировать его на диск локального компьютера, предварительно указав место назначения. Копирование файлов с локального компьютера на удаленный FTP-сервер, как правило, разрешено только для зарегистрированных пользователей.

С FTP-клиентами вы работаете всегда в режиме on-line, кроме того, не всегда есть возможность докачать недополученный файл. Неоценимую услугу здесь могут оказать программы, позволяющие автоматизировать процедуру получения файлов из Интернета.

Программы загрузки и докачивания файлов - программы, позволяющие задавать список файлов (URL) для последующего копирования и докачки в случае обрыва связи по протоколам HTTP и FTP.

В качестве примеров приведем условно-бесплатную программу GetRight (www.getright.com), условно-бесплатную программу FlashGet (www.amazesoft.com) бесплатную программу NetVampire (www.netvampire.com), одна из версий которой имеет возможность перехода к русскоязычному интерфейсу.