10075

Концепція атаки web-орієнтованих пошукових систем

Научная статья

Информатика, кибернетика и программирование

Концепція атаки web-орієнтованих пошукових систем І.А. Терейковський Запропонована нова концепція активного впливу атаки на популярні вітчизняні та закордонні Web-орієнтовані пошукові системи з метою підвищення рейтингу зареєстрованих в них сайтів. Доведено що для вп

Украинкский

2013-03-20

57.5 KB

0 чел.

Концепція атаки web-орієнтованих пошукових систем

І.А.Терейковський

Запропонована нова концепція активного впливу (атаки) на популярні вітчизняні та закордонні Web-орієнтовані пошукові системи з метою підвищення рейтингу зареєстрованих в них сайтів. Доведено, що для впливу на рейтинг сайту в пошукових системах можливо використати особливості механізму підрахунку кількості користувачів та механізму формування реєстраційних параметрів сайту. Наведено алгоритм функціонування програмних засобів здійснення атаки. Показано приклад програмної реалізації.

Вступ

 За останні роки мережа Internet, а особливо її найбільш популярна частина Web стала одним із основних місць публікації різноманітної інформації. Як правило ця інформація  публікується у вигляді Web-сайтів, що стали невід’ємною та важливою складовою частиною практично всіх корпоративних комп’ютерних мереж. На сьогодні в мережі Web функціонує декілька мільйонів сайтів, причому їх кількість постійно збільшується. Велика кількість сайтів та специфіка визначення їх адрес призвела до необхідності забезпечення доступності інформації опублікованої в мережі Web, що і є загальною проблемою представленої наукової роботи. Проблема безпосередньо пов'язана з таким глобальним науково — практичним напрямом,  як створення ефективних Web — орієнтованих корпоративних комп’ютерних мереж.

Напрямки вирішення означеної проблеми базуються на дослідженні шляхів того, яким чином користувачі Web-сайту можуть отримати доступ до його сторінок, тобто взнати про його адресу.  В [1, 2, 3, 4] відзначено, що в теперішній час, в більшості випадків основним джерелом знань про адреси сайтів комерційного спрямування є так звані пошукові системи (ПС). Найбільшою популярністю серед вітчизняних користувачів користуються ПС  www.google.com, www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. Принцип їх використання полягає в визначенні користувачем пошукових запитів та у формуванні ПС списку знайдених адрес, з коротким описом змісту відповідних сайтів. Даний список дістав назву рейтингу сайтів. Дослідження [1, 2, 3, 4] показали, що в більшості випадків користувачі відвідують тільки 10-20 перших  адрес із списку. По цій причині, рейтинг сайту в ПС безпосередньо впливає на кількість його відвідувачів яка в свою чергу використовується в якості одного із критеріїв ефективності  функціонування комерційних сайтів [2]. З іншої точки зору, низький рейтинг сайту можна розцінити як загрозу доступності розміщених на ньому інформаційних ресурсів.  Таким чином, функціонування ПС в значній мірі впливає на ефективність, надійність та захищеність Web-сайтів корпоративних комп’ютерних мереж.

На сьогодні проблема підвищення рейтингу сайту вирішується в основному за рахунок ефективної реєстрації в ПС, оптимізації його змісту, продуманого опису сайту та ключових слів сайту за допомогою тегу meta, залучення нецільової аудиторії за допомогою того ж таки тегу <meta>, вибору доменного імені, семантичної насиченості HTML-коду, створенням метаданих, що описують конвент сайту та забезпечують автоматичну інтерпретацію його семантики [2, 3, 4]. Аналіз цих заходів вказує, що всі вони орієнтовані на адаптацію сайту до методики формування рейтингу ПС, тобто носять односторонній пасивний характер. Ці обставини накладають певні обмеження на реалізацію та результати застосування означених заходів. Наприклад, при реєстрації сайту в ПС можливо використовувати тільки обмежену кількість ключових слів. Обсяг опису сайту за допомогою тегу <meta> також обмежений. Крім того методика формування рейтингу кожної з ПС має певну специфіку, яка може час від часу змінюватись.  Тобто, високий рейтинг сайту в одній із популярних ПС не свідчить про високий рейтинг в інших системах.  Таким чином відсутність в системі підвищення рейтингу активної складової є однією із не вирішених частин проблеми підвищення доступності інформації опублікованої в мережі Web.

Постановка задачі

Розробка концепції активного впливу (атаки) на Web-орієнтовані ПС з метою  підвищення рейтингу зареєстрованого в них сайту. Концепція повинна враховувати особливості функціонування і формування рейтингу популярними ПС та бути орієнтована на реалізацію програмними засобами.

Аналіз можливих напрямів атаки

Популярні ПС представляють собою сучасні розподілені  комп’ютерні системи, що використовують добре захищене та високонадійне апаратне та програмне забезпечення, яке обслуговується висококваліфікованим персоналом. Безперспективність зміни рейтингу сайту за рахунок несанкціонованого доступу та модифікації відповідних даних в ПС не викликає сумніву. На наш погляд єдиним напрямком атаки є використання санкціонованих шляхів впливу адміністратора сайту на ПС. Для виявлення вказаних шляхів слід проаналізувати механізм пошуку по ключовим словам та механізм формування рейтингу сайтів. Завдання ускладнюється тим, що в різних типах ПС  вказані механізми дещо відрізняється і як правило офіційно не документуються. Але скрізь пошук реалізований на основі ключових слів, опису та метаданних сайту, занесених в БД ПС. Можливі шляхи поповнення вказаної БД полягають:

  1.  В реєстрації сайту спеціальним програмним агентом ПС.
  2.  В реалізації адміністратором сайту спеціальної процедури його реєстрації в ПС.
  3.  В спільному використанні шляхів 1 та 2.

Практичний досвід свідчить що для ПС www.google.com характерний перший шлях поповнення БД. При цьому в БД записуватись:

  •  Ключові слова та опис сторінок сайту, визначені за допомогою тегу <meta>.
    •  Декілька десятків слів визначених в тілі сторінки сайту. Вони використовуються в якості ключових слів.
    •  Метаданні сторінок сайту, визначені за допомогою відповідного RDF-опису.

Практичний досвід та аналіз документації розміщеної на відповідних порталах свідчать, що для ПС www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. характерний третій шлях поповнення БД. На відміну від  www.google.com, в них можуть використовуватись ключові  слова та опис задані в процесі реєстрації сайту його адміністратором. Відзначимо, що в процесі реєстрації адміністратор має можливість включити сайт як правило до трьох різних тематичних категорій, що дозволяє дещо підвищити ефективність пошуку за рахунок зменшення його універсальності.

Механізм формування рейтингу сайту, також унікальний для кожної із ПС. Проте можливо визначити ряд найбільш важливих критеріїв які так чи інакше повинні бути використані. До вказаних критеріїв відносяться:

  •  Кількість відвідувачів сайту. Як показує практичний досвід це домінуючий критерій, що забезпечує високий рейтинг сайту в ПС www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. При цьому сайт має бути зареєстрований в них адміністратором, а на його сторінках повинні розміщуватись так звані "лічильники відвідувачів".
  •  Кількість слів запиту користувача, що відповідають ключовим словам, опису та метаданним сайту, що знаходяться в базі даних (БД) ПС. На наш погляд це домінуючий критерій в ПС www.google.com. Використовується в якості допоміжного критерію в ПС www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. Таким чином реєстраційні параметри сайту багато в чому визначають його рейтинг в ПС.
  •  Кількістю посилань на сайт з інших сайтів, зареєстрованих цією ПС. Використовується в якості допоміжного критерію в ПС www.aport.ru та www,yandex.ru.

Таким чином, якщо відкинути можливість несанкціонованої модифікації БД ПС та інших сайтів можливі напрямки санкціонованого впливу на ПС полягають в зміні реєстраційних параметрів сайту (збільшенні ключових слів,  опису та метаданих) та в збільшені зареєстрованих відвідувачів.

Механізм впливу на реєстраційні параметри сайту в ПС

Метою впливу на реєстраційні параметри є збільшення в БД ПС даних, релевантним запиту користувача ПС.  При цьому доцільно залучати до перегляду сайту і не цільову аудиторію, тобто сайт повинен мати високий рейтинг і в тому випадку коли в пошуковому запиті користувача не має слів, що відповідають його тематиці. Збільшення вказаних даних в звичайному випадку не можливе через те, що ПС заносять в свою БД реєстраційні параметри по закритому алгоритму. Досить часто в процесі реєстрації використовуються не тільки опис сайту виконаний за допомогою тегу <meta> та RDF-опису, але й текст визначений в тілі сторінок сайту. Таким чином в БД ПС записуються дані, що достатньо точно відповідають тематиці сайту. Відзначимо, що ПС реєструють не тільки головну сторінку сайту. Тому для збільшення популярності сайтів за рахунок не цільової аудиторії на окремих Web-сторінках розміщують популярну інформацію, наприклад спортивного характеру.  Недоліком такого підходу є суттєве збільшення витрат на розробку та підтримку сайту.  Виходом із цієї ситуації може стати розробка Web-сторінок які будуть записувати при реєстрації в БД ПС визначені додаткові параметри, але будуть перенаправляти запит користувача на головну сторінки сайту.  Програмна реалізація такої Web-сторінки, виконана за допомогою мови програмування Php, може мати наступний вигляд:

<?php  

if (eregi("Mozilla",$HTTP_USER_AGENT)) {

header("Location:http:/www.mydomen.com/index.htm");

}

?>

<html><head><title>Спорт</title></head>

<body>Короткий опис сайту присвяченого спорту </body></html>

При відкритті такого файлу спрацьовує скрипт Php в якому перевіряється чи міститься в змінній оточення Web-сервера HTTP_USER_AGENT слово Mozilla. Відзначимо, що  в означену змінну Web-сервером записується ім’я програмного агента, який звертається до Web-сторінки. Для перевірки використовується функція пошуку по шаблону eregi. Позитивний результат перевірки свідчить, що сайт відкривається за допомогою найбільш популярного браузера Microsoft Internet Explorer. Тому користувач переадресується на  головну сторінку сайту за адресою http:/www.mydomen.com/index.htm. Негативний результат з великою ймовірністю свідчить, що сторінка сайту реєструється ПС. В цьому випадку відповіддю є  інформація призначена для запису в БД ПС. Очевидно, що розробка та підтримка такої Web-сторінки не потребує великих зусиль. Звісно, що на практиці наведений програмний код потребує деякого вдосконалення. В першу чергу його слід додатково адаптувати до інших браузерів.   

Механізм впливу на зареєстровану в ПС кількість відвідувачів сайту

Практичний досвід свідчить, що всі популярні ПС використовують практично однакові механізми реєстрації кількості відвідувачів. Типовий механізм означеної реєстрації розглянемо на прикладі рейтингу Rambler's TopShop, що є складовою частиною www.rambler.ru. Для участі у цьому рейтингу на головній сторінці сайту адміністратором якого був автор розміщено програмний код:

<!--begin of TopShop counter-->

<img src="http://topshop-counter.rambler.ru/top100.cnt?11958" width=1 height=1>

<!--end of TopShop counter--><!--begin of TopShop logo-->

<a href="http://topshop.rambler.ru/go.html?ID=11958" target=_blank>

<img src="http://images.rambler.ru/topshop/ban/count-topshop-009.gif" width=88

height=31 alt="Rambler's TopShop" border=0></a>

<!--end of TopShop logo-->

Відзначимо, що означений програмний код було надіслано автору адміністрацією ПС після проходження реєстрації сайту. Аналіз даного коду дозволяє зробити висновок, що реєстрація нового відвідувача сайту реалізується при завантажені сторінки сайту на комп’ютер користувача, за рахунок звернення методом get до ресурсу http://topshop-counter.rambler.ru/top100.cnt. Очевидно, що параметр ID=11958 є унікальним ідентифікатором сайту в ПС. Відповідно протоколу TCP/IP, що використовується в мережі Web, ПС здатна ідентифікувати адресу користувача. При цьому більшість ПС не реєструють звернення з однієї адреси, якщо вони реалізовані за невеликий проміжок часу. Таким чином для збільшення кількості зареєстрованих ПС відвідувачів сайту достатньо створити прикладну програму яка буде інсценувати часте відкриття різними користувачами сторінок сайту. Для цього програма повинна досить часто відповідно протоколу TCP/IP методом get звертатись до відповідного реєстраційного ресурсу. При звернені необхідно використовувати  параметри, що санкціоновано надаються ПС адміністратору сайту після реєстрації. В кожному звернені доцільно програмним шляхом змінювати зворотню адресу інсценованого користувача. Створення такої програми засобами середовища програмування Microsoft VC++.NET з використання бібліотеки для роботи з Internet afxinet не викликає особливих труднощів.

Висновки

Концепція атаки Web-орієнтованих ПС передбачає підвищення рейтингу сайтів за рахунок збільшення:

  •  Реєстраційних параметрів (ключових слів, опису, метаданих) сайту в ПС.
  •  Зареєстрованої в ПС кількості відвідувачів сайту.

Для реалізації даної концепції необхідно застосувати спеціальні програмні засоби, алгоритм функціонування та програмний код яких наведено. Використання запропонованої концепції дозволить суттєво збільшити обсяг користувачів сайту.

Перспективи подальших розвиток у даному напрямку полягають в доведені запропонованої концепції до практичного застосування.

Література

  1.  Жигалов В. Как нам обустроить поиск в сети? // Открытые системы. – 2000. №12. – С. 53 – 61.
  2.  Терейковський І.А. Підвищення ефективності функціонування корпоративних Web-сайтів // Вісник КНУТД. - 2004. №4.- С.41 - 46.
  3.  Терейковський І.А. Оптимізація структури та змісту корпоративних Web-сайтів // Вісник КНТЕУ. - 2004. №3. - С.95 -104.
  4.  Рогушина Ю.В., Гришанова И.Ю. Разработка принципов представления электронных изданий, обеспечивающих корректную индексацию  поисковыми системами Интернета // Проблеми програмування. – 2004. №4. – С. 39 – 48.


 

А также другие работы, которые могут Вас заинтересовать

24965. Аренда недвижимости 56 KB
  По договору аренды предприятия в целом как имущественного комплекса используемого для осуществления предпринимательской деятельности арендодатель обязуется предоставить арендатору за плату во временное владение и пользование земельные участки здания сооружения оборудование и другие входящие в состав предприятия основные средства передать в порядке на условиях и в пределах определяемых договором запасы сырья топлива материалов и иные оборотные средства права пользования землей водой и другими природными ресурсами зданиями...
24966. Договор строительного подряда. Понятие и предмет договора 70.5 KB
  Договор строительного подряда. По договору строительного подряда одна сторона подрядчик обязуется в установленный договором срок построить по заданию заказчика определенный объект либо выполнить иные строительные работы а другая сторона заказчик обязуется создать подрядчику необходимые условия для выполнения работ принять их результат и уплатить обусловленную цену п. основной отличительный признак договора строительного подряда характер работ и особая область в которой они осуществляются. Следовательно выполнение монтажных работ...
24967. Сравнительная характеристика договоров поручения, комиссии и агентского договора. Значение этих договоров 55.5 KB
  Сравнительная характеристика договоров поручения комиссии и агентского договора.971 ГК легальное определение дра поручения. и фактических действий; 2 длящийся харр; 3 агент действует либо от своего имени и за счет принципала модель отношений дра комиссии либо от имени и за счет принципала модель отношений дра поручения но при этом агентский договор никогда не носит личнодоверительного характера. деятти хотя бы одним из его учв поручение всегда возмездно если только в самом дре не предусмотрено иное; 3 отношения учв...
24968. Государственный контракт на выполнение подрядных работ для государственных нужд 54.5 KB
  Заказчик уполномоченный орган вправе размещать заказ путем проведения закрытого конкурса аукциона исключительно в случае размещения заказа на поставку товаров выполнение работ оказание услуг сведения о которых составляют государственную тайну. При этом создание комиссии по размещению заказа определение начальной цены контракта предмета и его существенных условий утверждение проекта контракта конкурсной документации документации об аукционе определение условий торгов и их изменение осуществляются заказчиком уполномоченным органом а...
24969. Договор займа и кредитный договор 36 KB
  Договор займа и кредитный договор 1. Понятие Договор займа кредитный договор и договор факторинга оформляют единые экономические кредитные отношения. По договору займа одна сторона заимодавец передает в собственность другой стороне заемщику деньги или другие вещи определенные родовыми признаками а заемщик обязуется возвратить заимодавцу такую же сумму денег сумму займа или равное количество других полученных им вещей того же рода и качества абз. Эта сделка: односторонняя заемщик обязан возвратить сумму займа а займодавец имеет...
24970. Кредитный договор 50.5 KB
  Именно поэтому закон говорит о предоставлении кредита в виде денежных средств п. Вознаграждение кредитору определяется в виде процентов начисленных на сумму кредита за все время его фактического использования. Обязанности заемщика состоят в возврате полученного кредита и уплате предусмотренных договором или законом процентов за его использование. Законом определяется момент исполнения заемщиком обязанности по возврату суммы кредита п.
24971. Договор лизинга (понятие, содержание, виды) 47.5 KB
  Договор лизинга понятие содержание виды Понятие признаки содержание. Договор лизинга является двусторонним взаимным консенсуальным возмездным. Лизингодатель не имеет прямой заинтересованности в конкретном имуществе являющемся предметом лизинга. Главной обязанностью лизингодателя по договору лизинга является финансирование покупки предмета лизинга и получение прибыли на вложенные деньги.
24972. Договор финансирования под уступку денежного требования (факторинг) 41 KB
  Договор финансирования под уступку денежного требования факторинг Договор факторинга является новым для нашего правопорядка. Юридическая сущность этих отношений составляет уступка денежного требования давно известная в обязательственном праве в качестве цессии. Выделяют нераскрытый факторинг должник не знает о состоявшейся уступке прав поскольку фактор здесь не вправе взыскивать долг с должника своего клиента уступки требования здесь не происходит должник осуществляет платеж первоначальному кредитору.829 закреплено что уступка...
24973. Опытное обоснование основных положений МКТ строения вещества. Масса и размер молекул. Постоянная Авогадро 27.5 KB
  Микрохарактеристики вещества. Молекулярнокинетическая теория это раздел физики изучающий свойства различных состояний вещества основывающийся на представлениях о существовании молекул и атомов как мельчайших частиц вещества. Все вещества состоят из мельчайших частиц: молекул атомов или ионов.