10075

Концепція атаки web-орієнтованих пошукових систем

Научная статья

Информатика, кибернетика и программирование

Концепція атаки web-орієнтованих пошукових систем І.А. Терейковський Запропонована нова концепція активного впливу атаки на популярні вітчизняні та закордонні Web-орієнтовані пошукові системи з метою підвищення рейтингу зареєстрованих в них сайтів. Доведено що для вп

Украинкский

2013-03-20

57.5 KB

0 чел.

Концепція атаки web-орієнтованих пошукових систем

І.А.Терейковський

Запропонована нова концепція активного впливу (атаки) на популярні вітчизняні та закордонні Web-орієнтовані пошукові системи з метою підвищення рейтингу зареєстрованих в них сайтів. Доведено, що для впливу на рейтинг сайту в пошукових системах можливо використати особливості механізму підрахунку кількості користувачів та механізму формування реєстраційних параметрів сайту. Наведено алгоритм функціонування програмних засобів здійснення атаки. Показано приклад програмної реалізації.

Вступ

 За останні роки мережа Internet, а особливо її найбільш популярна частина Web стала одним із основних місць публікації різноманітної інформації. Як правило ця інформація  публікується у вигляді Web-сайтів, що стали невід’ємною та важливою складовою частиною практично всіх корпоративних комп’ютерних мереж. На сьогодні в мережі Web функціонує декілька мільйонів сайтів, причому їх кількість постійно збільшується. Велика кількість сайтів та специфіка визначення їх адрес призвела до необхідності забезпечення доступності інформації опублікованої в мережі Web, що і є загальною проблемою представленої наукової роботи. Проблема безпосередньо пов'язана з таким глобальним науково — практичним напрямом,  як створення ефективних Web — орієнтованих корпоративних комп’ютерних мереж.

Напрямки вирішення означеної проблеми базуються на дослідженні шляхів того, яким чином користувачі Web-сайту можуть отримати доступ до його сторінок, тобто взнати про його адресу.  В [1, 2, 3, 4] відзначено, що в теперішній час, в більшості випадків основним джерелом знань про адреси сайтів комерційного спрямування є так звані пошукові системи (ПС). Найбільшою популярністю серед вітчизняних користувачів користуються ПС  www.google.com, www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. Принцип їх використання полягає в визначенні користувачем пошукових запитів та у формуванні ПС списку знайдених адрес, з коротким описом змісту відповідних сайтів. Даний список дістав назву рейтингу сайтів. Дослідження [1, 2, 3, 4] показали, що в більшості випадків користувачі відвідують тільки 10-20 перших  адрес із списку. По цій причині, рейтинг сайту в ПС безпосередньо впливає на кількість його відвідувачів яка в свою чергу використовується в якості одного із критеріїв ефективності  функціонування комерційних сайтів [2]. З іншої точки зору, низький рейтинг сайту можна розцінити як загрозу доступності розміщених на ньому інформаційних ресурсів.  Таким чином, функціонування ПС в значній мірі впливає на ефективність, надійність та захищеність Web-сайтів корпоративних комп’ютерних мереж.

На сьогодні проблема підвищення рейтингу сайту вирішується в основному за рахунок ефективної реєстрації в ПС, оптимізації його змісту, продуманого опису сайту та ключових слів сайту за допомогою тегу meta, залучення нецільової аудиторії за допомогою того ж таки тегу <meta>, вибору доменного імені, семантичної насиченості HTML-коду, створенням метаданих, що описують конвент сайту та забезпечують автоматичну інтерпретацію його семантики [2, 3, 4]. Аналіз цих заходів вказує, що всі вони орієнтовані на адаптацію сайту до методики формування рейтингу ПС, тобто носять односторонній пасивний характер. Ці обставини накладають певні обмеження на реалізацію та результати застосування означених заходів. Наприклад, при реєстрації сайту в ПС можливо використовувати тільки обмежену кількість ключових слів. Обсяг опису сайту за допомогою тегу <meta> також обмежений. Крім того методика формування рейтингу кожної з ПС має певну специфіку, яка може час від часу змінюватись.  Тобто, високий рейтинг сайту в одній із популярних ПС не свідчить про високий рейтинг в інших системах.  Таким чином відсутність в системі підвищення рейтингу активної складової є однією із не вирішених частин проблеми підвищення доступності інформації опублікованої в мережі Web.

Постановка задачі

Розробка концепції активного впливу (атаки) на Web-орієнтовані ПС з метою  підвищення рейтингу зареєстрованого в них сайту. Концепція повинна враховувати особливості функціонування і формування рейтингу популярними ПС та бути орієнтована на реалізацію програмними засобами.

Аналіз можливих напрямів атаки

Популярні ПС представляють собою сучасні розподілені  комп’ютерні системи, що використовують добре захищене та високонадійне апаратне та програмне забезпечення, яке обслуговується висококваліфікованим персоналом. Безперспективність зміни рейтингу сайту за рахунок несанкціонованого доступу та модифікації відповідних даних в ПС не викликає сумніву. На наш погляд єдиним напрямком атаки є використання санкціонованих шляхів впливу адміністратора сайту на ПС. Для виявлення вказаних шляхів слід проаналізувати механізм пошуку по ключовим словам та механізм формування рейтингу сайтів. Завдання ускладнюється тим, що в різних типах ПС  вказані механізми дещо відрізняється і як правило офіційно не документуються. Але скрізь пошук реалізований на основі ключових слів, опису та метаданних сайту, занесених в БД ПС. Можливі шляхи поповнення вказаної БД полягають:

  1.  В реєстрації сайту спеціальним програмним агентом ПС.
  2.  В реалізації адміністратором сайту спеціальної процедури його реєстрації в ПС.
  3.  В спільному використанні шляхів 1 та 2.

Практичний досвід свідчить що для ПС www.google.com характерний перший шлях поповнення БД. При цьому в БД записуватись:

  •  Ключові слова та опис сторінок сайту, визначені за допомогою тегу <meta>.
    •  Декілька десятків слів визначених в тілі сторінки сайту. Вони використовуються в якості ключових слів.
    •  Метаданні сторінок сайту, визначені за допомогою відповідного RDF-опису.

Практичний досвід та аналіз документації розміщеної на відповідних порталах свідчать, що для ПС www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. характерний третій шлях поповнення БД. На відміну від  www.google.com, в них можуть використовуватись ключові  слова та опис задані в процесі реєстрації сайту його адміністратором. Відзначимо, що в процесі реєстрації адміністратор має можливість включити сайт як правило до трьох різних тематичних категорій, що дозволяє дещо підвищити ефективність пошуку за рахунок зменшення його універсальності.

Механізм формування рейтингу сайту, також унікальний для кожної із ПС. Проте можливо визначити ряд найбільш важливих критеріїв які так чи інакше повинні бути використані. До вказаних критеріїв відносяться:

  •  Кількість відвідувачів сайту. Як показує практичний досвід це домінуючий критерій, що забезпечує високий рейтинг сайту в ПС www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. При цьому сайт має бути зареєстрований в них адміністратором, а на його сторінках повинні розміщуватись так звані "лічильники відвідувачів".
  •  Кількість слів запиту користувача, що відповідають ключовим словам, опису та метаданним сайту, що знаходяться в базі даних (БД) ПС. На наш погляд це домінуючий критерій в ПС www.google.com. Використовується в якості допоміжного критерію в ПС www.meta.ua, www.rambler.ru, www.aport.ru, www,yandex.ru. Таким чином реєстраційні параметри сайту багато в чому визначають його рейтинг в ПС.
  •  Кількістю посилань на сайт з інших сайтів, зареєстрованих цією ПС. Використовується в якості допоміжного критерію в ПС www.aport.ru та www,yandex.ru.

Таким чином, якщо відкинути можливість несанкціонованої модифікації БД ПС та інших сайтів можливі напрямки санкціонованого впливу на ПС полягають в зміні реєстраційних параметрів сайту (збільшенні ключових слів,  опису та метаданих) та в збільшені зареєстрованих відвідувачів.

Механізм впливу на реєстраційні параметри сайту в ПС

Метою впливу на реєстраційні параметри є збільшення в БД ПС даних, релевантним запиту користувача ПС.  При цьому доцільно залучати до перегляду сайту і не цільову аудиторію, тобто сайт повинен мати високий рейтинг і в тому випадку коли в пошуковому запиті користувача не має слів, що відповідають його тематиці. Збільшення вказаних даних в звичайному випадку не можливе через те, що ПС заносять в свою БД реєстраційні параметри по закритому алгоритму. Досить часто в процесі реєстрації використовуються не тільки опис сайту виконаний за допомогою тегу <meta> та RDF-опису, але й текст визначений в тілі сторінок сайту. Таким чином в БД ПС записуються дані, що достатньо точно відповідають тематиці сайту. Відзначимо, що ПС реєструють не тільки головну сторінку сайту. Тому для збільшення популярності сайтів за рахунок не цільової аудиторії на окремих Web-сторінках розміщують популярну інформацію, наприклад спортивного характеру.  Недоліком такого підходу є суттєве збільшення витрат на розробку та підтримку сайту.  Виходом із цієї ситуації може стати розробка Web-сторінок які будуть записувати при реєстрації в БД ПС визначені додаткові параметри, але будуть перенаправляти запит користувача на головну сторінки сайту.  Програмна реалізація такої Web-сторінки, виконана за допомогою мови програмування Php, може мати наступний вигляд:

<?php  

if (eregi("Mozilla",$HTTP_USER_AGENT)) {

header("Location:http:/www.mydomen.com/index.htm");

}

?>

<html><head><title>Спорт</title></head>

<body>Короткий опис сайту присвяченого спорту </body></html>

При відкритті такого файлу спрацьовує скрипт Php в якому перевіряється чи міститься в змінній оточення Web-сервера HTTP_USER_AGENT слово Mozilla. Відзначимо, що  в означену змінну Web-сервером записується ім’я програмного агента, який звертається до Web-сторінки. Для перевірки використовується функція пошуку по шаблону eregi. Позитивний результат перевірки свідчить, що сайт відкривається за допомогою найбільш популярного браузера Microsoft Internet Explorer. Тому користувач переадресується на  головну сторінку сайту за адресою http:/www.mydomen.com/index.htm. Негативний результат з великою ймовірністю свідчить, що сторінка сайту реєструється ПС. В цьому випадку відповіддю є  інформація призначена для запису в БД ПС. Очевидно, що розробка та підтримка такої Web-сторінки не потребує великих зусиль. Звісно, що на практиці наведений програмний код потребує деякого вдосконалення. В першу чергу його слід додатково адаптувати до інших браузерів.   

Механізм впливу на зареєстровану в ПС кількість відвідувачів сайту

Практичний досвід свідчить, що всі популярні ПС використовують практично однакові механізми реєстрації кількості відвідувачів. Типовий механізм означеної реєстрації розглянемо на прикладі рейтингу Rambler's TopShop, що є складовою частиною www.rambler.ru. Для участі у цьому рейтингу на головній сторінці сайту адміністратором якого був автор розміщено програмний код:

<!--begin of TopShop counter-->

<img src="http://topshop-counter.rambler.ru/top100.cnt?11958" width=1 height=1>

<!--end of TopShop counter--><!--begin of TopShop logo-->

<a href="http://topshop.rambler.ru/go.html?ID=11958" target=_blank>

<img src="http://images.rambler.ru/topshop/ban/count-topshop-009.gif" width=88

height=31 alt="Rambler's TopShop" border=0></a>

<!--end of TopShop logo-->

Відзначимо, що означений програмний код було надіслано автору адміністрацією ПС після проходження реєстрації сайту. Аналіз даного коду дозволяє зробити висновок, що реєстрація нового відвідувача сайту реалізується при завантажені сторінки сайту на комп’ютер користувача, за рахунок звернення методом get до ресурсу http://topshop-counter.rambler.ru/top100.cnt. Очевидно, що параметр ID=11958 є унікальним ідентифікатором сайту в ПС. Відповідно протоколу TCP/IP, що використовується в мережі Web, ПС здатна ідентифікувати адресу користувача. При цьому більшість ПС не реєструють звернення з однієї адреси, якщо вони реалізовані за невеликий проміжок часу. Таким чином для збільшення кількості зареєстрованих ПС відвідувачів сайту достатньо створити прикладну програму яка буде інсценувати часте відкриття різними користувачами сторінок сайту. Для цього програма повинна досить часто відповідно протоколу TCP/IP методом get звертатись до відповідного реєстраційного ресурсу. При звернені необхідно використовувати  параметри, що санкціоновано надаються ПС адміністратору сайту після реєстрації. В кожному звернені доцільно програмним шляхом змінювати зворотню адресу інсценованого користувача. Створення такої програми засобами середовища програмування Microsoft VC++.NET з використання бібліотеки для роботи з Internet afxinet не викликає особливих труднощів.

Висновки

Концепція атаки Web-орієнтованих ПС передбачає підвищення рейтингу сайтів за рахунок збільшення:

  •  Реєстраційних параметрів (ключових слів, опису, метаданих) сайту в ПС.
  •  Зареєстрованої в ПС кількості відвідувачів сайту.

Для реалізації даної концепції необхідно застосувати спеціальні програмні засоби, алгоритм функціонування та програмний код яких наведено. Використання запропонованої концепції дозволить суттєво збільшити обсяг користувачів сайту.

Перспективи подальших розвиток у даному напрямку полягають в доведені запропонованої концепції до практичного застосування.

Література

  1.  Жигалов В. Как нам обустроить поиск в сети? // Открытые системы. – 2000. №12. – С. 53 – 61.
  2.  Терейковський І.А. Підвищення ефективності функціонування корпоративних Web-сайтів // Вісник КНУТД. - 2004. №4.- С.41 - 46.
  3.  Терейковський І.А. Оптимізація структури та змісту корпоративних Web-сайтів // Вісник КНТЕУ. - 2004. №3. - С.95 -104.
  4.  Рогушина Ю.В., Гришанова И.Ю. Разработка принципов представления электронных изданий, обеспечивающих корректную индексацию  поисковыми системами Интернета // Проблеми програмування. – 2004. №4. – С. 39 – 48.


 

А также другие работы, которые могут Вас заинтересовать

76483. Прекращение и изменение брачного договора 15.33 KB
  Соглашение об изменении или о расторжении брачного договора совершается в той же форме что и сам брачный договор т. Односторонний отказ от исполнения брачного договора не допускается. Может возникнуть ситуация когда супруги не пришли к обоюдному соглашению о расторжении брачного договора.
76484. Признание брачного договора недействительным 18.76 KB
  Брачный договор может быть признан судом недействительным в случае: признания брака недействительным; если условия договора ставят одного из супругов в крайне неблагоприятное положение; по основаниям предусмотренным ст. На признание брачного договора действительным или недействительным распространяются соответствующие нормы ГК РФ о действительности и недействительности сделок. Брачный договор может быть признан недействительным по иску супруга чьи права и законные интересы были нарушены в результате заключения договора: в состоянии...
76485. Обращение взыскание на имущество супругов. Гарантии прав кредиторов при заключении брачного договора 18.08 KB
  Таким имуществом в частности являются движимые и недвижимые вещи ценные бумаги паи доли в капитале внесенные в кредитные или иные коммерческие организации и любое другое нажитое в период брака имущество независимо от того на имя кого из супругов оно приобретено. 256 ГК РФ по обязательствам одного из супругов взыскание может быть обращено на его долю в общем имуществе супругов которая причиталась бы этому супругу при разделе имущества. 39 СК РФ доли супругов при разделе общего имущества признаются равными если иное не предусмотрено...
76486. Основания, порождающие родительские правоотношения 15.58 KB
  Законом предусмотрена государственная регистрация рождения ребенка в органах записи актов гражданского состояния по месту рождения ребенка или по месту жительства его родителей одного из них. Происхождение ребенка от матери устанавливается не медицинским учреждением а органом записи актов гражданского состояния на основании справки или иного документа выдаваемого тем медицинским учреждением в стенах которого родился ребенок. Государственная регистрация рождения ребенка производится по месту жительства родителей или одного из них. Сведения...
76487. Установление происхождения ребенка, родившегося в браке 14.71 KB
  Лишь после регистрации рождения происхождение ребенка становится юридическим фактом и может порождать правовые последствия. Состояние матери ребенка в зарегистрированном браке дает основание полагать что отцом ребенка является супруг матери. При государственной регистрации рождения ребенка предъявляется документ являющийся основанием для внесения сведений об отце в запись акта о регистрации рождения.
76488. Регистрация рождения ребенка, рожденного вне брака 14.59 KB
  Таким образом с формальноюридической точки зрения совместная жизнь в зарегистрированном браке и в гражданском браке – две большие разницы. Что же касается темы отцы и дети то здесь закон преследуя интересы несовершеннолетних устанавливает принцип равенства прав детей рожденных в браке и вне брака. Статья 53 СК РФ определяет что дети родившиеся у лиц не состоящих между собой в браке имеют по отношению к своим родителям и их родственникам такие же права и обязанности как и дети рожденные в браке.
76489. Установление отцовства и факта признания отцовства 17.18 KB
  Если же предполагаемый отец умер то речь идет уже об установлении факта отцовства или факта признания отцовства. Если при рассмотрении заявления в суде будет установлено что лицо при жизни признавало своё отцовство материнство в отношении ребенка то суд удовлетворяет заявление и признает факт отцовства или факт признания отцовства. Порядок судебного установления отцовства При наличии какого-либо спора установление отцовства осуществляется в судебном порядке по иску заинтересованного лица.
76490. Оспаривание отцовства и (или) материнства 15.82 KB
  Запись акта о рождении ребенка с указанием сведений о его родителях является доказательством происхождения ребенка от конкретных лиц: женщины и мужчины. Например в силу действующей в семейном праве презумпции отцом ребенка был записан муж его матери однако фактическим отцом он не является поскольку в момент зачатия ребенка проходил военную службу в другой местности. Или в случае подмены ребенка в роддоме когда ни супруг ни супруга зарегистрированные в качестве родителей ребенка не являются его биологическими родителями. При...
76491. Личные права несовершеннолетнего ребенка 14 KB
  К ним относятся: право ребенка жить и воспитываться в семье п. 54 СК РФ; право ребенка на общение с родителями дедушкой бабушкой братьями сестрами и другими родственниками ст. 55 СК РФ; право ребенка на защиту своих прав и законных интересов ст.