40055

Управление информационными ресурсами предприятия и источники данных

Лекция

Информатика, кибернетика и программирование

Управление информационными ресурсами предприятия и источники данных. Информационные хранилища данных. Загрузка данных в хранилище. Развитие систем управления базами данных.

Русский

2013-10-15

665 KB

95 чел.

Учебный курс «Информационные системы в экономике»

Тема 4.

Управление информационными ресурсами предприятия

и источники данных.

В материалах темы рассмотрены:

1. Понятие информационного менеджмента.

1.1. Информационный менеджмент – элемент современного информационного обеспечения.

1.2. Информационное обеспечение системы управления экономическим объектом.

2. Информационные ресурсы предприятия и способы их хранения.

2.1. Информационные ресурсы предприятия.

2.2. Информационные хранилища данных.

2.3. Загрузка данных в хранилище.

3. Развитие систем управления базами данных.

3.1. СУБД ведущих производителей.

4. Применение СУБД для построения хранилищ данных.

4.1. Построение информационных хранилищ данных.

4.2. Основные компоненты информационного хранилища.

4.3. Проблемы интеграции данных в хранилище.

4.4. Анализ рынка поставщиков СУБД в России.

5. Источники данных для информационной деятельности предприятия.

6. Легальные источники информации для деловой разведки.

7. Методы и правовые основы сбора информации.

7.1. Методы сбора информации.

7.2. Законодательная основа информационно-аналитической работы.

1. Понятие информационного менеджмента.

1.1. Информационный менеджмент – элемент современного информационного обеспечения.

В соответствии с современным подходом в использовании информационных технологий к системе управления экономическим объектом может быть рассмотрена как совокупность объекта управления и субъекта управления. Например, в качестве объекта управления может выступать деятельность предприятия, а в качестве субъекта управления – управленческий аппарат предприятия. Между субъектом управления и объектом управления существует прямая и обратная взаимосвязь, выражающаяся в обмене информационными сообщениями [1, 2] (рис.1).

Рис.1 – Укрупненная структура системы управления.

Управленческий аппарат на основе информации, полученной из внешней среды, изучает сложившуюся экономическую ситуацию и в зависимости от целей управления передает соответствующие указания объекту управления. В ответ на полученные указания объект управления передает субъекту управления отчеты о том, как выполняются полученные управленческие решения и насколько серьезно сказывается на деятельности объекта управления отчеты, анализирует их, контролирует ход выполнения намеченных целей, в случае необходимости ищет пути по регулированию сложившейся ситуации и планирует дальнейшую деятельность объекта управления, формируя новые указания и передавая их обратно объекту управления. Таким образом, между субъектом управления и объектом управления образуется постоянный обмен информационными сообщениями. И для системы управления крайне важным становится качественное и своевременное информационное обеспечение. В связи с этим, в последнее время все большее внимание уделяется информационному менеджменту [3].

Информационный менеджмент – управление информацией с целью повышения эффективности принимаемых управленческим аппаратом решений.

Практическую работу по построению современных систем управления информационными потоками в организациях предлагается проводить с использованием методологии информационного менеджмента.

Информационный менеджмент как научная дисциплина включает в себя достижения нескольких смежных научных дисциплин по отношению к управлению информацией в современных организациях, что позволяет на практике перейти к информационно-ориентированному типу организации, характерному для информационного общества.

Информационный менеджмент как новая методология построения системы управления информацией имеет фундаментальное значение для организаций и в качестве метаконцепции обладает значительным интегрирующим потенциалом.

С позиции системного подхода информационный менеджмент охватывает планирование, организацию, координацию и контроль информационной деятельности и процессов, а также коммуникации внутри организации с целью улучшения качества и эффективности ее работы, развития организации. Использование методологии информационного менеджмента позволит решить многие вопросы теории и практики управления информационными потоками в современных организациях, которые пока разделены барьерами между профессиональными областями, техникой и технологиями, обусловленными традициями и некачественным менеджментом. Единая методология позволит интегрировать различного рода информацию в общий информационный ресурс и построить эффективно действующую информационную инфраструктуру организации на базе массивов информационных ресурсов, информационных технологий, средств коммуникации и квалифицированных кадров с целью обеспечения с наименьшими затратами эффективного информационного обеспечения процессов управления.

Менеджер отвечает за то, чтобы компания использовала информацию в соответствии со своей стратегией.

Одной из главных задач информационного менеджмента является составление четкого представления о следующем [4]:

- какая информация (по содержанию);

- кому (какой категории потребителей);

- когда (к какому сроку или на каком этапе работы);

- в какой форме (на каком уровне свертывания) следует информацию представить, чтобы потребитель в имеющееся у него время смог ее с пользой усвоить.

Очень часто, после того как вся информация собрана и предоставлена специалистам, она оказывается практически бесполезной, так как собрано абсолютно не то, что требовалось. Причина этому: достаточно большой объем информации, которая может соответствовать по смыслу, и освоить ее все не всегда возможно, да и во всем предоставленном информационном потоке нет именно того, что так необходимо для решения задачи. Подобная ситуация сложилась потому, что очень часто считается, что чем больше выдается информации, тем лучше, а что с этой информацией делает специалист, - неважно.

Причина такого положения – недостаточный уровень исследований в области теории информационных потребностей.

Специалистам в различных предметных областях требуется разнообразная как по содержанию, так и по форме информация, но, несмотря на это, их профессиональные потребности обладают сходной структурой. Информационная потребность является структурированной, причем каждая из структурных составляющих требует особого подхода при определении «стратегии и тактики» информационного обслуживания. выделяют следующие составляющие:

1. Потребность в текущей и ретроспективной информации. Специалисту требуется постоянный приток новой информации, т.е. оперативное текущее информирование. Такое информирование позволяет в наибольшей степени подготовиться к принятию решений в сфере своей профессиональной деятельности, оперативно и адекватно реагировать на факторы, воздействующие на определенную ситуацию.

Потребность в текущей информации обусловливается профессиональной специализацией потребителя информации и выполняемыми им функциями и потому относительно стабильна. Отсюда и название запросов, выражающих эту потребность - постоянно действующие. В отличие от текущей потребность в ретроспективной информации возникает при необходимости непосредственного принятия решений в данной ситуации. В этом случае нередко требуется обращение к источникам, накопленным за целый ряд предыдущих лет. Запросы, выражающие потребность в ретроспективной информации, возникают у специалиста эпизодически, и называют их разовыми.

2. Потребность в узкотематической и широкотематической информации. Процесс специализации деятельности и дифференциация знаний приводит к постоянному сужению тематических рамок профессиональной информационной потребности.

Однако слишком узкая специализация влечет за собой ограниченность контроля за ситуацией, потерю качества принимаемых решений из-за потери контроля над целым рядом факторов, на первый взгляд, не относящихся к заданной теме. По этой причине специалистам необходима как узкотематическая информация, непосредственно относящаяся к той конкретной поставленной задаче, решением которой они заняты, так и широкотематическая, создающая представление об объекте исследования или разработки в целом.

Потребность в узкотематической информации выражается в запросах предметного характера (в соответствии с предметной областью), потребность в широкотематической информации – в запросах ознакомительного характера.

3. Потребность в отраслевой (специализированной) и межотраслевой (специализированной, смежной) информации. Большинство наиболее актуальных проблем решается путем использования не только профильной информации, не выходящей за рамки данной отрасли знания, но и значительного объема смежной, межотраслевой информации, из других отраслей знания, казалось бы, очень отдаленных. Потребность в отраслевой информации выражается в запросах профильного характера, в межотраслевой (смежной) – непрофильного характера.

4. Потребность в фактографической и концептуальной информации. В первом случае – это потребность в различных сведениях, которые извлекаются потребителем из первичных и вторичных документов, справочников и других источников информации. Однако часто бывают случаи, когда потребителю нужны не просто сведения, но и оценка, интерпретация этих сведений другим специалистом – с точки зрения их истинности и достоверности, технико-экономической целесообразности и перспективности, т.е. необходима концептуальная информация. Особенно нуждаются в такой концептуальной информации руководители при принятии решений.

Потребность в фактографической информации выражается в запросах фактографического характера, в концептуальной – концептуального характера.

Рассмотренные выше структурные составляющие представлены в виде схемы [5] (рис.2).

Рис.2 – Формальная схема структуры информационной потребности.

1.2. Информационное обеспечение системы управления экономическим объектом.

Любая система управления экономическим объектом имеет дело с двумя видами информации: внешней (информация о внешней среде) и внутренней (циркулирующей между управленческим аппаратом и объектом управления).

Для внешней информации характерны приблизительность, неточность, обрывистость, противоречивость. В основном она касается состояния рынка и конкурентов, прогнозов процентных ставок и цен, налоговой политики и политической ситуации. По своей природе такая информация носит вероятностный характер, и поэтому ее обработка стандартными программными средствами затруднена. Это потребовало создания особых информационных систем, получивших название экспертных. Такие системы способны давать точные выводы на основе недетерминированной информации.

Внутренняя информация возникает в самой системе управления и отражает в различные временные интервалы развития объекта управления его финансово-хозяйственное состояние и директивные цели на случай отклонений от установленных параметров. Как правило, эти данные измеряются, и в управленческих документах фиксируется точная информация.

В зависимости от уровня управления используются различные виды информации. Так, для высшего руководства, разрабатывающего стратегию деятельности, применяется в основном внешняя и в меньшем объеме внутренняя информация. На оперативном уровне используется только внутренняя, а на среднем – большей частью внутренняя и частично – внешняя. Эти виды информации хранятся на своих носителях, составляя информационную базу, на основе которой функционирует программное обеспечение, позволяющее автоматизировать деятельность экономического объекта. Информационная база состоит из двух взаимосвязанных частей: внемашинной и внутримашинной.

К внемашинной относится та часть, которая обслуживает систему управления в виде, воспринимаемом человеком без каких-либо технических средств, например, документы (акты, накладные, счета, ведомости и т.п.).

Внутримашинная информационная база содержится на машинных носителях и состоит из файлов.

Файл – это совокупность данных, хранящаяся в электронной форме по определенным правилам.

Она может быть создана либо как множество локальных, т.е. независимых, файлов, каждый из которых отражает некоторое множество однородных управленческих документов (например, счетов-фактур), либо как база данных. Разница состоит в том, что при создании базы данных файлы не являются независимыми, ибо структура одних файлов (состав записей) зависит от структуры других. Это служит причиной несоответствия структуры файлов базы данных структуре управленческих документов, на основе которых эти файлы создаются. Файлы базы данных разрабатываются с соблюдением определенных принципов и ориентацией на одну из моделей базы данных (реляционную, иерархическую, сетевую). Файлы обрабатываются с помощью специального программного обеспечения – систем управления базами данных.

Все документы, имеющие отношение к экономической информационной системе, а также файлы внутримашинной информационной базы можно разбить на входные и результатные.

Входные документы, а значит, и получаемые на их основе файлы, в свою очередь, делятся на оперативные, где отражаются факты финансово-хозяйственной деятельности предприятия, и условно-постоянные, где указаны материальные, трудовые, технологические и прочие нормы и нормативы, а также все справочные данные (наименования, фамилии и др.).

Выходные документы и файлы также имеют свою классификацию. Они делятся на те, которые предназначены для применения конечным пользователем, для использования информационной системой при решении других задач (транзиты) и решении задач в последующий период. Кроме того, существуют вспомогательные, корректировочные файлы и рабочие, уничтожающиеся после каждого решения задачи.

Состав внутримашинной базы определяется исходя из информационных потребностей каждого уровня управленческого аппарата [1, 2] (рис.3).

Информационное обеспечение системы менеджмента – одна из важнейших обеспечивающих функций, качество которой является определяющим фактором обоснованности принимаемых решений и эффективности функционирования системы.

Рис.3 – Принципиальная структура корпоративной

информационной автоматизированной системы.

В процессе обмена информацией можно выделить четыре базовых элемента:

- отправитель – лицо, генерирующее идеи или собирающее информацию и передающее ее;

- сообщение – собственно информация, закодированная с помощью символов;

- канал – средство передачи информации;

- получатель – лицо, которому предназначена информация и которое интерпретирует ее.

При обмене информацией отправитель и получатель проходят несколько взаимосвязанных этапов: зарождение идеи; кодирование и выбор канала; передача; декодирование. Их задача – составить сообщение и использовать канал для его передачи таким образом, чтобы обе стороны поняли и разделили исходную идею. Это достаточно трудно, так как каждый этап является одновременно точкой, в которой смысл может быть искажен или полностью утрачен.

Пример. На рис.4 представлена принципиальная схема обмена информационными сообщениями на промышленном предприятии.

Рис.4 – Принципиальная схема обмена информационными сообщениями

на промышленном предприятии.

2. Информационные ресурсы предприятия и способы их хранения.

2.1. Информационные ресурсы предприятия.

Функционирующие на предприятии приложения реализуют заданные бизнес-правила с постоянно меняющимися параметрами. Для анализа деятельности предприятия необходимо сохранять агрегированные результаты бизнес-процессов.

Агрегированные результаты представляют собой укрупненные показатели, рассчитанные на основе детальных, например, объем продаж за месяц. Эта процедура позволяет заменить большое количество детальных записей в Хранилище на небольшое количество записей с итоговыми показателями.

Для возможно полного анализа деятельности предприятия и принятия стратегических решений необходимо изучать зависимость изменения основных показателей деятельности предприятия от множества влияющих на них факторов. Эти задачи позволяют решать новые информационные технологии. Они представляют собой различные типы приложений для анализа корпоративной информации. Такие приложения используют агрегированную и выверенную информацию о результатах деятельности корпорации за несколько лет. Специальные аппаратно-программные комплексы позволяют накапливать и структурировать информацию о бизнес-процессах. Все эти средства в совокупности и составляют систему управления информационными ресурсами предприятия. На рис.5 представлена общая схема, отображающая все этапы накопления, обработки и использования информационных ресурсов предприятия.

Рис.5 – Общая схема аппаратной реализации хранения информации.

В процессе деятельности предприятия данные из приложений, реализующих планирование производства, заказ материалов (ERP), реализующих взаимодействие с клиентами (CRM), управление поставками материалов и комплектующих (SCM) поступают в базы данных оперативной информации [5] (рис.6).

В рамках предприятия может существовать большое количество баз данных, реализованных средства разных СУБД. Они позволяют хранить информацию в структурированном виде, так что к ней легко можно реализовать запросы и строить отчеты. Однако такие отчеты отображают ситуацию «с одной стороны», так как строятся на основе информации одной базы, в них невозможно использование информации из внешних источников, например, аналитических обзоров.

Информация в базе может содержать ошибки, так как подвергается модификации и добавлению с рабочих мест операторов. Поэтому такие «сырые» данные не могут быть использованы для построения аналитических отчетов. Они должны быть предварительно обработаны. С этой целью информация извлекается из различных баз данных, выверяется, приводится к единому формату представления, агрегируется и помещается в информационное хранилище.

Именно информация хранилищ данных может быть использована для построения аналитических отчетов. Набор алгоритмов обработки информации и описание структур ее хранения в хранилище представляет собой метаданные. Эти метаданные хранятся в отдельной области, называемой репозиторий.

Рис.6 – Базы данных и информационное хранилище предприятия.

На физическом уровне (аппаратном) хранилище данных может быть реализовано как распределенное, т.е. включать в себя данные, расположенные в узлах разных локальных сетей. Хранилище на логическом уровне централизованно представляет всю информацию предприятия. Однако различные подразделения предприятий для построения отчетов используют разную информацию и анализируют ее на основе разных критериев. Витрины данных позволяют отображать информацию хранилища в соответствии со специфическими требованиями подразделений и настраивать способ ее отображения. Они содержат специфические для каждого подразделения подмножества всей информации, расположенной в хранилище. Информация выверена и агрегирована. Поэтому, в конечном счете, именно на базе витрин данных строятся отчеты с помощью различных приложений. Эти отчеты позволяют выполнять многомерный анализ данных (зависимость объемов продаж от региона, времени года, размера скидок), прогнозировать изменения основных показателей, выявлять ненадежных клиентов и т.д. Если данных в витрине недостаточно для построения отчета, пользователь может обратиться непосредственно к хранилищу данных. Такая архитектура средств хранения информации называется трехуровневой. Она позволяет упростить процедуру разграничения доступа пользователей к информации и увеличить скорость работы системы.

Рассмотрим более подробно основные составляющие информационного хранилища предприятия (рис.6).

Базы данных представляют собой информационное отображение предметной области (подразделений) предприятия. Они хранят характеристики объектов, функционирующих в подразделениях, результаты выполнения бизнес-процессов, отображают связи между объектами. Любой набор единообразно структурированных записей можно рассматривать как базу данных [6].

Например, записи в телефонном справочнике составляют базу данных. Таблица простой структуры, построенная в Excel, также является базой данных.

В каждый момент времени база данных должна быть актуальна, то есть отображать реальное состояние предметной области. На основе базы данных строятся оперативные отчеты, например, объемы товаров, отгруженные различным клиентам за последний месяц; или отчеты о клиентах, не выполнивших условия оплаты. Как видим, оба отчета содержат информацию о клиентах, но решают разные информационные задачи. Однако, в целях отсутствия дублирования, необходимо хранить информацию о клиентах (и других объектах предметной области) в одном экземпляре. В результате, между хранимыми данными и программой, формирующей конечный отчет, должен находиться промежуточный слой – Система управления базой данных (СУБД).

СУБД структурирует хранение информации об объекте, взаимосвязи между объектами, позволяет управлять данными, хранящимися в базе. СУБД представляет собой комплекс программных средств и встроенного языка программирования [7].

Таким образом, любая СУБД должна выполнять следующие основные функции:

- Создание информационных структур для хранения информации.

- Реализация запросов на выборку информации в соответствии с заданным критерием выборки.

- Создание отчетов с частичным анализом информации (вычислением промежуточных и итоговых сумм, группировкой записей и т.д.). Отчеты строятся на базе одной или нескольких информационных структур и предназначены для вывода на печать.

- Разработки электронных аналогов документов, используемых на предприятии (заказы, платежные поручения) и их автоматическое заполнение информацией из базы данных. Такие документы называются формами. Они предназначены для отображения в электронном виде.

- Содержать средства создания интерфейса пользователя. Эти средства позволяют создавать автоматизированное рабочее место служащего, например, панель инструментов, которые соответствуют производственным функциям, выполняемым служащим ежедневно. При нажатии кнопок инструментов могут автоматически создаваться отчеты, запросы, формы.

- Защита файлов базы данных с помощью паролей.

- Реализация многопользовательского доступа к информации базы данных.

Из перечисленных выше функций следует, что в основу каждой СУБД должны быть положены строгие правила структуризации информации на этапе ее хранения, правила доступа к этой информации и обработки информационных массивов, правила организации взаимосвязи между этими массивами. Совокупность этих правил составляет модель данных. Существуют иерархические, объектно-ориентированные, реляционные модели.

На сегодняшняя реляционная модель является самой распространенной и легко реализуемой даже в офисном приложении СУБД Access, которая предназначена для создания персональной информационной системы. При реляционном подходе вся совокупность данных об объектах предметной области рассматривается как множество. Существует раздел математики, где определены операции над такими множествами, также как в обычной алгебре определены операции умножения, сложения и т.д. Этот раздел математики называется реляционной алгеброй. Поэтому и модель данных, в которой определены операции реляционной алгебры, называется реляционной. Данные об объектах в этом случае отображаются в виде таблиц.

2.2. Информационные хранилища данных.

За последние годы предприятия накопили огромное количество информации с помощью приложений, которые заносят информацию о параметрах бизнес-процессов в базы данных и в корпоративных архивах документов. Если эту информацию никак не систематизировать, не представить в едином формате, ее невозможно использовать для анализа деятельности предприятия с целью принятия стратегических решений. Однако именно такие задачи возникают перед руководителями предприятий. Поэтому в начале 90-х годов Билл Инмон предложил концепцию Хранилищ данных. Он предложил разделить всю информацию корпорации на две категории [5]:

- оперативно меняющаяся информация, сосредоточенная в оперативных базах данных и ориентированная на бизнес-процессы;

- выверенная, неизменяемая информация, интегрированная из различных источников, предназначенная для анализа информации.

Было предложено следующее определение:

Информационное хранилище – это предметно-ориентированный, интегрированный, неизменяемый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений.

Из этого определения следуют основные свойства, которыми должно обладать Информационное хранилище:

- Предметная ориентированность. Модель данных Хранилища ориентирована на предметную область. Все направления деятельности компании разбиваются на предметные области, которые подлежат анализу. В результате, информация из различных источников, связанная с определенной предметной областью, собирается в одном месте. При этом данные согласовываются, очищаются, агрегируются. Такая их предварительная обработка упрощает задачу анализа информации и позволяет использовать большое количество данных.

- Интегрированность. Данные поступают в хранилище из различных файловых систем и оперативных баз данных, которые используют разные форматы хранения информации. Одни и те же характеристики объекта в разных базах могут иметь разное наименование. Интеграция объектов позволяет при помещении данных в хранилище использовать единый формат хранения информации, одинаковые наименования характеристик, одинаковые единицы измерения.

- Неизменчивость. Предварительно обработанные и помещенные в Хранилище данные могут использоваться только для чтения. Внесение в них изменений запрещено. Администратор хранилища по расписанию (ежедневно, еженедельно, ежемесячно) добавляет новые данные в Хранилище, но ранее добавленные остаются неизменными. При этом, точно известны источники их получения. Это приводит к повышению достоверности данных.

- Поддержка хронологии. Важнейшее свойство, которое позволяет не только выполнять хронологический анализ данных, но и прогнозировать развитие бизнеса. Здесь важно хранение в хронологическом порядке именно агрегированных показателей (например, объемов продаж за квартал). В Хранилище помещаются «снимки» состояния предметной области на какой-то момент времени. Процедура повторяется в соответствии с расписанием добавления информации в Хранилище. В результате менеджеры соответствующих направлений могут видеть хронологию изменения интересующих их параметров.

Рассмотрим структуру хранения информации в Хранилище. В таких базах информация располагается как бы в многомерном кубе («куб памяти»). Результаты бизнес-процессов являются фактами, которые характеризуются параметрами – мерами.

Например, факт продажи характеризуется мерами: полученная от продажи сумма, объем проданного товара. Факты зависят от измерений: квартала, артикула  товара, города (рис.7). Расположение информации в такой структуре напоминает расположение в электронной таблице (например, Excel). Если сделать, например, такие таблицы для каждого города (рис.7) и собрать их месте, тогда каждая такая таблица будет показывать динамику продаж в отдельно взятом городе в зависимости от квартала и артикула товара. Можно сделать «срезы» куба по кварталам или артикулам товара. Измерения могут быть организованы в иерархическую структуру [8] (рис.8). Это позволяет реализовывать более сложные запросы к базе. Информация об иерархии измерений хранится в области метаданных [5] (рис.6).

Рис.7 – Пример куба данных по мерам Квартал, Артикул, Город.

Такая структура хранения данных позволяет реализовать следующие типы запросов к базе:

- Средства реализации запросов для многомерных баз данных позволяют делать «срезы» информации для менеджеров разных направления.

Можно выбрать «срез» только для одного города, для одного артикула товара, для одного квартала. Возможен и одновременные показ трех и более размерностей, но это уже OLAP-технология.

- наличие иерархии измерения [4] (рис.8) позволяет реализовать запрос, указывая только одну из мер.

Например, можно указать страну или только год. При этом данные, соответствующие разным городам одной страны или разным кварталам одного года, агрегируются.

- Запросы из нескольких кубов, имеющих одинаковые измерения.

Рис.8 – Иерархия измерений.

При увеличении объемов хранимой информации время реализации запроса становится недопустимо большим. Для устранения этого недостатка используются так называемые «предвычисления». Поскольку чаще всего в отчетах используются агрегированные данные, заранее создается куб таких данных. При дополнении куба детальных данных новой информацией куб агрегированных показателей автоматически пересчитывается.

Для нашего примера может быть создан куб, где объемы продаж суммируются для каждого года и каждой страны. К нему и будут обращены наиболее частные запросы.

Как видим, многомерная модель хранения информации позволяет быстро реализовывать запросы, однако большие трудности вызывает изменение параметров куба. Поэтому часто для организации хранения информации в Хранилище используется реляционный подход.

В этом случае информация о фактах и измерениях хранится в отдельных плоских таблицах, связанных с помощью ключевых полей. Простейшая схема организации связей называется «звезда» [4] (рис.9). Эта же схема часто используется для хранения информации в витринах данных. Схема проектируется с учетом построения будущих аналитических запросов.

Рис.9 – Схема организации связи при реляционном подходе.

Для избежание дублирования информации и увеличения скорости реализации запросов используется иерархия размерностей, например, так как показано на рис.10.

Рис.10 – Иерархия размерности.

При использовании такой иерархии приходим к схеме типа «снежинка» (рис.11) [4], которая и помогает избежать дублирования информации. Характеристики повторяющихся данных хранятся в отдельных таблицах (например, регион) и связаны ключами с верхними уровнями иерархии размерностей.

Часто в Хранилищах используются все описанные выше технологии хранения информации. Схемы типа «звезда» и «снежинка» применяются для хранения детализированных данных, а многомерные базы применяются для хранения агрегированных данных (например, объемов продаж за месяц, реализованных в определенном регионе или стране).

Рис.11 – Иерархия типа «снежинка».

2.3. Загрузка данных в хранилище.

В процессе загрузки данных в Хранилище выполняется сбор данных, их преобразование (очистка, интегрирование), агрегирование. В Хранилище также хранится информация об источниках данных. Понятие и назначение агрегирования были описаны выше, поэтому подробнее рассмотрим первые три понятия.

Для выполнения функций сбора, преобразования и загрузки данных в Хранилище применяются специальные ETL (Extraction, Transformation, Loading) – комплексы программ. Эти комплексы извлекают информацию из оперативных баз данных различных типов, преобразуют ее в формат, поддерживаемый Хранилищем и загружают в Хранилище.

В процессе извлечения данных выполняется их чтение из баз данных оперативно меняющейся информации. Перед помещением данных в Хранилище, они должны быть очищены. Это один из этапов трансформации данных. Основная задача очистки – отсев неточных данных.

Что такое «грязные» данные? Например, при заполнении Базы данных Отдела кадров необходимо указывать Индивидуальный номер налогоплательщика. Не все работники имеют такой номер, однако поле формы является обязательным для заполнения. Поэтому оператор пишет фиктивные данные. Другим примером может служить указание устаревшего адреса сотрудника в базе.

Хранящиеся в базе данные могут выходить за пределы установленных в Хранилище для таких атрибутов значений.

Например, год приема на работу сотрудника предприятия не может быть меньше года создания предприятия.

Данные, помещаемые в Хранилище, должны быть абсолютно точными, поэтому они очищаются средствами специальных программ, составляющих метаданные, от ложной и устаревшей информации.

Объединение данных из различных баз представляет собой процедуру интегрирования. При этом надо привести к единому формату, например, структуру телефонных номеров, способ представления даты (дд/мм/гггг или мм/гг). в разных базах может быть использована разная аббревиатура для обозначения одного и того же клиента или разные значения ключевых полей. Как и в предыдущем случае, специальные программные комплексы, составляющие часть метаданных, автоматически преобразуют и объединяют данные из различных баз. В процессе преобразования данных перед загрузкой их в хранилище также могут создаваться новые поля, например, это поле для подсчета прибыли по сделке, если все необходимые данные находятся в полях оперативных баз данных, из которых извлекается информация [9].

Для выполнения вычислений могут быть использованы арифметические выражения со встроенными функциями, логические операции. В процессе выполнения преобразований данные хранятся в специальной промежуточной базе. После преобразования данных выполняется их загрузка в Хранилище из этой промежуточной базы.

Из всего сказанного выше следует, что аккуратно определенные метаданные являются основой заполнения и функционирования Информационного хранилища. Метаданные хранятся в репозитарии, который представляет собой отдельную базу данных, содержащую информацию о самом Хранилище. В репозитарии хранится информация о том, какие оперативные базы данных являются источниками информации, описана структура хранения информации в этих базах, хранятся программы преобразования данных и даже программы построения аналитических отчетов. Репозитарии может сохранять историю преобразования данных. В результате возможно не только определение источника данных Хранилища, но и восстановление выполненных над данными операций. Метаданные, хранящиеся в репозитарии, позволяют создавать информационно-справочные сервисы, показывающие изменения, происходящие в Хранилище.

Для примера, рассмотрим возможности службы репозитария, входящей в состав СУБД SQL (Server фирмы Microsoft) [10]. Служба представляет следующие возможности: средства для описания метаданных; процесс репозитария, который позволяет выполнять поиск метаданных, ведет историю изменения метаданных (например, вы можете определить, когда была изменена структура таблиц для хранения информации в Хранилище или структура аналитического отчета). В репозитарии также могут храниться: схемы данных, они иллюстрируют взаимосвязь объектов предметной области, что позволяет строить отчеты, содержащие информацию о разных объектах, каждый из которых описывается отдельной таблицей; оперативных баз – источников информации; схемы данных Хранилища; данные для многомерного анализа информации, программы извлечения, преобразования и загрузки данных в Хранилище.

Программы эти специфичны для каждого Хранилища и создаются с помощью службы DTS (Data Transformation Service). DTS позволяет создавать такие программы с помощью специального редактора, указывая в диалоговом режиме таблицы - источники и таблицы назначения в Хранилище. Необходимые преобразования описываются на специальном встроенном языке программирования.

Таким образом, очевидно, что системы управления базами данных являются основным элементом при построении единого хранилища любой корпоративной информационной системы предприятия, поэтому остановимся на них более подробно.

3. Развитие систем управления базами данных.

Любая современная организация имеет дело с огромным количеством данных, которые вводятся пользователями различных корпоративных приложений, а затем применяются сотрудниками для получения справочной информации, печати документов, анализа тех или иных аспектов деятельности компании. Зачастую конкурентоспособность компании и эффективность ее деятельности напрямую зависят от актуальности и доступности этих данных как для сотрудников самой компании, так и для ее клиентов и партнеров по бизнесу, поэтому задача хранения корпоративных данных сейчас актуальна как никогда.

Корпоративные данные большинства компаний, как правило, хранятся в базах данных, управляемых серверными СУБД.

Такая категория программного обеспечения, как системы управления базами данных, существует уже не один десяток лет – задача хранения данных возникла практически одновременно с появлением первых носителей данных. Данная категория продуктов существует практически для всех платформ, начиная с карманных компьютеров и обильных телефонов и заканчивая мэйнфреймами и суперкомпьютерами, и используется абсолютно во всех системах управления предприятиями и в других корпоративных приложениях.

Системы управления базами данных можно классифицировать различными способами: по принципу организации данных (реляционные, иерархические, сетевые, …), по способу доступа (однопользовательские и многопользовательские), по архитектуре (настольные и серверные), по функциональным возможностям и по возможностям, связанным с масштабируемостью [10].

В настоящее время наиболее часто применяются реляционные СУБД с архитектурой «клиент-сервер», хотя изредка еще можно встретить приложения, использующие настольные СУБД. Базы данных, управляемые настольными СУБД, обычно представляют собой файл или набор файлов, а сами СУБД являются набором библиотек, с помощью которых применяющие их приложения могут вносить изменения в эти файлы. Иногда настольные СУБД снабжаются также оболочкой для создания таблиц и иных объектов и даже для разработки простейших приложений, например, в случае Microsoft Access, наиболее популярной в настоящее время, именно оболочка, а не библиотека является коммерческим продуктом.

Однако корпоративные приложения для крупных и даже для средних предприятий, как правило, используют серверные СУБД в силу их большей надежности и масштабируемости. В простейшем случае информационная система, основанная на архитектуре «клиент-сервер», состоит из двух основных компонентов: сервера баз данных, управляющего данными и выполняющего поступающие от клиентских приложений запросы; и самих клиентских приложений, обеспечивающих интерфейс пользователя и посылающих запросы к серверу. Именно сервер баз данных может манипулировать файлами, в которых хранятся данные, выполнять пользовательские запросы, поддерживать ссылочную целостность данных, обеспечивать доступ к ним, осуществлять резервное копирование данных и протоколировать операции, связанные с их изменением. В более сложных случаях между клиентом и сервером может располагаться приложение промежуточного звена (middleware), функции которого весьма разнообразны – от разграничения доступа к данным до реализации достаточно сложной бизнес-логики.

Требования к современным СУБД [9]:

- масштабируемость – отсутствие существенного снижения скорости выполнения пользовательских запросов при пропорциональном росте количества запросов и аппаратных ресурсов используемых данной СУБД (таких как объем оперативной памяти, количество процессоров и серверов);

- доступность – возможность всегда выполнять запрос;

- надежность – минимальная вероятность сбоев, наличие средств восстановления данных после сбоев, инструментов резервного копирования и дублирования данных (в последнее время производители СУБД нередко предлагают инструменты, позволяющие осуществлять подобные операции, не прерывая работу пользователей);

- управляемость – простота администрирования, наличие средств автоматического конфигурирования (типичный современный набор средств администрирования включает средства создания баз данных и их объектов, инструменты описания правил репликации данных между различными серверами, утилиты управления пользователями, группами и их правами, средства мониторинга событий, средства просмотра планов выполнения запросов, утилиты миграции из других СУБД);

- наличие средств защиты данных от потери и несанкционированного доступа;

- поддержка доступа к данным с помощью Web-служб;

- поддержка стандартных механизмов доступа к данным (таких как ODBC, JDBC, OLE DB, ADO.NET), позволяющая создавать приложения для СУБД с помощью различных средств разработки.

Несоответствие СУБД какому-либо из этих требований приводит к тому, что даже у неплохой по другим потребительским свойствам СУБД область применения оказывается весьма ограниченной. Так, СУБД с плохой масштабируемостью, успешно применявшаяся при небольшом объеме обрабатываемых данных, оказывается непригодной в случае увеличения их количества. Отсутствие необходимых административных утилит также нередко приводит к отказу от применения некоторых СУБД. Плохие масштабируемость и доступность влекут за собой дополнительные затраты рабочего времени сотрудников, простои, а также потерю компанией клиентов, отчаявшихся дождаться ответа на заданный по телефону вопрос или на введенный на Web-сайте запрос. Отсутствие поддержки серверного кода приводит к тому, что СУБД, с успехом применяющаяся на корпоративном Web-сайте, не может быть использована для создания других внутрикорпоративных приложений. Отсутствие поддержки стандартных механизмов доступа к данным может автоматически привести к тому, что использующие средства разработки, ориентированные на эти механизмы, откажутся применять данную СУБД. Именно поэтому лидеры рынка корпоративных СУБД стремятся производить продукты, удовлетворяющие всем вышеперечисленным требованиям. Кроме того, как правило, подобные продукты существуют для нескольких платформ, а нередко и в разных редакциях (включая даже бесплатные), предназначенных для решения различных задач.

3.1. СУБД ведущих производителей.

Лидерами рынка СУБД на данный момент являются давно и успешно представленные на российском рынке компании IBM, Oracle, Microsoft, Sybase и Teradata, а также относительно молодая компания Netezza, которая на отечественном рынке практически неизвестна. Рассмотрим особенности продуктов этих компаний [9].

DB2 Universal Database (IBM). Семейство серверных СУБД фирмы IBM, известное под названием DB2 Universal Database (DB2 UDB), впервые появилось в 1996 г. и предназначено для платформ UNIX, OS/2 и Microsoft Windows NT. Последняя версия этого продукта (DB2 UDB8.2) функционирует под управлением операционных систем AIX, Linux, HP-UX, Sun и Windows.

Особенностями данной СУБД являются развитые средства самовосстановления и автоматического выполнения операций, связанных с поддержкой базы данных (таких как создание резервных копий и дефрагментация данных). Из механизмов доступа к данным DB2 UDB поддерживает ODBC, JDBC, ADO/OLE DB, ADO.NET. Данная СУБД позволяет создавать серверный код на CLR-совместимых языках, таких как C# и Visual Basic.NET.

DB2 Universal Database поддерживает создание хранилищ данных и помимо средств переноса данных в хранилище содержит в составе клиентской части средства управления хранилищами данных, позволяющие управлять всеми процессами, связанными с созданием и поддержкой хранилищ данных, включая создание схемы хранилища, определение источников исходных данных для него, создание расписаний обновления данных в хранилище, проверку и исправление некорректных данных.

К другим важнейшим техническим характеристикам DB2 Universal Database следует отнести поддержку реляционных и комплексных данных с помощью объектных расширений, возможность работы на мультипроцессорных платформах, поддержку кластеров, 64-разрядную архитектуру памяти, распараллеливание запросов, наличие средств для распределенного администрирования и обработки данных, поддержку выполнения распределенных транзакций. Некоторые из указанных технологий были заимствованы из СУБД Informix Dynamic Server, приобретенной IBM вместе с компанией Informix несколько лет назад.

Oracle 10g (Oracle). Oracle, появившаяся в 1979 г., была первой коммерческой реляционной СУБД, которая поддерживала язык SQL, ставший ныне индустриальным стандартом. Ранние версии этой СУБД создавались для мэйнфреймов, однако в 1985 г. появились версии Oracle, предназначенные для использования в архитектуре «клиент-сервер». Это была первая СУБД, использовавшая предоставленное некоторыми серверными платформами средства параллельных вычислений.

В настоящее время последней ее версией является Oracle 10g. Эта СУБД отвечает самым строгим требованиям к качеству обслуживания, обладает возможностями кластеризации (для этого предназначен модуль Oracle Real Application Clusters), развитыми средствами безопасности.

СУБД Oracle 10g предоставляет средства параллельной обработки запросов, встроенные средства OLAP, средства быстрого извлечения, преобразования и загрузки данных, служб порталов, средств бизнес-анализа, распространения отчетов и анализа действий пользователей, инструменты анализа производительности СУБД, обеспечивают поддержку кластеров.

Из механизмов доступа к данным Oracle 10g поддерживает ODBC, JDBC и ADO/OLE DB, кроме того, для этой СУБД существует NET-провайдер и также набор COM-объектов для доступа к данным (Oracle Objects for OLE). Вместе с тем, многие и другие компании производят ODBC-драйверы и OLE DB-провайдеры для доступа к Oracle – эту СУБД поддерживают все ведущие производители средств разработки, генерации отчетов, средств аналитической обработки данных.

На Западе и в России нередко используются готовые корпоративные решения от Oracle Corporation, объединенные под общим названием Oracle Applications, таких как Oracle Financials, Oracle Human Resources, Oracle Market Management, Oracle Project Systems и др., - собственно, продажа и поддержка именно этих приложений и составляют основную часть бизнеса компании.

SQL Server 2000 и SQL Server 2005 (Microsoft). Первая версия Microsoft SQL Server – совместный продукт компаний Microsoft и Sybase, выпущенный в 1988 г., была разработана для платформы OS/2. Последующие версии этого сервера баз данных предназначались для платформы Windows и со временем были тесно интегрированы с этой операционной системой. Для других платформ версии данного сервера не выпускались и не выпускаются.

Наиболее часто используется версия этой СУБД – Microsofr SQL Server 2000, отличающийся повышенной масштабируемостью и производительностью. Она позволяет использовать на одном компьютере несколько одновременно работающих серверов, поддерживает создание кластеров, параллельные вычисления в многопроцессорных системах, распределенные запросы. Средства администрирования Microsoft SQL Server 2000 считаются одними из наиболее простых и удобных. Помимо средств решения стандартных задач администрирования, таких как создание баз данных и их объектов, управление привилегиями пользователей и групп, резервное копирование и восстановление, репликации данных, они включают утилиты обмена данными с другими СУБД и хранилищами данных. В состав этого продукта входит OLAP-сервер. Именно с его появления в составе SQL Server началось включение OLAP-средств в состав СУБД других производителей и перемещение их из категории дорогостоящих, элитных продуктов в категорию продуктов, широко применяемых даже в небольших компаниях.

Из механизмов доступа к данным этот продукт поддерживает ODBC, OLE DB/ ADO, ADO.NET. Имеется также JDBC-драйвер производства компании Microsoft. Нельзя не отметить великолепные средства интеграции этой СУБД с Microsoft Office, вплоть до инструментов манипуляции OLAP-данными из этих приложений. Последующая версия этой СУБД – SQL Server 2005, выпуск которой начат с 2007 г., поддерживает асинхронный обмен сообщениями между различными серверными процессами, содержит службы уведомления клиентов о событиях в базе данных, позволяет создавать устойчивые к сбоям кластеры и осуществлять зеркалирование базы данных, производить репликации с базами данных, управляемыми СУБД других производителей, выполнять без остановки сервера такие операции, как изменение числа процессоров и объема памяти.

Еще одним из основных технологических новшеств этой версии SQL Server является интеграция с Microsoft .NET Framework 2.0 на уровне Common Language Runtime в самой СУБД, что позволяет создавать серверный код на любом CLR-совместимом языке программирования, например на C# или на Visual Basic. Следует отметить также существенное расширение аналитических возможностей данной СУБД, например, появление новых алгоритмов Data Mining.

SQL Server 2005 создан ТВ виде не только 32-. Но и 64-разрядногй версии, поддерживающей процессоры Intel Itanium и AMD Opteron. А для решения относительно несложных задач, использующих небольшие базы данных, выпущена бесплатная версия Microsoft SQL Server 2005 Express Edition.

Adaptive Server Enterprise и Adaptive Server IQ (Sybase). Серверные продукты компании Sybase происходят из ранних версий Microsoft SQL Server, созданной совместно Microsoft и Sybase. Начиная с 1994 г. Microsoft и Sybase разрабатывают свои серверные продукты независимо друг от друга, и результатом деятельности компании Sybase в этом направлении является продукт Adaptive Server Enterprise (ASE), последняя версия которого (12.5.2) существует для Windows NT/2000 и некоторых версий UNIX и Linux.

В настоящее время Adaptive Server Enterprise поддерживает упреждающее асинхронное чтение, что повышает скорость выполнения сложных запросов; создание кластеров; наличие 64-разрядной версии; распределенную обработку запросов, в том числе к базам данных других производителей; расширенные хранимые процедуры, позволяющие осуществлять легкий доступ к функциям, которые написаны на языках, отличных от SQL; параллельную обработку запросов в многопроцессорных системах; параллельную работу утилит администрирования; динамическую конфигурацию сервера и резервное копирование данных с компрессией. Особо стоит отметить службы Sybase Real-Time Data Services, предназначенные для организации передачи сообщений в реальном времени при возникновении каких-либо событий в базах данных, в том числе в базах данных, управляемых СУБД других производителей.

Из универсальных механизмов доступа к данным ASE поддерживает ODBC, JDBC, OLE DB/ADO. Отметим, что нередко вместе с ASE используются средства разработки и проектирования данных самой компании Sybase.

Для создания многомерных хранилищ данных у Sybase существует еще один серверный продукт – Adaptive Server IQ, позволяющий создавать хранилища на основе данных из СУБД производства не только Sybase, но и других производителей. Высокая скорость выполнения запросов в этом продукте обусловлена нестандартным способом хранения данных. Отметим также, что существует целый ряд продуктов под общим названием Sybase Industry Warehouse Studio, ориентированных на обслуживание конкретных предметных областей.

Teradata Database V2R6.0 (Teradata). В течение последних нескольких лет СУБД компании Teradata считаются лидирующими продуктами среди СУБД, предназначенных для создания хранилищ данных. Последняя версия этой СУБД (Teradata Database V2R6.0) доступна для Microsoft Windows, OS/2, UNIX и Linux.

Отличием этой СУБД от других продуктов является специальный механизм параллельной обработки запросов, предполагающий разбиение задачи на ряд отдельных подзадач и их параллельное выполнение. При этом даже такие операции, как сортировка или группировка данных, могут разделяться на несколько задач и выполняться параллельно, - это достигается за счет специального способа хранения данных, при котором части базы данных также делятся между подзадачами. Сами подзадачи могут распределяться между имеющимися процессорами, которых может быть более одного. Благодаря механизму параллельного решения задач, Teradata Database V2R6.0 отличается высокой масштабируемостью.

Для создания клиентских приложений, использующих Teradata Database, существует ODBC-драйвер, документированный клиентский API, совместимый с IBM DB2, и ряд других программных интерфейсов.

Netezza Performance Server 8000 Series (Netezza). Netezza Performance Server – это аппаратно-программное решение, представляющее собой сервер с системой хранения данных и предустановленной на нем операционной системой Linux, а также СУБД с открытым кодом, созданной на основе Postgress. Компании Netezza заявляет, что данное решение не уступает по производительности решениям на основе Teradata при заметно меньшей стоимости. В числе особенностей данного аппаратно-программного решения – поддержка параллельной обработки данных, разделение задач за счет разделения частей базы данных между подзадачами, высокая масштабируемость. Из программных интерфейсов данным решением поддерживаются универсальные механизмы доступа к данным ODBC и JDBC.

SQLBase – профессиональная, SQL-ориентированная СУБД. Среди ее достоинств: простота в администрировании, мобильность, компактность, невысокая стоимость, возможность создавать надежные и гибкие системы обработки данных, а также полная интеграция с MS Windows и Novell Netware и возможность поддержки Java-технологий.

Gupta SQLBase – компактная, простая в администрировании, профессиональная, SQL-ориентированная СУБД, включающая в себя все современные технические достижения в области информационных технологий хранения и доступа к данным.

Gupta SQLBase обеспечивает оптимальное соотношение цены/качества и является выгодным решением для использования в распределенных компаниях, желающих сэкономить на технической поддержке, администрировании и сопровождении корпоративных баз данных, а также снизить затраты на обучение персонала, участвующего в разработке и обслуживании сложных информационных систем.

 Gupta SQLBase решает проблему бесшовной и незаметной интеграции, предназначена для встраивания в самые различные приложения, начиная от настольного ПО и вплоть до N-звездных сред. Особенности Gupta SQLBase 9.0: высокая производительность; поддержка операционных систем Linux и Windows; возможность осуществлять простой перенос приложений, выполняемых в среде Microsoft windows, на платформу Linux; возможность автоматической миграции с более старых версий СУБД, что значительно облегчает развертывание Gupta SQLBase; новый символьный отладчик SQLTalk (разработан для Linux и для Windows) расширяет возможности по автоматизации зада по пакетному администрированию.

Ingres II – интеллектуальная распределенная реляционная система управления базами данных / Объекто-ориентированная среда разработки приложений в архитектуре клиент / сервер. Платформы – все популярные реализации UNIX, Linux, мэйнфреймы, VMS, OS/2, PC, Mac, Windows NT, Novell NetWare.

Jasmine – первая (во всех смыслах) и единственная объектно-ориентированная база данных, предоставляющая систему разработки мультимедиа приложений, ориентированных на Internet/intranet.

Borland InterBase 7.5 – высокопроизводительный, экономичный, многоплатформенный сервер баз данных. InterBase 7.5 представляет собой экономичную, высокопроизводительную СУБД с обработкой транзакций, которую используют миллионы пользователей во всем мире.

Сочетая легкость установки, автоматическое восстановление после аварийных отказов и минимальные требования к администрированию, InterBase является наиболее подходящим решением для встраивания в тиражируемые приложения. Обладая поддержкой многопроцессорного режима и сложной архитектурой, InterBase идеально подходит для многофункциональных бизнес-приложений, обслуживающих большое количество пользователей. Графический пользовательский интерфейс IBConsole теперь включает монитор производительности, одновременно отслеживающий состояние нескольких серверов и баз данных InterBase.

Производительность, удобство использования, поддержка Windows, Linux и Solaris, а также таких сред разработки, как Borland Delphi, C++Builder, C#Builder и Kylix позволяют InterBase занять ведущее место среди разработчиков и стать недорогим вариантом ПО для предприятий.

Таким образом, возможности современных СУБД ведущих производителей отражают современные потребности корпоративных приложений. К ним относятся способность формировать кластеры, поддерживать параллельную обработку данных в многопроцессорных системах, предоставлять программные интерфейсы для наиболее популярных средств разработки приложений, создавать аналитические приложения. Немаловажными особенностями современных СУБД ведущих производителей являются также простота администрирования и возможность выполнения ряда операций по поддержке базы данных без прерывания работы, довольно высокие показатели надежности и доступности, а также наличие нескольких редакций для решения различных по масштабу задач и построения хранилища данных.

4. Применение СУБД для построения хранилищ данных.

4.1. Построение информационных хранилищ данных.

Подход построения хранилища данных для интеграции неоднородных источников данных принципиально отличается от подхода динамической интеграции разнородных БД. Реально строится новое крупномасштабное хранилище, управление данными в котором происходит по другим правилам, чем в исходных оперативных БД.

В основе концепции хранилища данных лежат две основные идеи [11]

1. Интеграция разъединенных детализированных данных (детализированных в том смысле, что они описывают некоторые конкретные факты, свойства, события и т.д.) в едином хранилище. В процессе интеграции должно выполняться согласование рассогласованных детализированных данных и, возможно, их агрегация. Данные могут поступать из исторических архивов корпорации, оперативных баз данных, внешних источников.

2. Разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа (рис.12).

Рис.12 – Потоки данных в информационном хранилище.

В отличие от БД в традиционных ИС, где данные подобраны в соответствии с конкретными приложениями, информация в Хранилище ориентирована на задачи поддержки принятия решений. Для системы поддержки принятия решений требуются «исторические» данные – факты продаж за определенные интервалы времени. Хорошо спроектированные структуры данных отражают развитие всех направлений бизнеса компании во времени.

Поскольку в Информационных хранилищах объекты данных выходят на первый план, то особые требования предъявляются к структурам БД, используемым для создания информационных хранилищ. Принципиально отличаются и структуры баз данных. В них помещается только та информация, которая может быть полезной для работы систем поддержки принятия решений.

Свойства информационных хранилищ:

- интегрированность данных;

- инвариантность во времени;

- неразрушаемость – стабильность информации;

- минимизация избыточности информации.

Интегрированность данных. Данные в информационное хранилище поступают из различных источников, где они могут иметь разные имена, атрибуты, единицы измерения и способы кодировки. После загрузки в Хранилище данные очищаются от индивидуальных признаков, т.е. как бы приводятся к общему знаменателю. С этого момента они представляются пользователю в виде единого информационного пространства. Если в четырех разных приложениях пол клиента кодировался четырьмя различными способами, то в информационном хранилище будет использована единая для всех данных схема кодировки.

Инвариантность во времени. В БД истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием Хранилища от БД является то, что данные в них сохраняют свою истинность в любой момент процесса чтения. В БД информация часто модифицируется как результат выполнения каких-либо транзакций. Временная инвариантность данных в Хранилище достигается за счет введения полей с атрибутом «время» (день, неделя, месяц) в ключи таблиц.

Неразрушаемость – стабильность информации. В БД записи могут регулярно добавляться, удаляться и редактироваться. В Хранилищах, как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ). Это и определяет специфику проектирования структуры базы данных для Хранилища. Если при создании БД разработчики должны учитывать такие моменты, как откаты транзакций после сбоя сервера, борьба с взаимными блокировками процессов (deadlocks), сохранение целостности данных, то для Хранилища данные проблемы не столь актуальны – перед разработчиками стоят другие задачи, связанные.

Минимизация избыточности информации. Поскольку информация в Хранилище загружается из БД, возникает вопрос, не ведет ли это к чрезмерной избыточности данных? На самом деле избыточность минимальна (около 1%), что объясняется следующими причинами:

- при загрузке информации из БД в Хранилище данные фильтруются;

- информация в БД носит, как правило, оперативный характер, и данные, потеряв актуальность, удаляются;

- в Информационном хранилище хранится некая итоговая информация, которая в базах данных БД вообще отсутствует;

- во время загрузки в Хранилище записи сортируются, очищаются от ненужной информации и приводят к единому формату. После такой обработки это уже совсем другие данные.

4.2. Основные компоненты информационного хранилища.

1. ПО промежуточного слоя. Обеспечивает сетевой доступ и доступ к базам данных. Сюда относятся и коммуникационные протоколы, драйверы, системы обмена сообщениями и пр.

2. Транзакционные БД и внешние источники информации. Базы данных исторически предназначались для эффективной обработки структур данных в относительно небольшом числе определенных транзакций. Из-за ограниченной целевой направленности «учетных» систем применяемые в них структуры данных плохо подходят для систем поддержки принятия решений. Кроме того, возраст многих установленных БД достигает 10-15 лет.

3. Уровень доступа к данным. Относящееся сюда ПО обеспечивает общение конечных пользователей с информационным хранилищем и загрузку требуемых данных из транзакционных систем. В настоящее время универсальным языком общения служит язык структурированных запросов (SQL).

4. Загрузка и предварительная обработка. Этот уровень включает в себя набор средств для загрузки данных из БД и внешних источников. Выполняется, как правило, в сочетании с дополнительной обработкой: проверкой данных на чистоту, консолидацией, форматированием, фильтрацией и пр.

5. Информационное хранилище. Представляет собой ядро всей системы – один или несколько серверов БД.

6. Метаданные (репозитарий, «данные о данных). Играют роль справочника, содержащего сведения об источниках первичных данных, алгоритмах обработки, которым данные были подвергнуты, и т.д.

7. Уровень информационного доступа. Обеспечивает непосредственное общение пользователя с данным Хранилища посредством стандартных систем манипулирования, анализа и предоставления данных типа MS Excel, MS Access, FoxPro и др.

8. Уровень управления (администрирования). Отслеживает выполнение процедур, необходимых для обновления информационного хранилища или поддержания его состояния. Здесь программируются процедуры подкачки данных, перестройки индексов, выполнения итоговых (суммирующих) расчетов, репликации данных, построения отчетов, формирования сообщений пользователям, контроля целостности и др.

4.3. Проблемы интеграции данных в Хранилище [12]:

- Неоднородность программной среды.

- Распределенный характер организации.

- Повышенные требования к безопасности данных.

- Необходимость наличия многоуровневых справочников метаданных.

- Потребность в эффективном хранении и обработке очень больших объемов информации.

Неоднородность программной среды. Хранилище данных практически никогда не создается на пустом месте. Почти всегда конечное решение будет разнородным, т.е. в нем будут использоваться автономно разработанные программные средства. Прежде всего это касается формирования интегрированного согласованного набора которые могут поступать из разнородных баз данных, электронных архивов, публичных и коммерческих электронных каталогов, справочников, статистических сборников. При построении хранилища данных приходится решать задачу построения единой, согласованно функционирующей информационной системы на основе неоднородных программных средств и решений. При выборе средств реализации хранилища данных приходится учитывать множество факторов, включающих уровень совместимости различных программных компонентов, легкость их освоения и использования, эффективность функционирования и т.д.

Распределенные характер организации. В концепции хранилища данных предопределено то, что операционная аналитическая обработка может выполняться в любом узле связи независимо от места расположения основного хранилища. Хотя при аналитической обработке данные только читаются, и потребность в синхронизации отсутствуют, для достижения эффективности необходимо поддерживать репликацию данных в разных узлах сети. (На самом деле, все не так просто. Одним из требований к хранилищам данных является то, чтобы свежая информация поступала в хранилище как можно быстрее, т.е. потенциально любая модификация оперативной БД может инициировать добавление данных к хранилищу данных, а тогда потребуется обновить и все реплики, для чего синхронизация все-таки нужна).

Повышение требований к безопасности данных. Собранная вместе согласованная информация об истории развития корпорации, ее успехах и неудачах, о взаимоотношениях с поставщиками и заказчиками, об истории и состоянии рынка дает возможность анализа прошлой и текущей деятельности корпорации и построения прогнозов для будущего. Эта информация настолько ценна для корпорации, что нельзя допустить возможности ее утечки (на самом деле, если хранилище данных одной корпорации попадает в руки аналитиков другой корпорации, то все аналитические прогнозы первой корпорации сразу станут неверными). В системах, основанных на хранилищах данных, оказывается недостаточной защита данных в стиле языка SQL, которую обеспечивают обычные коммерческие СУБД (этот уровень защиты соответствует классу C2 в соответствии с классификацией Оранжевой Книги Министерства обороны США). Для обеспечения должного уровня защиты доступ к данным должен контролироваться не только на уровне таблиц и их столбцов, но и на уровне отдельных строк (это уже ответствует классу B1 Оранжевой Книги). Приходится также решать вопросы аутентификации пользователей, защиты данных при их перемещении в хранилище данных из оперативных баз данных и внешних источников, защиты данных при их передаче по сети.

Необходимость наличия многоуровневых справочников метаданных. Если роль метаданных (обычно содержащихся в таблицах-каталогах) в оперативных информационных системах достаточно ограничена, то для OLAP-систем наличие развитых метаданных и средств их предоставления конечным пользователям является одним из основных условий успешной реализации. Например, прежде, чем менеджер корпорации задает системе свой вопрос, он должен понять, как информация имеется, насколько она актуальна, можно ли ей доверять, сколько времени может занять формирование ответа и т.д. Для пользователя OLAP-системы требуются метаданные, по крайней мере, следующих типов:

1) Описания структур данных, их взаимосвязей.

2) Информация о хранимых в хранилище данных и поддерживаемых им агрегатах данных.

3) Информация об источник ах данных и о степени их достоверности. Одна и та же информация могла попасть в хранилище данных из разных источников. Пользователь должен иметь возможность узнать, какой источник был выбран основным, и каким образом производились согласование и очистка данных.

4) Информация о периодичности обновлений данных. Желательно знать не только то, какому моменту времени соответствуют интересующие его данные, но и когда они в следующий раз будут обновлены.

5) Информация о владельцах данных. Пользователю OLAP-системы может оказаться полезной информация о наличии в системе данных, к которым он не имеет доступа, о владельцах этих данных и о действиях, которые он должен предпринять, чтобы получить доступ к данным.

6) Статистические оценки времени выполнения запросов. До выполнения запроса полезно иметь хотя бы приблизительную оценку времени, которое потребуется для получения ответа, и объема этого ответа.

Потребность в эффективном хранении и обработке очень больших объемов информации. Уже сейчас известны примеры хранилищ данных, содержащих терабайты информации. По данным консалтинговой компании Meta Group, около половины корпораций, использующих или планирующих использовать хранилища данных, предполагают довести их объем до сотен гигабайт. Проблемой таких больших хранилищ является то, что накладные расходы на внешнюю память возрастают нелинейно при возрастании объема хранилища. Исследования, проведенные на основе тестового набора TPC-D, показали, что для баз данных объемом в 100 гигабайт потребуется внешняя память объемом в 4,87 раза большая, чем нужно собственно для полезных данных. При дальнейшем росте баз данных этот коэффициент увеличивается.

Кроме того, очевидно, появятся новые уникальные технологии, позволяющие наращивать и оптимизировать инфраструктуры хранения в соответствии с требованиями заказчиков к надежности, защищенности и экономическим показателям хранения данных.

Сегодня можно выделить одну традиционную  - Direct Attached Storage (DAS) и две уже уверенно входящие в жизнь архитектуры хранения данных: Network Attach Storage (NAS) и Storage Area Network (SAN).

Direct Attached Storage (DAS). Технология DAS подразумевает прямое (непосредственное) подключение накопителей к серверу или к ПК. При этом накопители (жесткие диски, ленточные накопители) могут быть как внутренними, так и внешними. Простейший случай DAS-системы – это один диск внутри сервера или ПК. Кроме того, к DAS-системе можно отнести и организацию внутреннего RAID-массива дисков с использованием RAID-контроллера.

Стоит отметить, что, несмотря на формальную возможность использования термина «DAS-системы» по отношению к одиночному диску или к внутреннему массиву дисков, под DAS-системой принято понимать внешнюю стойку или корзину с дисками, которую можно рассматривать как автономную СХД. Кроме независимого питания, автономные DAS-системы имеют специализированный контроллер (процессор) для управления массивом накопителей. К примеру, в качестве такого контроллера может  выступать RAID-контроллер с возможностью организации RAID-массивов различных уровней.

Следует отметить, что автономные DAS-системы могут иметь несколько внешних каналов ввода-вывода, что обеспечивает возможность подключения к DAS-системе нескольких компьютеров одновременно.

В качестве интерфейсов для подключения накопителей (внутренних или внешних) в технологии DAS могут выступать интерфейсы SCSI (Small Computer Systems Interfice), SATA, PATA и Fibre Channel. Если интерфейсы SCSI, SATA и PATA применяются преимущественно для подключения внутренних накопителей, то интерфейс Fibre Channel служит исключительно для подключения внешних накопителей и автономных СХД. Преимущество интерфейса Fibre Channel здесь заключается в том, что он не имеет жесткого ограничения по длине и может использоваться в том случае, когда сервер или ПК, подключаемый к DAS-системе, находится от нее на значительном расстоянии. Интерфейсы SCSI и SATA также могут применяться для подключения внешних СХД (в этом случае интерфейс SATA называют eSATA), однако они имеют строгое ограничение по максимальной длине кабеля, соединяющего DAS-систему и подключаемый сервер.

К основным преимуществам DAS-систем можно отнести их низкую стоимость (в сравнении с другими решениями СХД), простоту развертывания и администрирования, а также высокую скорость обмена данными между системой хранения и сервером. Собственно, именно по этой причине они стали очень популярны в сегменте малых офисов и свои недостатки – в первую очередь, это высокая стоимость хранения и управления данными вследствие их разбросанности по организации, а также вынужденный простой сети в момент добавления новых дисков и необходимость наращивания памяти или процессорной мощи сервера при превышении определенного размера дискового пространства. Перегруженность сетевого трафика с добавлением новых серверов усложняет проблему защиты данных, препятствует эффективному использованию ресурсов и т.д. Затраты и новые проблемы растут как снежный ком.

В настоящее время DAS-системы занимают лидирующее положение, однако доля этих систем постоянно сокращается, и на смену им приходит либо универсальные решения с возможностью плавной миграции к NAS-системам, либо системы, предусматривающие возможность их использования как в качестве DAS-, так и NAS-систем.

Network Attached Storage (NAS). NAS-системы – это сетевые системы хранения данных, непосредственно подключаемые к сети точно так же, как и сетевой принт-сервер, маршрутизатор или любое другое сетевое устройство. Фактически NAS-системы представляют собой эволюцию файл-серверов. Для того чтобы понять разницу между традиционным файл-сервером и NAS-устройством, вспомним, что традиционный файл-сервер представляет собой выделенный компьютер (сервер), на котором хранится информация, доступная пользователям сети. Для хранения информации могут использоваться жесткие диски, устанавливаемые в сервер (как правило, они располагаются в специальных корзинах), либо подключенные к серверу DAS-устройства. Администрирование файл-сервера реализуется с помощью серверной операционной системы. Такой подход к организации систем хранения данных в настоящее время является наиболее популярным в сегменте небольших локальных сетей, но имеет один существенный недостаток – универсальный сервер, отнюдь, не дешевое решение.

Кроме оптимизированной ОС, освобожденной от всех функций, не связанных с обслуживанием файловой системы и реализацией ввода-вывода данных, NAS-системы имеют оптимизированную по скорости доступа в файловую систему. NAS-системы проектируются таким образом, что вся их вычислительная мощь фокусируется исключительно на операциях обслуживания и хранения файлов. Сама операционная система располагается во флэш-памяти и предустанавливается фирмой-производителем. Подсоединение NAS-устройств к сети и их конфигурирование представляет собой достаточно простую задачу и по силам любому опытному пользователю, не говоря уже о системном администраторе.

В сравнении с традиционными файловыми серверами, NAS-устройства являются более производительными и менее дорогими. В настоящее время практически все NAS-устройства ориентированы на использование в сетях Ethernet (Fast Ethernet, Gigabit Ethernet) на основе протоколов TCP/IP. Доступ к устройствам NAS осуществляется с помощью специальных протоколов доступа к файлам. Наиболее распространенными протоколами файлового доступа являются протоколы CIFS, NFS и DAFS.

Storage Area Network (SAN). SAN – это специализированная сетевая инфраструктура для хранения данных (сеть хранения данных). Эти сети интегрируются в виде отдельных специализированных подсетей в состав локальной (LAN) или глобальной (WAN) сети.

По сути, SAN-сети связывают один или несколько серверов (SAN-серверов) с одним или несколькими устройствами хранения данных. SAN-сети позволяют любому SAN-серверу получать доступ к любому устройству хранения данных, не загружая при этом ни другие серверы, ни локальную сеть. Кроме того, возможен обмен данными между устройствами хранения данных без участия серверов. SAN-сети позволяют очень большому числу пользователей хранить информацию в одном месте (с быстрым централизованным доступом) и совместно использовать ее. В качестве устройств хранения данных могут применяться RAID-массивы, различные библиотеки (ленточные, магнитооптические и др.), а также JBOD-системы (массивы дисков, не объединенные в RAID).

Для построения сетей SAN используется либо стандарт Fibre Channel (FC), либо стандарт iSCSI.

Что выбрать – DAS, NAS или SAN? До сих пор во всем мире, а тем более в России все еще господствует DAS. Такая ситуация, скорее всего, сохранится в сегментах рынка домашних компьютеров, малого бизнеса и больших машин (mainframes). Нишу средних и крупных предприятий постепенно займут SAN- и NAS-системы, причем в комбинированном использовании.

SAN-системы целесообразно применять там, где доступ к данным осуществляется на уровне физических блоков. Речь идет в первую очередь о распределенных базах данных, построенных на архитектуре клиент-сервер. Это системы управления предприятием, банковские и финансовые системы, где критично количество транзакций в единицу времени, цифровое телевещание и т.д. Кроме того, SAN-системы используются для организации бесперебойной и непрерывной работы важных приложений, отказ которых может привести к потере критически важных данных, выходу из строя оборудования или к другим последствиям, влекущим за собой дорогостоящие простои информационной системы. SAN – это прекрасное решение для организаций, расположенных в зданиях, разбросанных в радиусе 230 км, которым необходим оперативный доступ к центральному хранилищу.

Применение архитектуры SAN эффективно при организации центров обработки данных с постоянно растущими требованиями к вычислительным ресурсам и емкости хранимых данных. Использование SAN позволяет решать такие задачи без принципиальной модификации существующей инфраструктуры, благодаря комбинации сетевых интерфейсов Fibre Channel, SCSI и Ethernet.

NAS-системы применяются в тех случаях, когда доступ к данным осуществляется на уровне файла, - это бизнес-приложения с одновременным доступом пользователей разных платформ к одним и тем же файлам (мультимедиа, графика, документы), консолидация разрозненной информации предприятия в одном месте, хранение архивов, быстрое, недорогое и безлицензионное увеличение дискового пространства в сети.

4.4. Анализ рынка поставщиков СУБД в России.

Управление ресурсами хранения данных стало одной из самых актуальных проблем, стоящих перед сотрудниками отделов информационных технологий. Вследствие развития Интернета и коренных изменений в процессах бизнеса информация накапливается с невиданной скоростью. Кроме насущной проблемы обеспечения возможности постоянного увеличения объема хранимой информации, не менее остро на повестке для стоит проблема надежного хранения данных и постоянного доступа к информации. Для многих компаний формула доступа к данным «24 часа в сутки, 7 дней в неделю, 365 дней в году» стала нормой жизни.

По сведениям IDC, за последние десять лет из 40% американских компаний, полностью лишившихся своих данных в результате пренебрежительного отношения к технологиям их хранения, только 10% смогли вернуться к бизнесу и только 4% (!) из них выжили в течение последующих трех лет.

Важнейшими элементами информационной сети сегодня являются серверы, системы хранения данных (СХД) и технологии по их администрированию. Статистика приобретения СХД в России приведена на рис.13 и рис.14.

Сбой приводит к временному приостановлению бизнес-процессов и частичной (или полной) потере данных и ставит под вопрос существование бизнеса в целом. Одним из крупнейших потребителей серверов и СХД в России традиционно является госсектор. На втором месте по потреблению – телекоммуникационная и нефтегазовая отрасли, затем финансовые организации (прежде всего банка и промышленность). Такое распределение достаточно стабильно и сохраняется на протяжении последних лет.

В целом, серверный рынок России считается самым перспективным сегментом. В 2006 г. его емкость составила 140 тыс.штук или около 40-50 млн.долл. Следует также ожидать продолжения роста российского рынка систем хранения данных. Отечественные заказчики осознают, что СХД корпоративного класса являются неотъемлемой частью современных инфраструктур.

В России существует не так много компаний, которые специализируются на производстве и продажах СХД. В большинстве случаев речь идет о поставке под заказ СХД этих брендов хорошо зарекомендовали себя во всем мире, однако следует учитывать, что при приобретении такой продукции немалую сумму приходится платить именно за логотип известной торговой марки.

 

Рис.13 – Динамика роста рынка СХД        Рис.14 – Затраты на покупку сервера

в России.                                                          в 2006 г., %

Компания IBM. Решение компании IBM называется A Data Warehouse Plus. Целью компании является обеспечение интегрированного набора программных продуктов и сервисов, основанных на единой архитектуре. Основой хранилищ данных является семейство СУБД DB2. Преимуществом IBM является то, что данные, которые нужно извлечь из оперативной базы и поместить в хранилище данных, находятся в системах IBM. Поэтому естественная тесная интеграция программных продуктов.

Предлагаются три решения для хранилищ данных:

1) Изолированная витрина данных. Предназначен для решения отдельных задач вне связи с общим хранилищем корпорации.

2) Зависимая витрина данных. Аналогичен изолированной витрине данных, но источники данных находятся под централизованным контролем.

3) Глобальное хранилище данных. Корпоративное хранилище данных, которое полностью централизованно контролируется и управляется. Глобальное хранилище данных может храниться централизованно или состоять из нескольких распределенных в сети рынков данных.

Oracle. Решение компании Oracle в области хранилищ данных основывается на двух факторах: широкий ассортимент продуктов самой компании и деятельность партнеров в рамках программы Warehouse Technology Initiative. Возможности Oracle в области хранилищ базируется на следующих составляющих:

- наличие реляционной СУБД Oracle 7, которая постоянно совершенствуется для лучшего удовлетворения потребностей Хранилищ;

- существование набора готовых приложений, обеспечивающих возможности разработки хранилища данных;

- высокий технологический потенциал компании в области анализа данных;

- доступность ряда продуктов, производимых другими компаниями.

Hewlett Packard. Работы, связанные с хранилищами данных, выполняются в рамках программы OpenWarehouse. Выполнение этой программы должно обеспечить возможность построения хранилищ данных на основе мощных компьютеров HP, аппаратуры других производителей и программных компонентов. Основой подхода HP являются Unix-платформы и программный продукт Intalligent Warehouse, который предназначен для управления хранилищами данных. Основа построения хранилищ данных, предлагаемая HP, оставляет свободу выбора реляционной СУБД, средств реинжиниринга и т.д.

NCR. Решение компании направлено на решение проблем корпораций, у которых одинаково сильны потребности и в системах поддержки принятия рещений. И в системах оперативной аналитической обработки данных. Предлагаемая архитектура называется Enterprise Information Factory и основывается на опыте использования системы управления базами данных Teradata и связанных с ней методах параллельной обработки.

Informix Software. Стратегия компании в отношении хранилищ данных направлена на расширение рынка для ее продуктов On-line Dinamic Parallel Server. Предлагаемая архитектура хранилища данных базируется на четырех технологиях: реляционные базы данных, программном обеспечении для управления хранилищем данных, средствах доступа к данным и платформе открытых систем. Три последние компоненты разрабатываются партнерами компании. После выхода Универсального Сервера, основанного на объектно-реляционном подходе, можно ожидать, что и он будет использоваться для построения хранилищ данных.

SAS Institute. Компания считает себя поставщиком полного решения для организации хранилища данных. Подход основан на следующем:

- обеспечение доступа к данным с возможностью их извлечения из самых разнообразных хранилищ данных (и реляционных, и нереляционных);

- преобразование данных и манипулирование ими с использованием 4GL;

- наличие сервера многомерных баз данных;

- большой набор методов и средств для аналитической обработки и статистического анализа.

Sybase. Стратегия компании в области хранилищ данных основывается на разработанной ею архитектуре Warehouse WORKS. В основе подхода находится реляционная СУБД Sybase System 11, средство для подключения и доступа к базам данных OmniCONNECT и средство разработки приложений PowerBuilder. Компания продолжает совершенствовать свою СУБД для лучшего удовлетворения потребностей хранилищ данных (например, введена побитная индексация).

Software AG. Деятельность компании в области хранилищ данных происходит в рамках программы Open Data Warehouse Initiative. Программа базируется на основных продуктах компании ADABAS и Natural 4GL, собственных и приобретенных средствах извлечения и анализа данных, средстве управления хранилищем данных SoursePoint. SoursePoint позволяет автоматизировать процесс извлечения и пересылки данных, а также их загрузки в хранилище данных.

Совместное применение новых информационных технологий: технология хранилищ данных и оперативной аналитической обработки, технологии Web и Java позволит создать информационную инфраструктуру корпорации и упростить доступ к данным для оперативного анализа.

В тоже время существуют и более дешевые, но не менее надежные и функциональные СХД российских производителей. Одной из таких компаний, специализирующихся на производстве и продаже СХД, является например DESTEN. В ее ассортименте есть системы хранения данных, обеспечивающие потребности как небольших, так и крупных компаний, которым требуются кластерные системы с консолидированным доступом.

5. Источники данных для информационной деятельности предприятия.

Источников информации для деятельности предприятия достаточно много и их можно классифицировать по различным признакам. Наиболее укрупненно все источники данных можно разделить на вторичные и первичные.

Вторичные источники включают в себя все, что доступно в онлайновом или оффлайновом, платном или бесплатном режимах: специализированная перса, корпоративные отчеты, официальная статистика, маркетинговые исследования, WEB-сайты и онлайновые информационные библиотеки. Если знать, что и где искать, то можно без больших затрат времени собрать полезную информацию об интересующем объекте.

К примеру, кладезем важной информации могут служить Web-сайты. Допустим, вас интересуют планы рыночной экспансии конкурирующей компании Х. Наибольшую ценность представляют ссылки на сайты партнеров, поставщиков, клиентов. Последние надо изучить самым внимательным образом. Если нет прямых ссылок, то можно через поисковые машины выйти на потенциальных, предполагаемых партнеров / поставщиков / клиентов вашего конкурента и посмотреть, нет ли в их информации и рекламе упоминания о компании Х. Если речь идет о зарубежной компании либо ее зарубежных партнерах, отличным подспорьем служат онлайновые информационные системы.

Разумеется, пользование такими ресурсами не бесплатно, но если учесть, что коллекцией баз данных постоянно пользуются свыше миллиона подписчиков во всем мире, то вложения оправдают себя.

К первичным документам относят прямые, «живые» контакты с носителями информации.

Просматривая сайт фирмы А, которая, как вы предполагаете, может быть поставщиком интересующей вас компании Х, вы установили, что так оно и есть на самом деле. Сайт содержит ссылку на Х как на одного из клиентов. Но и только. Здесь важно выйти на прямой контакт с представителями фирмы А, получив от них интересующую информацию о компании Х. Контакт можно осуществить по телефону, через Интернет, непосредственно в офисе фирмы. Помимо поставщиков, первичными источниками информации о компании Х могут служить маркетинговые и исследовательские фирмы, работавшие или работающие с Х, ее дистрибьюторы, клиенты. Опрос клиентов конкурента наиболее продуктивен с точки зрения сравнительного анализа своего и конкурентного продукта / услуги.

Рассмотрим некоторые первичные источники информации [13]:

1. К числе первичных источников относятся и регулярные отчеты менеджеров, которые занимаются продажами, работают с поставщиками, дистрибьюторами. Необходимость разрозненных сообщений не всегда очевидна. Но если вся информация стекается в автоматизированные базы данных, классифицируется и систематизируется, то на первый взгляд малозначимая деталь, факт могут сыграть весьма важную роль, будучи сопоставленными с другими сведениями.

Обычно широкий радиус поиска дает позитивный результат. Выловленная в Интернете, соответствующим образом систематизированная и проанализированная информация, дополненная деталями из первичных источников, подскажет, какие новые технологии могут появиться на рынке, где его наиболее перспективные сегменты, наконец, что делают или собираются предпринимать конкуренты. Профессиональный опыт позволяет выуживать ценные данные из непримечательной на первый взгляд информации.

К примеру, объявления о вакансиях. Внимательный анализ таких объявлений, размещенных конкурентом в местной прессе и/или на Web-сайте, с точки зрения географии и профиля требуемых специальностей позволяет довольно точно представить предполагаемые планы конкурента.

2. Несмотря на кажущуюся малозначительность именно партнеры и клиенты во многих случаях служат источником важной конфиденциальной информации.

Поскольку партнерские отношения развиваются в течение долгого времени, то партнеры становятся добрыми приятелями, и бдительность со временем ослабевает. У бизнеса очень жесткие правила, когда приходится делить рынок, деньги и власть все остальное отходит на задний план. Как только появится возможность получить больше выгод партнерство может стать ненужным, более того даже мешающим. У американцев есть хорошее правило «В бизнесе – ничего лишнего». Но у нас этот принцип действует далеко не всегда. Сплошь и рядом люди становятся врагами в силу личных обид. И вот недавние партнеры уже лелеют планы как уничтожить друг друга. И тут, как нельзя кстати, интересная информация, полученная в ходе совместного общения.

Достаточно хорошим источником информации могут быть клиенты предприятия:

- клиенты могут случайно узнать конфиденциальную информацию непосредственно в офисе, магазине и т.п. (разговоры работников, оставленные без присмотра документы и т.д.);

- к постоянным клиентам возникает симпатия и доверие и, соответственно, ослабевает бдительность;

- постоянные клиенты четко знают о слабых сторонах фирмы и ее отдельных сотрудников, так как в ходе регулярных отношений имеют возможность наблюдать за ходом ее внутренней работы.

В результате при общении с клиентами конкурентов, можно предложить хорошую скидку, за «подробный» рассказ о планах фирмы «А», в которой они регулярно приобретают товар или пользуются их услугами.

3. Иные источники информации:

- Получение информации в ходе переговоров с различными фирмами.

- Получение информации от фирм, с которыми предприятие имело договоры и совместные дела.

- Устраиваемые ярмарки и выставки и издаваемые брошюры.

- Отчеты коммивояжеров и торговых агентов.

- Попытки пригласить на работу специалистов, заполняемого ими с этой целью вопросников.

- Вопросы, осторожно задаваемые специалистами конкуренту на специальных конгрессах и симпозиумах.

Примеры вторичных источников информации:

1. Опубликованные документы открытого доступа (книги, журналы, газеты, фирменные и рекламные издания и т.п.).

Однако не следует забывать специфику российских СМИ – «свободных» СМИ не существует. Этот тезис лежит в основе любого анализа. Журналист может действовать в рамках конъюнктуры своего издания, либо выполняет «левый» заказ. Тем не менее, при любом анализе следует выделять материалы, выбивающиеся из общей картины. Материалы эти могут быть тем самым исключением, которое подтверждает правило. Либо – обозначать начало новой PR-кампании предприятия.

2. Справочники, например:

- Справочник «Экспортеры и импортеры России» (сведения о 3500 фирмах, реально занимавшихся импортно-экспортными операциями).

- Справочник «Товары и услуги» (сведения о 3500 фирмах рекламодателях с адресами, телефонами, телефаксами, 1500 видов рекламируемых товаров, 750 видов рекламируемых услуг) и т.д.

3. Базы данных. Международное бюро информации и телекоммуникации предлагает новые электронные базы данных:

- База данных «Инфопартнер» - Электронная версия Российской энциклопедии информации и телекоммуникации;

- База данных «Партнер-3» - расширенная электронная версия справочника «Экспортеры и импортеры России» включает информацию о 15000 российских фирм, занимающихся внешнеторговой деятельностью, в т.ч. данные о товарах, объемах заключенных сделок, ценах, зарубежных партнерах и пр.

- «Товары и услуги», создана на основе базы данных, содержащей более 100 тысяч рекламных объявлений из центральной прессы. СИС предназначена для получения информации о предлагаемых товарах (более 2200 наименований) и услугах (более 700 наименований).

4. Официальными источниками информации являются:

Государственные структуры:

- Антимонопольный комитет – имеет аппарат для установления монопольного или преимущественного положения той или иной фирмы на рынке товаров и услуг. Он пользуется как статистическими данными, полученными из различных источников, так и сам собирает информацию по фирмам, занося ее в компьютерную память.

- Госкомстат – ежегодно собирает информацию о коммерческих структурах, их положении на рынке товаров и услуг, доходах.

- Таможня имеет очень большой банк данных на импортеров и экспортеров.

- Торгово-промышленная палата Российской Федерации – располагает обширной региональной сетью, имеющей информацию по банкам, по крупным сделкам. Кроме того, палата имеет представительства за рубежом, через которые можно собирать информацию по инофирмам.

- Сбербанк России – располагает базой данных на все коммерческие банки Российской Федерации, а также на многочисленные коммерческие фирмы, обращавшиеся к нему за кредитом, а также на своих вкладчиков – юридических лиц.

Полугосударственные структуры:

- АО Корпорация «Российская информационная сеть делового сотрудничества». Образование корпорации стало началом коммерческой реализации идеи единого информационного пространства в России.

- Различные вычислительные центры располагают статистическими данными. Такие центры существуют в ряде отраслей и министерств.

Частные информационные агентства и базы данных коммерческих банков. В Москве работают многочисленные агентства, которые имеют банка данных, связанные с мировыми информационными ресурсами. Информацию можно получить в течение 24 часа за определенную плату.

5. Сведения, находящиеся в неопубликованных (конфиденциальных) документах, имеющихся на фирме, а также данные, которыми располагают ее сотрудники (например, результаты маркетинговых исследований, данные о планах, достижениях или неудачах конкурентов, полученные в ходе контактов на выставках или конференциях, при общении с реальными или потенциальными клиентами, торговцами и т.д.). Такие сведения могут быть получены с помощью специальных технических средств и других действий, называемых «промышленным шпионажем».

Классификация методов получения информации. Как правило, многие из этих методов получения информации используются тайно от окружения. На практике существует некая классификация методов получения информации:

- Канал-текст. Он представляет собой печатную информацию СМИ о каких-либо событиях, о  выпуске новой продукции и т.п. Такую информацию , как правило, запрашивают в библиотеках как выборку из периодических изданий по интересующему Вас вопросу.

- Канал-фирма. В этот канал входит весь персонал предприятия, который по своим служебным обязанностям поддерживает контакты с сотрудниками других предприятий и способен собирать коммерческую, финансовую, техническую и иную полезную информацию. Естественно, что сотрудники предприятия, собирающие информацию, должны быть специалистами в своей области деятельности и уметь общаться с коллегами.

- Канал-консультант. Это – эксперты и консультанты, которые имеют доступ к различной, в том числе и к грифованной информации. Это должны быть достаточно компетентные специалисты.

- Канал-беседа. При получении информации в беседах сотрудники, снимающие информацию, должны быть специалистами по проблемам, чтобы собирать нужную и достоверную информацию. Беседы с источниками информации проводятся на научных и технических конференциях, брифингах и т.п.

- Случайный канал. Это – получение информации в беседах со случайными людьми, со старыми приятелями, получение информации из забытых кем-то или потерянных документов.

Таким образом, схему информационных потоков при проведении аналитической работы можно представить в виде следующей схемы [14] (рис.15).

В левой части рисунка – реальный мир, та окружающая действительность, о которой вы хотите получить информацию, справа – вы, наблюдатель, исследователь, а между вами и реальным миром – Интернет, в терминологии теории связи – канал с «шумом», который вносит существенные искажения в входящую информацию. На рисунке буквы на стрелках соответствуют основным источниками информации:

- Информационные агентства, корреспонденты которых собирают новости по городам и весям, - наиболее объективный, точный и, возможно, меньше других подверженный конъюнктурным влияниям источник информации.

- Журналисты и редакторы СМИ – лица «второй древнейшей профессии», зарабатывающие на хлеб кто как умеет. В зависимости от респектабельности издания существует некая вероятность публикации статей, полных лукавства, заказных материалов и прочей откровенной «джинсы».

- Сотрудники специализированных информационных и консалтинговых компаний, формирующие базы данных. В настоящее время имеются разнообразные коммерческие информационные хранилища данных, куда поступают сведения из самых различных источников.

- Многочисленные фирмы, организации и компании (юридические лица), создающие собственные сайты в Интернет. Тематика, достоверность и оперативность информации на них не поддается описанию. Здесь может быть что угодно, начиная от PR-кампаний известных фирм и заканчивая приглашением на благотворительный утренник, датированный позапрошлым годом.

- Творения обычных граждан, создающих странички в Интернет о своих интересах или, на худой конец, рассказывающих о том, какой негодяй Василий Васильевич Васькин, их сосед по подъезду.

- Наконец, информация, оставленная посетителями многочисленных Интернет-форумов, конференций, чатов или досок объявлений.

Рис.15 – Схема информационных потоков.

Ограничения применения СМИ и Интернет. Перед анализом информацию следует оценить и отсортировать по достоверности (подтверждаемая, правильная, сомнительная, неправдоподобная и т.п.) и по оперативности (история вопроса, состояние на сегодня, прогноз). Всеми доступными средствами постарайтесь проверить и перепроверить имеющуюся информацию. Если нет возможности установить достоверность информации, то косвенно о ней можно судить по надежности его источника [15].

Ограничения применимости СМИ. Постарайтесь понять, присутствует ли в статье элемент скрытой рекламы, и если да, то кому она выгодна и кто возможный заказчик. Проанализируйте стилевые особенности написания статьи, абстрагируясь от контента. Такой анализ позволяет порой понять истинные мотивы авторов. Неплохо бы оценить, насколько приведенные в материале конкретные примеры могут подтвердить или может быть проиллюстрировать сказанное автором. Какие цифры, подробности могли бы подтвердить или опровергнуть его утверждения. Где они получены и указаны ли эти источники.

Основа метода анализа – это сопоставление фактов, намеков, мнений, версий, фамилий и т.п. Признаки изменения ситуации проявляются в разное время на различных объектах и фиксируются различными источниками. Это своего рода интеграция, т.е. взаимное дополнение разнородных сведений, последовательное выяснение подробностей по мере поступления новых данных.

Ограничения применимости Интернет. В открытом доступе присутствует как правда, так и много-много вымысла. Естественно – всему написанному там верит не следует. Имеется достаточно большая вероятность столкнуться с сознательной дезинформацией, размещенной как во время так называемых «оперативных игр», так и по «недоумию» случайными «гостями Интернет».

Раньше приемами пропаганды владели в основном работники спецслужб (в основном специалисты по контрпропаганде), а сегодня их используют многие PR-щики. Требуется кропотливая работа и определенными навыки, чтобы найти и выделить в Интернет сведения, действительно несущие полезную составляющую.

6. Легальные источники информации для деловой разведки.

Под деловой разведкой понимают информационно-аналитическую деятельность негосударственного предприятия или физического лица, направленную на достижение конкурентного превосходства и осуществляемую без нарушения законодательства [16].

Деловая разведка (конкурентная разведка, competitive intelligence, business intelligence) – постоянный процесс сбора, накопления, структурирования, анализа данных о внутренней и внешней среде компании и выдачи высшему менеджменту компании информации, позволяющей ему предвидеть изменения в этой среде и принимать своевременные оптимальные решения по управлению рисками, внедрению изменений в компании и соответствующие меры, направленные на удовлетворение будущих запросов потребителей и поддержание прибыльности.

Под деловой разведкой (прямой перевод с англ. – business intelligence) в мире понимается сбор и анализ сведений о партнерах и конкурентах. Деловой разведкой занимаются банки, инвестиционные, аудиторские, исследовательские, консалтинговые компании, рейтинговые агентства. Одни делают это в интересах собственного бизнеса, другие – по заданию клиентов. Фактически любое маркетинговое исследование содержит элементы деловой разведки.

Бенчмаркетинг (benchmarketing – в переводе с англ.) – сравнение эффективности системы с каким-то установленным, принятым значением.

Маркетинговая разведка – понятие очень широкое: слово “маркетинг» подразумевает не только изучение конкурентов, но и продвижение продукта, рекламу, ценообразование, начиная с начальной стадии разработки продукта до его продажи. Однако отсутствие различий между разведкой и маркетингом можно постулировать, только если считать маркетингом всю работу фирмы с внешней информацией. С практической точки зрения это нецелесообразно [17].

Конкурентная разведка (competitive intellligence) – это узкое направление деловой разведки, которое отвечает основной цели: построению системы взаимоотношений с конкурентами, т.е. создания комплекса мероприятий по получению и обработке данных о конкуренте: имущественных, финансовых и управленческих ресурсах, возможностях и уязвимости, а также об оперативных и стратегических планах. Конкурентная разведка производится в интересах бизнеса.

Однако в последние годы в российской экономике наряду с деловой разведкой стали широко использоваться противозаконные методы ее ведения, что превращает данный вид деятельности в промышленный шпионаж. Это становится нормой в деятельности компаний, поскольку попытки прибегнуть к нему более выгодны, чем трата времени и финансовых ресурсов на проведение собственных исследований, разработок и т.д.

Промышленный шпионаж – это деятельность, направленная на выведывание производственных и деловых секретов конкурентов и получение обманным путем конфиденциальной информации, используемой для достижения коммерческих целей.

Деловая разведка и промышленный шпионаж имеют как сходства. Так и отличия.

Сходство: имеют одну цель – получение информации о конкуренте.

Отличие: в методах достижения этих целей:

- деловая разведка исключает использование уголовно наказуемых средств и ориентирована на цивилизованные способы ведения бизнеса;

- промышленный шпионаж использует все доступные средства для получения необходимой информации.

Деловая разведка стала самостоятельной сферой экономического профиля, занимающаяся изучением деятельности конкурентов и включающая в себя элементы маркетинга, разведки, юриспруденции, психологии, конфликтологии, PR-технологий и т.д.

Она занимается сбором и обработкой информации из открытых источников, действуя с легальных позиций, и позволяет аналитикам готовить качественные материалы, полезные для принятия решений руководителем предприятия.

Деловая разведка ведется как государственными, так и негосударственными организациями, а также физическими лицами.

При организации и планировании опираются на следующие принципы:

- Определение стратегических и тактических целей разведдеятельности.

- Определение потребности в информации для достижения этих целей.

- Выявление источников получения необходимой информации.

- Наличие необходимых сил и средств для добывания информации и использование специфических методов работы.

Цель деловой разведки состоит в том, чтобы выявить реальное положение дел в корпорациях, определить сильные и слабые стороны их бизнеса.

Если обеспечение экономической безопасности есть деятельность по овладению важнейшими условиями самореализации экономического субъекта, то идентификация этих условий, отслеживание изменений в обстановке, изучение и прогнозирование активности других субъектов, стремящихся овладеть этими условиями, как раз то, что является сущностью деловой разведки.

Рассмотрим задачи деловой разведки, связанные с задачами службы экономической безопасности более подробно:

1. Задача сбора и обработки информации на регулярной основе требует наличия регулярно обновляемых информационных ресурсов. При этом это современные аналитические технологии, так называемые Deep mining и Business Intelligence, требуют хранения данных в электронной форме. Отсюда необходимость в современной технической базе и наличии программного обеспечения, которое не только позволит собирать данные из разных источников, хранить их в структурированных и неструктурированных базах данных, но и вести поиск по информационному полю, используя те или иные критерии, обрабатывать эти данные с использованием различных алгоритмов, а также автоматизировано формировать отчеты и визуализировать аналитические результаты.

2. Кроме инструментария задача требует наличия источников данных, - это:

- Интернет и онлайновые ресурсы;

- средства массовой информации в электронной форме;

- обновляемые базы данных и электронные архивы;

- корпоративные информационные массивы и архивы электронной почты.

3. Кроме того, необходимы люди – источники информации, как вне компании. Так и внутри ее, а самое главное, как показывает практика, остро необходимы люди, которые могут коммуницировать с сотрудниками компании на любом уровне, умеют осуществлять целеполагание для добывающего данные коллектива и сотрудников, занимающихся их обработкой.

4. Необходимы аналитики и поисковики, знающие правила работы с информацией и умеющие их применять на практике. Это важно сейчас, когда речь идет уже не о массивах информации, а о захлестывающих менеджмент компании потоках информации, работа с которыми все больше и больше требует внимания к фактору времени.

Как говорит вице-президент одного из банков, занимающихся потребительским кредитованием клиентов в торговле ТНП, срок автоматической проверки заемщика – физического лица для того, чтобы занять преимущественное конкурентное положение на этом рынке, должен быть около 30 секунд.

5. Прогнозирование, аналитическая работа – мониторинг обстановки. службами экономической безопасности и деловой разведки идентифицируются риски, разрабатываются модели и сценарии кризисов, определяются факторы, действующие на их развитие и признаки их приближения. Эти признаки выявляются в окружающей обстановке с целью предугадать момент и место наступления кризиса и оценить вероятность его наступления, чтобы вовремя сконцентрировать в нужном месте необходимые силы и средства, провести необходимые организационные изменения и принять превентивные меры, чтобы не допустить негативного развития кризиса.

6. Противодействие недобросовестной конкуренции. Изучение конкурентов – часть деятельности деловой разведки (так называемая конкурентная разведка) помогает оценивать и прогнозировать действия конкурентов, направленные на дестабилизацию деятельности защищаемой компании и самого ее центра – управляющей подсистемы, нарушение информационных связей внутри компании. Результатом такого прогноза и исследования являются действия по принятию превентивных мер, защите центра управления компании, ее целостности, связей, репутации на рынке.

Отдельным случаем этой задачи является противодействие недружественным слиянием и поглощением. То, как происходит это сегодня, показывает, что менеджмент предприятий и службы экономической безопасности захватываемых предприятий и спохватываются только тогда, когда блокирующий пакет акций предприятия уже оказывается в руках конкурента, и он начинает активные действия по вытеснению действующего менеджмента, приступают к инициированию банкротства предприятия. А ведь вполне в силах службы, вооруженной методами бизнес-разведки и отслеживающей информацию, по крайней мере, связанную с движением акционерного капитала компании, заранее увидеть и предугадать первые шаги, признаки начала такого недружественного поглощения, принять необходимые меры.

7. Задачи внутренней безопасности корпорации. Оценивать динамику лояльности персонала, выявлять центры напряженности. Анализ информации от внутренних источников и клиентов помогает службам безопасности выявлять факты утечки конфиденциальной информации, инсайд-трейдинга, иной деятельности персонала против компании.

Финансовые потоки, движение капитала, управление ресурсами и персоналом становится все более сложной задачей, связанной с ростом объемов отчетности и документооборота, увеличением сечения и скорости информационных потоков, которые с использованием современных корпоративных информационных систем достигают высшего уровня управления компании. Однако здесь и кроется основная проблема современного управления. Приходится не только собирать отрывочные и важные данные, но и, что самое трудное, лопатить огромные потоки разнородных и противоречивых данных, чтобы получить правильное осознание обстановки не только снаружи, но и внутри компании. С другой стороны, использование технологий разведки позволяет успешно осуществлять прогноз кризисных явлений в бизнесе, то есть, реализовать функцию раннего предубеждения о кризисах. А это, в свою очередь, делает возможным предпринять предупредительные меры и снизить напряженность вероятного кризиса, произвести его локализацию, или снижение возможного ущерба. Еще одной опцией является возможность использования этого знания о кризисе в своих интересах, повернув его для упрочения своего положения или ослабления конкурента.

Информацию о конкуренте можно достать совершенно легально. По оценкам специалистов, примерно 80-90% важной для бизнеса информации компании могут получить из открытых источников. Источниками информации являются [17]:

1. Люди. Источниками конфиденциальной информации являются в первую очередь сотрудники предприятий конкурентов, прежде всего руководители второго и третьего эшелонов, а также секретари, водители, телохранители. Некоторые из них считают себя обойденными в дележе прибыли, в карьере и иногда стремятся отомстить хозяевам продажей информации конкурентам (30-40% информации).

Пример. В частности, известен такой эпизод из практики американского эксперта ДР Дениса Эмерсона. Его пригласили в фирму, занимающуюся графическим дизайном, для выступления по проблемам конкурентной разведки. На совещании были практически все сотрудники фирмы, от младшего персонала до руководства. Выступление встретили вежливо, но с выражением скуки. Чтобы расшевелить аудиторию, Эмерсон спроси, кто из присутствующих изучал конкурентов. Двое участников подняли руку. Столько же откликнулись на вопрос, кто из конкурентов влияет на деятельность фирмы. Только присутствующий здесь же директор компании сказал, что уделял внимание этому вопросу. И когда директор перечислил ряд наиболее опасных конкурентных компаний, один из служащих поднялся и сказал, что если бы он знал, что в этом списке будет компания Х, то смог бы собрать информацию через кузена жены, работающего там, в частности, он недавно слышал, что менеджер Х ищет кредит для выплаты текущей зарплаты.

2. Любые открытые для всех факты о деятельности сотрудников конкурирующей компании, об их личных и деловых планах могут оказаться важными данными для специалистов деловой разведки (10-15% информации).

Пример. Однажды служащий компании Chrysler узнал, что лучший фотограф компании Ford едет в Париж, и сообщил об этом руководству своей компании. Аналитики Chrysler связались со своим представительством в Париже и установили, что Ford собирается сфотографировать новую модель автомобиля на фоне Эйфелевой башни. Также выяснилось, что после Парижа фотограф отравляется в Гонконг. После анализа собранной информации эксперты сделали вывод, что конкурент в ближайшее время планирует выпуск недорогого малолитражного автомобиля, предназначенного для продаж в большинстве стран мира.

3. Документация предприятия. Достоверная документальная информация, позволяющая судить о разных сторонах деятельности предприятия. Документация исследуется при заключении важных сделок, проведении тендеров, поглощении предприятия или защите от поглощения (20-30% информации).

Пример. При проведении приватизации одного из российских алюминиевых предприятий был объявлен тендер. Одна из компаний, участвующая в тендере, решила собрать максимум данных о других участниках тендера. В результате изучения открытых источников выяснилось, что четыре участника имеют одного и того же учредителя. Таким образом, стало ясно: соперник использует нечестные методы.

4. Открытые публикации. Это – книги, журналы, газеты, монографии, обзоры, доклады, тезисы выступлений и т.п. Эти материалы создают базовую или фоновую информацию и наталкивают аналитиков на открытие новой информации, помогают им создать базы данных и определить направления поисков новых сведений (30-40% информации).

Пример. Российская производственная компания решила поглотить один из региональных заводов. При поглощении, как известно, важно побыстрее достать реестр акционеров. Имея список держателей акций, можно склонить их к сотрудничеству или уговорить продать акции. Но быстро достать реестр не удалось. Тогда аналитики, работавшие на компанию, нашли другой выход. За несколько дней они собрали информацию об основных акционерах из открытых источников – из региональной и федеральной прессы, баз данных регистрационных и других госорганов. Компания договорилась с несколькими крупными акционерами, и предприятие было поглощено. Легальная разведка на регулярной основе.

5. Технические и электронные носители. Это – магнитные носители (дискеты, диски, стримеры, ленты, флэш-карты и т.п.), видеофильмы, компакт-диски, информация в компьютерах, кино- и фотоматериалы и т.п. (30-40% информации).

Очень популярны среди специалистов по конкурентной разведке базы данных Московской регистрационной палаты, регистрационных органов других городов и регионов России, Госкомстата, торгово-промышленной палаты, Госкомимущества. Отдельные доступные базы данных имеют также и некоторые министерства и комитеты. Существует также негосударственная, имеющаяся в продаже база данных «Лабиринт», составленная на основе публикаций ведущих изданий. С ее помощью можно получить обширную информацию о конкретных персонах, организациях и компаниях.

6. Технические средства управления. К ни относятся автоматизированные системы обработки информации, средства связи, телевизионные установки, радиотрансляционные системы и т.п. (5-6% информации).

Пример. Один из предпринимателей собирался открыть кафе. Для написания бизнес-плана ему нужна была информация о дневной выручке конкурента. Подкупать бухгалтера или кассира конкурента? Решение было найдено достаточно оригинальное и простое. Так как фискальные чеки имеют сквозную нумерацию, достаточно заглянуть на чашечку кофе сразу после открытия и перед закрытием, чтобы по номерам чеков выяснить, сколько чеков было пробито за день. Далее приблизительно оценивается сумма среднего чека и высчитывается с определенной долей погрешности выручка.

7. Продукция. Продукция предприятия также является источником информации. Особый интерес представляет новая продукция, перспективная на рынке, а также продукция, произведенная по новым технологиям и секретная продукция (10-15% информации).

Пример действия «JVC» против «Sony». Объектом ДР стала новая модель цифровой видеокамеры, занявшая существенный сегмент рынка. Вместе с тем, метод разведки был крайне прост – видеокамера «Sony» была куплена в магазине и разобрана на составные части. После этого JVC предложила свою модель, куда был внесен ряд улучшений, плюс исправлены некоторые недостатки видеокамеры конкурентов.

8. Производственные отходы. Они дают специалисту некоторую информацию о характере деятельности предприятия, о выпускаемой продукции и технологических процессах. Часть производственных отходов содержит в себе драгоценные и цветные металлы (5-6% информации).

Пример. Procter & Gamble в 2001 г. тоже ославился, кода пытался «кормиться с мусорных ведер» другого косметического гиганта – Unilever. Как выяснилось, его «шпионы» немало преуспели, откапывая в кучах мусора сведения о формуле шампуней и маркетинговых стратегиях конкурента.

Пример. Крупная международная химическая компания Ника не могла разведать планы своего главного конкурента, который готовил выпуск новой продукции. Один из сотрудников предложил начать регулярно брать пробы воздуха вблизи одной из фабрик конкурента. По изменению состава выбросов предприятия компания смогла определить, какой вид продукции начинает выпускать конкурент.

9. Выставки и конференции – как источник информации. Специалисты в области ДР придают важное значение торговым выставкам, на которых можно получить первичную информацию о ключевых конкурентах и их намерениях с тем, чтобы предпринять соответствующие меры. Участники выставок используют свои экспозиции и сопровождающие конференции для показа новой продукции и заявлений о запусках новых проектов. Многие из таких заявлений в последующем в открытой печати не публикуются.

Опросы показали, что:

- около 50% участников выставок ищут новые идеи и партнеров для их осуществления. Поэтому они более раскрепощены и готовы делиться своей информацией;

- до 60% участников впервые присутствуют на таких мероприятиях, а это облегчает установление новых контактов4

- около 34% участвующих на выставках компаний представлены своими руководителями;

- 84% участников вхожи в руководящие органы, принимающие корпоративные решения. В обычное время очень сложно добиться встречи с ними, а на выставке они открыты к общению.

Наконец, выставки посещаются многими аналитиками, экспертами и представителями прессы. Это способствует установлению новых контактов.

В Европе и США во многих крупных компаниях сбор и анализ бизнес-информации о конкурентах проводится на регулярной основе. Собственный отдел коммерческого анализа есть, например, в компании IBM. Ведущие российские компании также давно поняли, что обладание информацией – серьезное конкурентное преимущество. Есть аналитический отдел в компании «Вимм-Билль-Данн», МТС и «ВымпелКом».

10. Государственный информационный статистический ресурс. Статистическая информация является наиболее эффективным и дешевым средством быстрого получения необходимой информации для проведения деловой разведки.

Особенностями статистической информации являются:

- формализованный характер, который заключается в том, что она принимает вид статистических показателей;

- высокая достоверность и оперативность;

- повышенная приспособленность по сравнению с другими видами информации, к проведению различного рода аналитических работ, что вытекает из ее формализованного характера.

Беспристрастность предусматривает свободу и независимость статистической информационной системы от государственных учреждений с целью исключения возможности давления и принуждения к искажению некоторых сведений.

Информационный ресурс Госкомстата России включает:

1. Единый государственный регистр предприятий и организаций (ЕГРПО) представляет собой информационную систему, необходимую для обеспечения государственного учета и идентификации зарегистрированных на территории Российской Федерации хозяйствующих субъектов на основе единой системы классификации и кодирования социально-экономической информации.

2. Генеральная совокупность объектов статистического наблюдения (ГС). ГС создается на основе информационной системы ЕГРПО, которая представляет собой базу данных, содержащую перечень юридических лиц, их филиалов, представительств и других объектов статистического наблюдения, осуществляющих деятельность на территории Российской Федерации, характеризующихся установленным набором индивидуальных признаков, необходимых для организации конкретных статистических наблюдений.

3. Банк данных «Бухгалтерская отчетность организаций» (БД БОО) – это информационная система, которая служит для формирования и накопления данных квартальной и годовой отчетности предприятий за продолжительный период, а также получения расчетных показателей и формирования информации для проведения анализа финансовых результатов деятельности объектов хозяйствования.

4. Центральная база статистических данных (ЦБСД) представляет собой интегрированный информационный ресурс, созданный на основе многоотраслевой статистической информации по различным секторам экономики и содержит более 300 информационных фондов, включающих порядка 2,5 тысяч основных показателей социально-экономического положения российской экономики.

5. Субрегистры. Для решения конкретных задач в направлении совершенствования методологии и организации статистического учета и анализа создаются отраслевые регистры (субрегистры) субъектов хозяйствования. Субрегистры представляют собой отраслевые информационные системы сбора и обработки статистической информации по конкретной (отраслевой) совокупности объектов статистического наблюдения, которая характеризуется необходимым и твердо установленным составом признаков и показателей.

Система электронной обработки данных обеспечивает формирование наборов микроданных и создает наборы макроданных, т.е. оценочных величин статистических характеристик. Система поиска и представления статистической информации создает вторичную статистическую информацию, которая ориентирована на конкретные категории пользователей.

7. Методы и правовые основы сбора информации.

7.1. Методы сбора информации.

Методы сбора информации о конкурентах условно можно разделить на три группы: «белые», «серые» и «черные». Конфиденциальную информацию зачастую легче получить путем «разговора по душам» с сотрудником компании-конкурента, а не с помощью установки прослушиваемой аппаратуры, подкупа, шантажа и пр.

1. Белые. Примеров сбора стратегически важной информации в открытых источниках огромное множество: Интернет, официальные запросы в различные государственные органы, чтение корпоративных газет, сбор информации на выставках и презентациях, опросы сотрудников исследуемых компаний под видом журналистов и т.д.

Получение информации «втемную» основано на следующих особенностях психики человека. Как правило, сведения секретного и конфиденциального характера от собеседников получают «втемную». Человек в ходе беседы побуждается к высказываниям по интересующим Вас вопросам с помощью различных легендированных предлогов и косвенных методов воздействия. Информация, получаемая «втемную», носит характер отдельных высказываний, интерпретации фактов и, как правило, не носит законченного вида и полного объема, раскрывающего проблему.

2. Серые. В ДР существует целый ряд приемов, которые не запрещены законом, но вызывают этические сомнения, обычно их называют серыми методами сбора информации. Большинство бизнес-разведчиков в своей работе все-таки следует логике: разрешено все, что не запрещено законом, а до этики, то … На войне как на Войне. К «серому» инструментарию можно отнести. Например, «съем» информации под видом собеседования якобы при приеме на работу.

Пример. Старый, как сама разведка, шпионский трюк – то, что в Америке называют «нырянием в мусорные контейнеры» (dumpster diving). В 2000 г. разразился скандал вокруг корпорации Oracle, которая наняла детективов, чтобы те доказали, что Microsoft негласно спонсирует ряд общественных организаций с целью влиять через них на общественное мнение. Сыщики попались, когда предложили уборщикам «продать» мусор из интересующего их офиса за 1 200 долл. Комментарий многих экспертов на огласку этого факта был на удивление спокойным: ну и что, для высокотехнологических компаний Силикованой Долины это вполне обычная практика… Вице-президент компании Transmeta Дэвид Дитцель (David Ditzel) как-то перед выводом на рынок нового компьютерного чипа заявил: «Все это время мы тщательно следили за тем, чтобы «подобные ребята» могли извлечь из нашего мусора лишь апельсиновые корки».

Серых методов получения информации тоже достаточно много:

- «Выгодный клиент»;

- «Несуществующая вакансия»;

- «Засланный казачок» (устройства на работу к конкуренту);

- «Интернет друг»;

- Коллега по работе (учебе) и т.д.

Эти методы ограничены только «фантазией» бизнес-разведчика. Но привлечь к ответственности за подобные деяния чаще всего не получается: все законно. Единственный вывод, который могут сделать потерпевшие. – пора встраивать систему собственной информационной безопасности.

3. Черные методы в деловой разведке – это уже промышленный шпионаж.

По оценкам Американского общества промышленной безопасности (ASIS), крупные корпорации из Топ-1000 теряют в год от промышленного шпионажа не менее 45 млрд.долл. Ущерб небольших компаний просто не поддается исчислению. В нашей стране, - со вздохом признаются «белые» российские бизнес-разведчики, - то воровство информации пока значительно дешевле интеллектуальной работы.

К общеизвестным методам шпионажа можно отнести:

- подкуп и шантаж;

- съем информации с помощью жучков;

- использования ПО «троянских коней» для доступа к компьютерам конкурента;

- использование недобросовестных гос.служащих и т.д.

Компании предпочитают не афишировать потери. Что говорить, если даже нашумевшие весной 2008 г. хищение банковских проводок Центробанка России было, по сути дела, замято. Сообщения о случаях, когда против промышленных шпионов применялась статья 183 УК (незаконное получение и разглашение сведений, составляющих коммерческую, налоговую или банковскую тайну), стали эпизодически появляться лишь в последние несколько лет.

В декабре 2003 г., например, на ОАО «Уралмаш» поймали нескольких служащих, копировавших в интересах конкурирующей компании техническую документацию. В 2005 г. в Иркутской области задержали двух детективов, которые пытались угрозами и подкупом (500 долл. В месяц) склонить главбуха частной фирмы «сливать» информацию. Впрочем, о размахе деятельности 2черных» разведчиков косвенно можно судить по объявлениям фирм, занимающихся защитой бизнеса от промышленного шпионажа. Громкие скандалы на тему примышленного шпионажа в России не за горами.

Справедливости ради надо сказать, что ДР – удовольствие достаточно не дешевое. Минимальные годовые расходы на одного штатного разведчика минимум 18-20 тыс.долл., учитывая зарплату и оснащение. Например, группы стратегического анализа российского представительства по странам СНГ компании Alcatel имеет штат более 5 человек. Понятное дело, малым и средним организациям, случись какая нужда в этих специфических услугах, удобнее обращаться в специализированные компании.

Таким образом, можно утверждать, что сегодня существует принципиально два направления сбора информации [18] (рис.16):

1. Этические методы.

2. Не этические методы Gut Instinct.

Рис.16 – Методы добывания информации и возможные риски

для аналитика и фирмы.

С позиций морали такое отношение также вполне понятно: если аналитик использует грубые и неэтичные методы добывания информации в отношении объекта исследования, то ему ничего не мешает использовать эти же методы и в отношении заказчика этих исследований для последующей продажи их объекту исследования или конкуренту. Следует отметить, что серая информационная зона крайне расплывчата даже на Западе и отношение к методам «Gut Instinct» также неоднозначное. Это определяется, прежде всего, требованиям национального законодательства в этой области и уровнем развития профессиональной этики.

Пути получения информации можно разделить следующим образом:

1. Информация может быть получена как легальным, так и нелегальным путем. В зависимости от того, какая информация: грифованная или открытая.

2. Информация может добываться путем обработки и анализа открытых источников, анализа документов, образцов техники и т.п.

3. Конфиденциальная информация может быть получена «втемную» в беседах с информированными людьми и специалистами.

4. Секретная информация обычно добывается через оплачиваемых постоянных источников информации, а также путем перлюстрации корреспонденции, визуального и наружного наблюдения, использования технических средств: путем прослушивания телефонов и помещений, а также негласного снятия информации с компьютеров, факсов, модемов и т.п.

5. По предложениям так называемых инициативников, от служащих конкурентов, от сотрудников различных инспекций, банков, статистических органов.

6. Достоверную информацию добывают путем: несанкционированного проникновения в базы данных предприятий, скрытого копирования документов, изучения бумажного «мусора».

7. Добывается информация путем ложного приобретения лицензий, похищения образцов продукции, кражи технической, финансовой и другой документации.

7.2. Законодательная основа информационно-аналитической работы.

В настоящее время к сфере регулирования информационной деятельности и охраны коммерческой тайны имеет отношение более 100 нормативных актов (международных соглашений и договоров, конвенций, кодексов, законов Российской Федерации, постановлений Правительства Российской Федерации и т.п.). К ним прежде всего относятся:

- Конституция Российской Федерации и Уголовный кодекс Российской Федерации;

- Федеральный закон «Об информации, информатизации и защите информации»;

- Арбитражный процессуальный кодекс Российской Федерации и Таможенный кодекс Российской Федерации;

- Основы законодательства Российской Федерации об архивном фонде Российской федерации и архивах;

- Закон Российской Федерации «О федеральных органах правительственной связи и информации»;

- Закон Российской Федерации «О государственной налоговой службе Российской Федерации»;

- Закон Российской Федерации «О федеральных органах налоговой полиции»;

- Закон Российской Федерации «О средствах массовой информации»;

- Закон Российской Федерации «О персональных данных»;

- Федеральный закон «О естественных монополиях»;

- Федеральный закон «О рекламе»;

- Федеральный закон «Об основах государственной службы Российской Федерации»;

- Федеральный закон «О конкуренции и ограничении монопольной деятельности на товарных рынках»;

- Федеральный закон «О государственной тайне» и Патентный закон Российской федерации.

Однако наиболее близким основополагающим документом, регламентирующим законную основу сбора информации, является закон «О персональных данных», а также Закон Российской федерации «О государственной тайне». Обращение к государственной тайне не может иметь характера частной сыскной деятельности. Оно осуществляется в соответствии с правилами, установленными другими законодательными и нормативными актами. Но, наверное, и случаи, когда в ходе ДР может возникнуть потребность в гостайне, маловероятны. Следующим необходимо указать Федеральный закон «Об информации, информатизации и защите информации». Этим законом информация делится по категориям доступа на открытую и документированную информацию, отнесенную к категории ограниченного доступа.

Законом запрещается относить к информации с ограниченным доступом документы, накапливаемые в открытых фондах библиотек и архивов, информационных системах органов государственной власти, органов местного самоуправления, общественных объединений, организаций, предоставляющие общественный интерес на необходимые для реализации прав, свобод и обязанностей граждан. Открытые сведения могут быть эффективным источником информации при решении задач ДР.

Рассмотрение этих положений приводит к выводу: отнесение документированной информации к конфиденциальной не является средством ограничении доступа к ней, таковым является установленный и соблюдаемый уровень защиты конфиденциальной документированной информации собственником, владельцем. Таким образом, в характеристике возможностей ДР играет роль следующее обстоятельство: признание тех или иных сведений, отнесенных законом к конфиденциальным, таковыми является прерогативой правообладателя. Сведения, относимые законом к конфиденциальным, но не признаваемые таковыми правообладателем, не могут исключаться из оборота ДР.

Из рассмотренного следует, что, если информация законом отнесена к категории конфиденциальной, но правообладатель (собственник) в отношении ее не соблюдает условия документирования, не установил режим ограничения доступа и защиты, то сбор такой информации в ходе частной детективной деятельности не является нарушением закона. Это в полной мере относится к категории коммерческой тайны.

К категории конфиденциальной информации и в прямой постановке исключаемой из оборота ДР относится информация о гражданах (персональные данные). Однако номенклатура этих данных должна быть изложена в Перечнях персональных данных, включаемых в состав федеральных информационных ресурсов (ИР), ИР совместного ведения, ИР субъектов российской Федерации, ИР органов местного самоуправления, а также получаемых и собираемых негосударственными организациями, и закреплена на уровне Федерального закона «Об информации персонального характера».

Согласно закону о «Персональных данных» не допускается сбор, хранение, использование и распространение информации  о частной жизни, а равно информации, нарушающей личную тайну, семейную тайну, тайну переписки, телефонных переговоров, почтовых, телеграфных и иных сообщений физического лица без его согласия, кроме как на основании судебного решения. Персональные данные не могут быть использованы в целях причинения имущественного и морального вреда гражданам, затруднения реализации прав и свобод граждан Российской Федерации.

«Персональные данные» рассматриваются как информация (зафиксированная на материальном носителе) о конкретном человеке, которая отождествлена или может быть отождествлена с ним. К персональным данным относятся биографические и опознавательные данные, личные характеристики, сведения о семейном, социальном положении, образовании, профессии, служебном и финансовом положении, состоянии здоровья и прочие.

Первоначально к проблеме защиты персональных данных на международном уровне обратилась Организация по экономическому сотрудничеству и развитию (ОЭСР), принявшая в 1980 г. Директиву о защите неприкосновенности частной жизни и международных обменов персональными данными. В дальнейшем эти принципы были детализированы в Конвенции Совета Европы «Об охране личности в отношении автоматизированной обработки персональных данных» (1981 г.), в Директиве Европейского сообщества о защите граждан в плане обработки информации личного характера от 27 июля 1990 г., в Директиве Европейского Союза и Парламента 95/46ЕС от 24 октября 1995 г. о защите прав частных лиц применительно к обработке персональных данных и свободном движении таких данных и Директиве 97/66/ЕС от 15.12.97 по обработке персональных данных защите, конфиденциальности в телекоммуникационном секторе. В данных актах определены основные принципы организации автоматизированной обработки данных личного характера и обеспечения права граждан на защиту персональных данных:

- данные персонального характера должны быть собраны только для определенных целей и в строгом соответствии с законом;

- данные должны соответствовать требованиям, быть точными, полными и вовремя обновленными;

- цели, для достижения которых собираются и обрабатываются персональные данные, должны быть определены и утверждены до начала деятельности и использования только в этих целях;

- в системах учета персональных данных должны быть внедрены механизмы, предотвращающие потери или неправильное (или злоумышленное) использование персональных данных;

- деятельность организаций (как государственных, так и частных), имеющих базы данных, содержащих персональные данные, должна быть открытой. Такие организации должны предоставить возможность заинтересованным лицам и контролирующим органам убедиться в легитимности обработки персональных данных и целей этой обработки;

- граждане должны иметь право доступа к данным о них, которые хранятся и обрабатываются, а также должны иметь возможность требовать, чтобы соответствующие данные о них были изменены;

- держатели данных должны быть подконтрольными для обеспечения соблюдения настоящих принципов, для этих целей должно быть предусмотрено создание независимого контролируемого органа как важного элемента защиты личности при автоматизированной обработке информации личного характера.

Что же такое «персональные данные» с точки зрения Закона? Законом «О персональных данных» [16] определены основные понятия:

«1) Персональные данные – любая информация, относящаяся к идентифицированному или идентифицируемому физическому лицу;

2) субъект персональных данных – идентифицированное или идентифицируемое физическое лицо, в отношении которого осуществляются сбор и обработка персональных данных;

3) обработка персональных данных – отдельные действия или операции, выполняемые с персональными данными, или совокупность таких выполняемых с применением средств автоматизации или без их применения действий, как запись, организация, накопление, хранение, обновление или изменение, извлечение, обезличивание, уничтожение персональных данных».

Целью настоящего Федерального закона является обеспечение защиты прав граждан на неприкосновенность частной жизни при сборе и обработке персональных данных, осуществляемое путем:

1) установления общих принципов сбора и обработки персональных данных4

2) определения прав субъектов персональных данных;

3) определения обязанностей и ответственности операторов;

4) установления условий трансграничной передачи персональных данных.

Особого внимания заслуживает Статья 10 «Передача персональных данных»: «Передача персональных данных оператору третьими лицами, …, а равно передача персональных данных оператором любому третьему лицу допускаются только с письменного согласия субъекта персональных данных». Это означает, что предприятие не вправе потребовать от вас персональных данных без вашего письменного разрешения.

Получается, что с одной стороны, практически вся информация о частных лицах находится в открытом доступе. Адрес интересующего вас человека вы можете найти в любом телефонном справочнике. По ответствующему запросу вам предстоит информацию о его машине, объектах недвижимости и т.п.

Безопасность персональных данных – это серьезная проблема, с которой сталкиваются даже самые развитые страны мира. Можно найти не один десяток случаев утечки конфиденциальной информации. В России же пиратская база данных коммерческой компании – скорее исключение, чем правило. Действительно, на рынке появлялись базы данных нескольких операторов мобильной связи (стоимость диска от 200-450 руб.), но эти компании сразу же сделали правильные выводы и приняли самые жесткие меры. На черном рынке остался лишь «стандартный ассортимент продуктов»: базы данных «ГИБДД по Москве», «Московская прописка», «Жилой фонд Москвы», «Земельные участки Московской области», ЦБ РФ, Налоговой инспекции, Пенсионного фонда, результаты проверок Счетной палаты и др. В целом на российском «черном» рынке информации персонального характера доступны различные базы данных, держателями которых являются как государственные органы, так и частные структуры, в основном ценовом диапазоне от 400-500 руб. до 150-200 долл. Указанные базы содержат информацию как о физических, так и о юридических лицах, включая внутренние корпоративные адреса и персональные данные сотрудников. При этом отсутствие реальных механизмов реализации прав и ответственности в сфере оборота персональных данных приводит к тому, что случаи утечки информации в большинстве случаев не перерастают в конкретные расследования, судебные процессы и решения.

Рассмотрим, как влияет законодательство Российской Федерации о коммерческой тайне на возможности информационной деятельности. Что касается законодательного закрепления статуса коммерческой тайны? Под коммерческой тайной понимаются не являющиеся государственными секретами сведения, связанные с производством, технологической информацией, управлением, финансами и другой деятельностью предприятия, разглашение (передача, утечка) которых может нанести ущерб его интересам.

Однако при анализе возможностей ДР следует учитывать, что полная правовая защита коммерческой тайны законодательством по совокупности всех законов и нормативных актов. Коммерческая тайга является конфиденциальной в силу ограничения доступа к ней, а не вследствие присвоения документам, содержащим коммерческую информацию, имеющей коммерческую ценность, мерами ограничения доступа, является фактором, способствующим ДР. Возможности ДР обеспечиваются и тем, что устанавливается ограничение на сведения, относимые к КТ.

Коммерческую тайну предприятия и предпринимателя не могут составлять:

- учредительные документы (решение о создании предприятия или договор учредителей) и Устав;

- документы, дающие право заниматься предпринимательской деятельностью (регистрационные удостоверения, лицензии, патенты).

Несмотря на существование перечисленных законов сегодня в России можно за деньги узнать практически любую информацию о гражданах, коммерческих и государственных структурах – вопрос только в цене. Доказательство тому – крупные скандалы, связанные с утечкой конфиденциальной информации. Причем на закрытой информации о частной и деловой жизни россиян и компаний зарабатывает миллионы целая подпольная индустрия, однако правоохранительные органы разводят руками: поймать охотников за информацией очень сложно, а перекрыть все каналы ее утечки просто нереально.

Приведем лишь часть БД, которые сегодня продаются на рынке:

- БД «Водительское удостоверение»;

- БД «Дорожно-транспортные происшествия»;

- БД «Прописка»;

- БД «Регистрация»;

- БД «Земельный комитет»;

- БД «Московская регистрационная палата»;

- БД «Госкомстат»;

- БД «Антикриминал»;

- БД «Таможня РФ»;

- БД «Реестры предприятий и организаций».

Потенциальными покупателями «закрытых» баз данных являются все, кому необходима информация, начиная от любопытных граждан и заканчивая различными криминальными структурами.

Согласно «прейскурант». Самая дешевая база – телефонных номеров МГТС, стоит 500 руб.: по ней, набрав на компьютере телефонный номер, можно узнать фамилию, имя и адрес его владельца. Самые дорогие базы стоят 6000 руб. Причем, продавцы БД заверяют, что продаваемый ими товар – «первой свежести». Однако на деле оказывается, что купленные компакт-диски с «последними данными» по «Билайну» и «МТС» содержит данные двух-трехлетней давности.

Специалисты в области добычи информации считают, что покупать базы на рынках – это безвыигрышная лотерея, поскольку хорошие базы стоят в среднем 1000 долл. Серьезными мощными базами торгуют всего несколько фирм, и продавать их первым встречным они не будут. У них постоянный круг клиентов, которым они доверяют, которые их не подставят. Стоят такие базы на порядок выше.

Мобильные телефоны беззащитны. Вокруг прослушивания мобильных телефонов, которые сегодня есть почти у каждого второго жителя России, ходит немало домыслов и кривотолков. Одни утверждают, что за несколько сотен долларов можно получить распечатки переговоров практически любого абонента сотовой связи. Другие уверяют, что за подобными предложениями зачастую скрываются мошенники, которые исчезают после получения денег. Ведущие сотовые операторы, в свою очередь, настаивают на том, что нелегальную прослушку мобильных телефонов организовать практически невозможно.

Борьба с «прослушкой» - дорогостоящее занятие. «Жучков» боятся многие, и рынок реагирует на это. Сегодня в России можно приобрести богатый арсенал средств, препятствующих нелегальной прослушке и видеонаблюдению. Однако и стоимость  такого оборудования 16 тыс.долл. Такое оборудование в основном приобретают силовые структуры, крупные частные охранные структуры, службы безопасности крупных организаций, коммерческих банков. Бывают приборы и попроще для глушения мобильной связи, которая может быть использована для нелегальной перекачки информации. Радиус его действия – 50 м, цен – 800 долл.

Впрочем, чтобы избавиться от «жучков», вовсе не обязательно покупать специальное оборудование – можно нанять профессионалов. В Москве работают несколько специальных бригад, которые за умеренную оплату очистят от «жучков» ваш офис или квартиру. И стоить это будет значительно дешевле – избавление обычной городской квартиры от непрошенных гостей сегодня стоит 150-300 долл.

Информация о человеке стоит от 50 до 30 000 долл. Соблазн узнать чьи-либо таны весьма велик, но дело это небезопасное и почти всегда противозаконное: за сбор информации о человеке без его согласия УК РФ карает крупными штрафами и исправительными работами на срок до 8 месяцев, а за нелегальное прослушивание телефонных переговоров можно получить до трех лет тюрьмы. Но что делать, если конфиденциальная информация необходима? В таких случаях чаще всего обращаются к частным детективам. Четкого прейскуранта на услуги частных детективов сегодня нет – все зависит от квалификации частного сыщика, возможных накладных расходов и сложности заказа. В среднем получить информацию о какой-либо фирме можно, заплатив от 150-350 долл. За эти деньги детективы предоставят общие сведения о ее деловой репутации, отношениях с налоговыми органами и банками.

Физических лиц оценивают несколько дешевле – от 50 до 200 долл. За эти деньги можно, например, получить характеристики на человека с прежних мест работы, узнать его семейное и имущественное положение. Такую работу детективы выполняют, кА правило, не выходя из офиса при помощи баз данных, Интернета и телефона. Если же нужны более подробные сведения, для получения которых потребуется наружное наблюдение или «прослушка», то здесь применяется почасовая оплата труда (10-15 долл. в час).

Таким образом, на деловой информации зарабатывают миллионы. Услуга по сбору информации о деловых партнерах и конкурентах сегодня пользуется большим спросом. Лидеры рынка – детективные агентства, которые заключают миллионные долгосрочные контракты с крупными российскими и зарубежными компаниями. Агентств и частных детективов, ведущих «честную игру», крайне мало – фактически в каждой крупной компании есть собственное «нелегальное» детективное бюро, работающее под прикрытием службы безопасности. Нередко такие нелегалы используются для промышленного шпионажа и сбора компромата на деловых и политических конкурентов. Между тем, несмотря на столь внушительное число детективов-нелегалов, уголовные дела за незаконную детективную деятельность – большая редкость.

Литература

1. С.В.Крошилин, Е.И.Медведева. Информационные технологии и системы в экономике. Учебное пособие. – М.: ИПКИР, 2008. – 485 с.

2. А.В.Крылович. Информационные технологии в Управлении предприятием // http://www.cfin.ru/itm/kis/.

3. Э.Е.Старобинский. Менеджмент на практике. – М.: Книжный мир, 2002.

4. С.А.Щетинин. организационно-экономическое обеспечение эффективности применения информационных систем управления на предприятии: автореф.дис.на соискание ученой степени канд.экон.наук. – Белгород, 2005.

5. Е.Г.Скеленичс. Информационные технологии в экономике и управлении. – М.: ИНФРА-М, 2003.

6. В.Б.Уткин, К.В.Балдин. Информационные системы в экономике. – М.: Финансы и статистика, 2004.

7. М.Ф.Меняев. Информационные технологии управления. Книга 3. Системы управления организацией, 2003.

8. К.П.Пьянзин. Иерархическое хранение данных – Открытые системы: http://222. osp.ru/lan/1999/04/073.htm.

9. И.А.Кадощук, Е.П.Липчинский. Обзор технологий хранилищ данных – Olap.ru: http://www.olap.ru/basic/genstore.asp.

10. Введение в информационные системы управления предприятием: http://www. Kgau.ru/istiki/isu/ch01.html.

11. К.В.Лисянский. Архитектурные решения и моделирование данных для хранилищ и витрин данных – Olap.ru: http://www.olap.ru/basic/diasoftl.asp.

12. Что такое информационная безопасность? //КомпьютерПресс 3'2006 :// http:/ www.cpress.ru/.

13. Р.Уилсон. Планирование стратегии Интернет-маркетинга. – М.: Изд.дом Гребенникова, 2003.

14. В.Б.Веденешкова. Internet – технологии в управлении бизнесом – Банковские технологии: http://www.bizcom.ru/rus/bt/2001/nrl/30.htm.

15. В.А.Левчик. Поиск людей и организаций в Интернете. Поисковые ресурсы в Интернете – Informika: http://www.informika.ru/windows/inftech/internet/search/levchik.html.

16. Е.И.Медведева, С.В.Крошилин. Проблемы маркетинговых исследований: необходимость реформирования законодательства в области персональных данных //сборник статей Реформы экономики – Коломна: КГПИ, 2006.

17. В.М.Похабов. методика оценки эффективности систем управления маркетингом на предприятии //Маркетинг. 2001, № 5, с.102-120.

18. www.osp.ru – Портал открытые системы.


 

А также другие работы, которые могут Вас заинтересовать

34588. БОРЬБА РУССКОГО НАРОДА ПРОТИВ ИНОЗЕМНЫХ ЗАХВАТЧИКОВ (XIII – XV вв.) 21.16 KB
  Кочевые племена монголов были очень многочисленными но родовые порядки обеспечивали участие в войне всех мужчин поголовно. Во время похода монголов в Индию полководцы Джебе и Субэдэй отделились от главной армии и через Закавказье вторглись в Европу где на их пути оказались половцы. Половцы столкнувшись с монголотатарскими войсками обратились к русскому князю Мстиславу Удалому за помощью. После таких широких завоеваний монголотатарскую знать привлекли торговые пути обладание которыми могло приносить большие доходы.
34589. ОСНОВНЫЕ ФАКТОРЫ РОССИЙСКОГО ИСТОРИЧЕСКОГО ПРОЦЕССА 19.56 KB
  Самобытность России во многом определяется ее географическим положением между Европой и Азией – миром модернизации и миром традиционности. Этот фактор накладывает отпечаток на историческое развитие России. В самой России начиная с XVIII в. Главным среди природных факторов был континентальный характер расположения территории России.
34590. МЕСТО РОССИИ СРЕДИ МИРОВЫХ ЦИВИЛИЗАЦИЙ 24 KB
  МЕСТО РОССИИ СРЕДИ МИРОВЫХ ЦИВИЛИЗАЦИЙ Составитель: С. Соответственно и место России во всемирной истории определялось с точки зрения принадлежности ее к одной из общественноэкономических формаций.К какому же типу отнести Россию В какой мере самобытна цивилизация России Ответы на эти вопросы давались историками публицистами общественными деятелями с высоты своего времени с учетом всего предшествующего развития России а также в соответствии со своими идейнополитическими установками. Абсолютное большинство населения России исповедует...
34591. ВОСТОЧНЫЕ СЛАВЯНЕ В ДОФЕОДАЛЬНЫЙ ПЕРИОД 22.91 KB
  ВОСТОЧНЫЕ СЛАВЯНЕ В ДОФЕОДАЛЬНЫЙ ПЕРИОД Составитель: Л. Степанова Появление славян как самостоятельного этноса согласно археологическим материалам произошло еще в первое тысячелетие до н. славяне известны под именем антов и венедов. в источниках появляется имя славяне.
34592. ДРЕВНЕРУССКОЕ ГОСУДАРСТВО: ЗАКОНОМЕРНОСТИ И ОСОБЕННОСТИ ОБРАЗОВАНИЯ, СОЦИАЛЬНЫЙ И ПОЛИТИЧЕСКИЙ СТРОЙ (IX – начало XII вв.) 21.55 KB
  Но произошло это объединение в результате похода князя Олега датируемого летописью 882 годом при активном участии его Руси – варяжской дружины вместе с другими племенами Поильменья. Рассматривая особенности политического устройства Киевской Руси следует выделить такой родоплеменной пережиток как наследование великого княжения по старшинству. Это заставляло всю многочисленную родню Рюриковичей время от времени менять свое пребывание в одном из княжеств и перебираться в другое что не способствовало ни укреплению центральной власти в Киеве...
34593. США во Второй мировой войне 14.25 KB
  Когда УВП не удалось взять под свой контроль добычу и поставки сырья Рузвельт создал сначала управление экономической стабилизации а затем управление военной мобилизации наделенное чуть ли не диктаторскими полномочиями. Комиссия по справедливому найму которую Рузвельт был вынужден создать под угрозой негритянского марша на Вашингтон во главе с Филипом Рэндолфом председателем профсоюза железнодорожных проводников помогла афроамериканцам бороться с дискриминацией в военной промышленности особенно после того как в 1943 Рузвельт наделил...
34594. США в конце XX – начале XXI вв 15.84 KB
  Укрепление политического экономического военного лидерства в мире стало ведущей идеей политики США во второй половине XX начале XXI в. Этому способствовало с одной стороны ключевое положение США в ООН в составе 5 государств членов Совета Безопасности а с другой активное участие в создании НАТО сети других военнополитических блоков. Была развернута сеть военных баз и объектов США в Европе в государствах участниках НАТО на Дальнем Востоке и в бассейне Тихого океана в Латинской Америке и зоне Карибского бассейна на Ближнем...
34595. Соединенное Королевство: географическое положение, рельеф, природные условия, флора и фауна. Символы 40.5 KB
  Официально же она именуется Соединенное Королевство Великобритании и Северной Ирландии. В целом на их долю приходится приблизительно 1 3 площади Великобритании и бoльшая часть Северной Ирландии. В Северной Ирландии змей нет. Символы: Флаг Соединенного Королевства Великобритании и Северной Ирландии или как его принято называть Юнион Джек Union Jck является сочетанием трех крестов святых покровителей Англии прямой красный крест на белом поле крест Св.
34596. Столетняя война 17.15 KB
  Столетняя война наименование длительного военного конфликта между Англией и Францией 13371453 вызванного стремлением Англии вернуть принадлежавшие ей на континенте Нормандию Мен Анжу и др. а также династическими притязаниями английских королей на французский престол. война между Англией и Францией. причины войны: стремление Франции вытеснить Англию с югозапада страны провинция Гиень и ликвидировать этот последний оплот английской власти на франц.