11333

Системные утилиты

Лекция

Информатика, кибернетика и программирование

Лекция 10. Системные утилиты Системные утилиты предоставляют пользователю средства для обслуживания компьютера и его ПО. Они обеспечивают выполнение следующих действий: обслуживание магнитных дисков; обслуживание файлов и каталогов; архивация файлов;

Русский

2013-04-07

108.5 KB

8 чел.

Лекция 10.

Системные утилиты

Системные утилиты предоставляют пользователю средства для обслуживания компьютера и его ПО. Они обеспечивают выполнение следующих действий:

  1.  обслуживание магнитных дисков;
  2.  обслуживание файлов и каталогов;
  3.  архивация файлов;
  4.  защита от компьютерных вирусов.

Обслуживание МД

Основными операциями по обслуживанию дисков являются следующие:

-  устранение дефектов на дисках;

- оптимизация размещения информации на дисках с целью ускорения доступа к данным;

- чистка М.Д. от ненужной информации для высвобождения дискового пространства, а, следовательно,  ускорения доступа к информации.

Проверка целостности дисков

В процессе эксплуатации магнитных дисков неизбежны разного рода повреждения, которые ведут к появлению разного рода дефектов. Дефекты подразделяются на логические и физические.

Логические дефекты связаны с повреждением системных файлов или файловой системы. Ошибки  в файловой системе включают

  •  пересечение файлов, когда двум файлам распределен один и тот же кластер, в результате чего оба файла становятся испорченными.
  •  порча имен файлов, в результате чего имена файлов становятся недостоверными, а это делает невозможным открытие таких файлов.
  •  потерянные кластеры, которые отмечены в каталоге как занятые, но не относятся ни к одному файлу на диске. Обычно это фрагменты временных удаленных файлов или сегменты файлов, которые были случайно повреждены. В последнем случае такие файлы целесообразно восстановить, чтобы не потерять содержавшуюся в них информацию.

Физические повреждения возникают из-за механического повреждения или старения диска, что ведет к появлению дефектных секторов. Кластер, который содержит дефектные сектора, также считается дефектным. Физические дефекты могут привести к невозможности доступа к элементам файловой системы или ко всему диску.

Для поиска и исправления ошибок на дисках используется специальная утилита, которая называется сканер-корректор (ScanDisk). Она выполняет следующие функции:

  1.  Сканирование дисков для обнаружения логических и физических дефектов. При сканировании утилита пытается прочитать каждый кластер на диске, а потом выполнить запись информации в тот же кластер. Если это не удается, то кластер будет отмечен как неисправный (bad), и, если это возможно, то информация из этого кластер будет записана в другой кластер.
  2.  Устранение логических  и физических дефектов. Для устранения физических дефектов информация из плохих кластеров переписывается в другое место. Логические дефекты:
    •  - пересечение файлов: файлы переразмещаются, при этом общий кластер копируется в оба файла;
    •  - потерянные кластеры:  могут преобразовываться в файлы или объявляться свободными.

Дефрагментация файлов.

Первоначально каждый файл система старается сохранить в последовательных кластерах, что позволяет головкам диска считывать весь файл за один проход. Но через некоторое время файлы могут быть отредактированы, удалены, добавлены новые файлы. Когда на диск должен быть записан новый файл, система просматривает дисковод в поисках первого свободного кластера, затем следующего и т. д.  В итоге кластеры одного файла могут оказаться разбросанными по всему пространству диска в случайном порядке. Чтобы прочесть каждый файл головки дисковода должны выполнять  все больше и больше проходов, на что требуется все больше времени. Это называется фрагментацией файлов. Она приводит к следующим негативным последствиям:

  1.  повышается вероятность разрушения целостности файла (например, при искажении ссылки на кластер);
  2.  затрудняется восстановление файла после случайного удаления;
  3.  Снижается производительность ПК;
  4.  Ускоряется износ дисковода.

Дополнительный эффект дефрагментации проявляется еще и повышении безопасности хранения данных, т. к. нефрагментированные файлы легче восстанавливать.

Архивация файлов

Несмотря на то, что объем внешней памяти ПК все время увеличивается, необходимость в архивации файлов не уменьшается. Причины этого следующие :

  1.  Современные документы включают в себя рисунки, диаграммы, форматированный текст и не помещаются на 1-2 дискеты.
  2.  При передаче информации файлы также необходимо сжимать, т. к. передача по модемным линиям связи дорогая.
  3.  Необходимо делать резервные копии информации. При этом возникает проблема, что нужно хранить в резервных копиях. Проще всего сохранять все, но при этом быстро исчерпывается свободное место.

Алгоритмы сжатия

Несмотря на изобилие алгоритмов сжатия данных, теоретически есть только три способа уменьшения их избыточности. Это либо изменение содержания данных, либо изменение их структуры, либо и то и другое вместе.

Если при сжатии данных происходит изменение их содержания, метод сжатия необратим и при восстановлении данных из сжатого файла не происходит полного восстановления исходной последовательности.

Сжатие с потерей информации означает, что после распаковки архива будет получен документ, который отличается от исходного. Чем больше степень сжатия, тем больше величина потери и наоборот.

Такие методы применимы только для тех типов данных, для которых формальная утрата части содержания не приводит к значительному снижению потребительских свойств. В первую очередь, это относится к мультимедийным данным: видеорядам, музыкальным записям, звукозаписям и рисункам. Методы сжатия с потерей информации обычно обеспечивают гораздо более высокую степень сжатия, чем обратимые методы, но их нельзя применять к текстовым документам, базам данных и, тем более, к программному коду. Характерными форматами сжатия с потерей информации являются:

  •  JPG для графических данных;
  •  MPG для видеоданных;
  •  М РЗ для звуковых данных.

Потеря информации при сжатии таких файлов воспринимается как некоторый шум (в мультимедийных файлах). Выигрыш получается значительный: в музыке в 10-15 раз, в фото и видеоматериалах – в 20-30 раз.

Если при сжатии данных происходит только изменение их структуры, то метод  сжатия обратим. Из результирующего кода можно восстановить исходный массив I путем применения обратного метода. Обратимые методы применяют для сжатия  любых типов данных. Характерными форматами сжатия без потери информации  являются:

  •  .GIF, .TIF, .PCX и многие другие для графических данных;
  •  .AVI для видеоданных;
  •  .ZIP, .ARJ, .RAR, .LZH, .LH, .CAB и многие другие для любых типов данных.

Сжатие без потери информации применяют при передаче текстовых документов и программ. Эти методы основаны на устранении избыточности информации. Существует достаточно много обратимых методов сжатия данных, однако в их основе лежит сравнительно небольшое количество теоретических алгоритмов.

1. Примером избыточности является наличие повторяющихся фрагментов. В текстах это встречается достаточно редко, но в таблицах и графике – это обычное дело. Если, например, число 0 повторяется 20 раз, то нет смысла тратить на это число 20 байтов. Вместо этого можно записать 20,0. Алгоритмы, основанные на выявлении повторов называют методами RLE (Run Length Encoding ).

Алгоритм RLE

В основу алгоритмов RLE положен принцип выявления повторяющихся последовательностей данных и замены их простой структурой, в которой указывается код данных и коэффициент повтора.

Например, для последовательности: 0; 0; 0; 127; 127; 0; 255; 255; 255; 255 (всего 10 байтов) образуется следующий вектор:

0 – 3

127 – 2

0 – 1

255 – 4

при записи в строку он имеет вид:

0; 3; 127; 2; 0; 1; 255; 4 (всего 8 байтов),

В данном примере коэффициент сжатия равен 8/10 (80 %).

Программные реализации алгоритмов RLE отличаются простотой, высокой ско-1стью работы, но в среднем обеспечивают недостаточное сжатие. Наилучшими объектами для данного алгоритма являются графические файлы, в которых большие одноцветные участки изображения кодируются длинными последовательностями одинаковых байтов. Этот метод также может давать заметный выигрыш на некоторых типах файлов баз данных, имеющих таблицы с фиксированной длиной полей. Для текстовых данных методы RLE, как правило, неэффективны.

2-ой пример избыточности: для кодирования любого символа отводится  одинаковое количество битов. Но наиболее часто используемые символы имеет смысл кодировать меньшим количеством знаков, а те, которые используются редко – большим. Программы, которые выполняют сжатие могут вводить свою кодировку – разную для разных файлов и приписывать к сжатому файлу словарь (специальную таблицу из которой распаковывающая программа узнает как в данном файле закодированы те или иные символы или их группы). Такие алгоритмы называются алгоритмами Хаффмана.

В основе этого алгоритма лежит кодирование не байтами, а битовыми группами.

Перед началом кодирования производится частотный анализ кода документа
и выявляется частота повтора каждого из встречающихся символов.

Чем чаще встречается тот или иной символ, тем меньшим количеством битов
он кодируется (соответственно, чем реже встречается символ, тем длиннее его
кодовая битовая последовательность).

Образующаяся в результате кодирования иерархическая структура прикладывается к сжатому документу в качестве таблицы соответствия.

Пример кодирования символов русского алфавита представлен на рис. 14.1.

Как видно из схемы, представленной на рис. 14.1, используя 16 бит, можно закодировать до 256 различных символов. Однако ничто не мешает использовать и последовательности длиной до 20 бит — тогда можно закодировать до 1024 лексических единиц (это могут быть не символы, а группы символов, слоги и даже слова).

В связи с тем, что к сжатому архиву необходимо прикладывать таблицу соответствия, на файлах малых размеров алгоритм Хаффмана малоэффективен. Практика также показывает, что его эффективность зависит и от заданной предельной длины кода (размера словаря). В среднем, наиболее эффективными оказываются архивы с размером словаря от 512 до1024 единиц (длина кода до 18-20 бит).

Алгоритм KWE

Основу алгоритмов кодирования по ключевым словам (Keyword Encoding) положено кодирование лексических единиц исходного документа группами байтов фиксированной длины. Примером лексической единицы может служить слово (последовательность символов, справа и слева ограниченная пробелами или символами конца абзаца). Результат кодирования сводится в таблицу, которая прикладывается к результирующему коду и представляет собой словарь. Обычно для аглоязычных текстов принято использовать двухбайтную кодировку слов. Образующиеся при этом пары байтов называют токенами.

Эффективность данного метода существенно зависит от длины документа, поскольку из-за необходимости прикладывать к архиву словарь длина кратких документов не только не уменьшается, но даже возрастает.

Данный алгоритм наиболее эффективен для англоязычных текстовых документов и файлов баз данных. Для русскоязычных документов, отличающихся увеличенной длиной слов и большим количеством приставок, суффиксов и окончаний, не всегда удается ограничиться двухбайтными токенами, и эффективность метода заметно снижается.

Рассмотренные выше алгоритмы в «чистом виде» на практике не применяют из-за того, что эффективность каждого из них сильно зависит от начальных условий. В связи с этим, современные средства архивации данных используют более сложные алгоритмы, основанные на комбинации нескольких теоретических методов. Общим принципом в работе таких «синтетических» алгоритмов является предварительный просмотр и анализ исходных данных для индивидуальной настройки алгоритма на особенности обрабатываемого материала.

Основные понятия архивации

Архив – это файл, содержащий один или боле файлов в сжатом или несжатом виде, а также информацию, описывающую эти файлы (словарь архива): имена файлов, их атрибуты и контрольные данные. Имена архивных файлов имеют определенное расширение, в зависимости от того, какой программой-архиватором они были созданы.

Сжатие – процесс и метод кодирования информации для перевода в состояние, имеющее меньше пространства для хранения.

Степень сжатия – коэффициент сжатия, сообщаемый программой для того или иного сжатого файла. В большинстве программ (arj, rar) . В zip файлах .

CRC – код циклического контроля, это специальный математический метод вычисления контрольной информации для проверки правильности данных в архиве.

SFX – самораспаковывающийся архивный файл. Кроме сжатых данных он содержит программу для самостоятельной распаковки архивной информации. Реализуется как exe файл.

Монолитный (solid) архив – создается с помощью специального метода сжатия, при котором все файлы перед сжатием представляются в виде одного непрерывного потока данных. Преимущества этого метода видны при сжатии большого количества однородных файлов небольшого размера.  При этом увеличивается время упаковки.

Том – часть архива, записанного на нескольких магнитных дисках (многотомный архив).

Программные средства сжатия данных

Существует несколько десятков различных форматов упаковки. Классическими» форматами сжатия данных, широко используемыми в повседневной работе с компьютером, являются форматы .ZIP, .RAR и .ARJ.

Формат .ZIP. Это один из наиболее древних форматов, которому более десяти лет. Во времена MS-DOS для работы с этим форматом использовались две программы: PKZIP.EXE для упаковки файлов и PKUNZIP.EXE для их распаковки. Сегодня и ту, и другую функцию выполняет одна программа — WinZip. Из названия видно, что она рассчитана на работу в операционной системе Windows 9x. Несмотря на свою «древность», этот формат сегодня используется чрезвычайно широко. Это связано с тем, что это основной формат в котором поставляются программы и драйверы из Интернета.

Формат .ARJ. По-видимому, это самый популярный формат первой половины 90-х годов. И упаковка, и распаковка производятся одной программой ARJ.EXE. По степени сжатия ощутимо превосходит формат .ZIP, но с появлением Windows  этот формат заметно отступил на второй план, это связано с тем, что версия ARJ.EXE, способная корректно обращаться с «длинными» именами файлов, появилась только в 1997 г.

Формат .RAR. Формат, весьма популярный и в России, и в мире, особенно среди молодого поколения. У программы WinRAR российский автор — Евгений Рошаль. По потребительским свойствам она объективно превосходит зарубежные аналоги. В международном секторе Интернета этот формат используют профессионалы, а в России он давно является потребительским. Поскольку архиватор WinRAR позволяет работать также с архивами в форматах .ZIP, .ARJ и некоторых других, он в общем-то удовлетворяет большинство потребностей пользователя в средствах сжатия и разуплотнения информации.

.

Базовые требования к диспетчерам архивов

Современные программные средства для создания и обслуживания архивов отличаются большим объемом функциональных возможностей, многие из которых выходят далеко за рамки простого сжатия данных и эффективно дополняют стандартные средства операционной системы. В этом смысле современные средства архивации данных называют диспетчерами архивов.

К базовым функциям, которые выполняют большинство современных диспетчеров архивов, относятся:

извлечение файлов из архивов;

создание новых архивов;

добавление файлов в имеющийся архив;

создание самораспаковывающихся архивов;

создание распределенных архивов на носителях малой емкости;

тестирование целостности структуры архивов;

полное или частичное восстановление поврежденных архивов;

защита архивов от просмотра и несанкционированной модификации.

Самораспаковывающиеся архивы. В тех случаях, когда архивация производится для передачи документа потребителю, следует предусмотреть наличие у него программного средства, необходимого для извлечения исходных данных из уплотненного архива. Если таких средств у потребителя нет или нет оснований предполагать их наличие, создают самораспаковывающиеся архивы. Самораспаковывающийся архив готовится на базе обычного архива путем присоединения к нему небольшого программного модуля. Сам архив получает расширение имени .ЕХЕ, характерное для исполнимых файлов. Потребитель сможет выполнить его запуск как программы, после чего распаковка архива произойдет на его компьютере автоматически.

Распределенные архивы. В тех случаях, когда предполагается передача большого архива на носителях малой емкости, например на гибких дисках, возможно распределение одного архива в виде малых фрагментов на нескольких носителях.

Некоторые диспетчеры (например WinZip) выполняют разбиение сразу на гибкие диски, а некоторые (например WinRAR и WinArj) позволяют выполнить предварительное разбиение архива на фрагменты заданного размера на жестком диске. Впоследствии их можно перенести на внешние носители путем копирования.

При создании распределенных архивов диспетчер WinZip обладает неприятной особенностью: каждый том несет файлы с одинаковыми именами. В результате этого нет возможности установить номера томов, хранящихся на каждом из гибких дисков, по названию файла. Поэтому каждый диск следует маркировать пометками на наклейке, а при создании распределенного архива следует аккуратно перекладывать дискеты из начальной стопки в конечную, чтобы не перепутать последовательность немаркированных томов.

Диспетчеры архивов WinArj и WinRAR маркируют все файлы распределенного архива разными именами и потому не создают подобных проблем.

Гибкие диски являются крайне ненадежными носителями, поэтому архивы, сформированные на жестком диске, должны храниться до получения подтверждения от потребителя о том, что распределенный архив поступил к нему в неповрежденном виде и прошел распаковку. Правилом «хорошего тона» считается создание двух  копий при передаче материалов на гибких дисках.

Защита архивов. В большинстве случаев защиту архивов выполняют с помощью пароля, который запрашивается при попытке просмотреть, распаковать или изменить архив. Теоретически, защита с помощью пароля считается неудовлетворительной и не рекомендуется для особо важной информации. В то же время необходимо отметить, что основные программные средства, используемые для восстановления утраченного пароля (или взлома закрытой информации, что, по сути, то же самое), используют методы прямого перебора. Работу этих средств можно существенно  затруднить и замедлить, если расширить область перебора. Пароли на базе символов английского алфавита и цифр действительно снимаются очень быстро. Однако  даже незначительное увеличение числа используемых символов за счет знаков  препинания многократно увеличивает криптостойкость защиты, а использование также символов русского алфавита еще более усложняет попытки снять пароль путем перебора.

Дополнительные требования к диспетчерам архивов

К дополнительным функциям диспетчеров архивов относятся сервисные функции, делающие работу более удобной. Они часто реализуются внешним подключением дополнительных служебных программ и обеспечивают:

просмотр файлов различных форматов без извлечения их из архива;

поиск файлов и данных внутри архивов;

установку программ из архивов без предварительной распаковки;

проверку отсутствия компьютерных вирусов в архиве до его распаковки;

криптографическую защиту архивной информации;

декодирование сообщений электронной почты;

создание самораспаковывающихся многотомных архивов;

выбор или настройку коэффициента сжатия информации.


 

А также другие работы, которые могут Вас заинтересовать

10308. Фихте Иоганн немецкий философ и общественный деятель 14.79 KB
  Фихте Иоганн немецкий философ и общественный деятель представитель нем. классического идеализма. Родился в крестьянской семье. Учился в университете Лейпцига. Под влиянием событий Великой французской революции Ф. написал работу посвященную защите свободы мысли. Вслед
10309. Фридрих Шеллинг 11.72 KB
  Фридрих Шеллинг оказался своеобразным связывающим звеном между философией Канта идеями Фихте. В центре его философских размышлений оказывается задача построить единую систему познания истины в частных областях. Все это реализуется в его âнатурфилософииâ. Основн...
10310. Формування стратегії розвитку туристичної дестинації «Подільські Товтри» 2.55 MB
  Розкити сутність понять «дестинація», «екологічна дестинація», «стратегія»; Визначити теоретичні основи формування стратегії розвитку туристичної дестинації; Сформулювати систему оціночних показників для визначення привабливості дестинації; Здійснити комплексний аналіз туристичного потенціалу дестинації «Подільські Товтри»; Визначити передумови для створення стратегії розвитку дестинації «Подільські Товтри»...
10311. Эпоха эллинизма 12.39 KB
  Эллинизм охватывающий период от завоеваний Александра Македонского до падения западной Римской Империи характеризует собой последующую античную философию. Сохранив многое из античной классики Эллинизм по существу завершил ее. Исходные принципы заложенные великими ...
10312. Давид Юм - философ английского Просвещения 15.5 KB
  Давид Юм философ английского Просвещения критиковал религиозный и философский догматизм который заложился в сознании людей. Он был философомскептиком антирационалистом. Юм известен своей мыслью о том что не существует объективной причинной связи вещей.Когда мы на
10313. Язык и мышление, их взаимосвязь 42.75 KB
  Язык и мышление Язык главная из знаковых систем человека важнейшее средство человеческого общения способ осуществления мышления. Человек единственной существо моделирующее внешний мир при помощи знаковых систем. В любом человеческом сообществе люди реагиру...
10314. Функции культуры 26 KB
  Функции культуры Основная человекотворческая Человек живет не в природе а в культуре. В ней он сам себя познает. Здесь есть и моменты миропонимания формирования воспитания и социологизации человека. Иначе она еще называется преобразующей функцией поскольку освое
10315. Категории диалектики. Законы диалектики 30 KB
  Категории диалектики общие понятия отражающие наиболее существенные закономерные связи и отношения реальности. Можно сказать что философские категории воспроизводят свойства и отношения бытия в максимально общем виде. Регулируя реальный процесс мышлени они в ходе е
10316. Общество - это продукт совметной историчсекой деятельности дюдей 18.99 KB
  Общество это продукт совместной исторической деятельности людей совокупность общественных связей отношений и компонентов особый тип надындивидуальной и надприродной системной организации. Общество представляет собой специфическую систему включающую множество э...