12448

Сжатие информации

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторная работа № Тема: Сжатие информации. Цель. Целью лабораторной работы является получение навыков работы с архиваторами RAR ARJ и ZIP и ознакомление с основными алгоритмами сжатия информации. Методические указания по выполнению лабораторной работы. Арх

Русский

2013-04-27

34.38 KB

16 чел.

Лабораторная работа №

Тема:  Сжатие информации. 

Цель.  Целью лабораторной работы является получение навыков работы с архиваторами RAR, ARJ и ZIP, и ознакомление с основными алгоритмами сжатия информации.

Методические указания по выполнению лабораторной работы.

Архивация данных  - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Архиваторы (утилиты - упаковщики, программы - упаковщики) – программы (комплекс программ), выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. 

При эксплуатации персональных компьютеров по самым различным причинам возможны порча или потеря информации на магнитных дисках. Это может произойти из-за физической порчи магнитного диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерным вирусом и т.д. Для того чтобы уменьшить потери в таких ситуациях, следует иметь архивные копии используемых файлов и систематически обновлять копии изменяемых файлов. Для хранения архивов данных можно использовать внешние запоминающие устройства большой емкости, которые дают возможность легко скопировать жесткий диск (например, магнитооптика, стримеры, "Арвид" и др.)

Однако при этом резервные копии занимают столько же места, сколько занимают исходные файлы, и для копирования нужных файлов может потребоваться много дискет.

Более удобно для создания архивных копий использовать специально разработанные программы архивации файлов, которые сжимают информацию. При архивировании степень сжатия файлов сильно зависит от их формата. Некоторые форматы данных (графические, Page Maker и др.) имеют упакованные разновидности, при этом сжатие производится создающей исходный файл программой, однако лучшие архиваторы способны поджать и их. Совсем другая картина наблюдается при архивации текстовых файлов. Текстовые файлы обычно сжимаются на 50-70%, а программы на 20-30%.

Принцип работы архиваторов основан на поиске в файле "избыточной" информации и последующем ее кодировании с целью получения минимального объема. Самым известным методом архивации файлов является сжатие последовательностей одинаковых символов. Например, внутри вашего файла находятся последовательности байтов, которые часто повторяются. Вместо того чтобы хранить каждый байт, фиксируется количество повторяющихся символов и их позиция. Для наглядности приведем следующий пример:

Упаковываемый файл занимает 15 байт и состоит из следующей последовательности символов: BBBBBLLLLLAAAAA В шестнадцатиричной системе :

42 42 42 42 42 4С 4С 4С 4С 4С 41 41 41 41 41

Архиватор может представить этот файл в следующем шестнадцатиричном виде:

01 05 42 06 05 4С OA 05 41

Эти последовательности можно интерпретировать следующим образом: с первой позиции 5 раз повторяется знак В, с шестой позиции 5 раз повторяется знак L и с позиции 11 5 раз повторяется знак А. Согласитесь, очень простая демонстрация алгоритма архивации. Очевидно, что для хранения файла в его последней форме требуется лишь 9 байт - меньше на 6 байт.

Описанный метод является простым и очень эффективным способом сжатия файлов. Однако он не обеспечивает большой экономии объема, если обрабатываемый текст содержит небольшое количество последовательностей повторяющихся символов.

Существуют два основных способа проведения сжатия:

  1.  статистический
  2.  словарный.

Лучшие статистические методы применяют арифметическое кодирование, лучшие словарные - метод Зива-Лемпела. В статистическом сжатии каждому символу присваивается код, основанный на вероятности его появления в тексте. Высоко вероятные символы получают короткие коды, и наоборот. Такой способ сжатия называют оптимальным префиксным кодом. Для его построения используют алгоритмы Хаффмана или Шеннона-Фано. Например, анализируя любой английский текст, можно установить, что буква Е встречается гораздо чаще, чем Z, а Х и Q относятся к наименее встречающимся. Таким образом, используя специальную таблицу соответствия, можно закодировать каждую букву Е меньшим числом бит, используя более длинный код для более редких букв, тогда как в обычных кодировках любому символу соответствует битовая последовательность фиксированной длины (как правило, кратной байту).

В словарном методе группы последовательных символов или "фраз" заменяются кодом. Замененная фраза может быть найдена в некотором "словаре".

Популярные архиваторы ARJ, RAR работают на основе алгоритма Лемпела-Зива. Сущность алгоритмов Зива и Лемпела состоит в том, что фразы заменяются указателем на то место, где они в тексте уже ранее появлялись. Это семейство алгоритмов обозначается как LZ-сжатие. Такой метод быстро приспосабливается к структуре текста и может кодировать короткие функциональные слова, т.к. они очень часто в нем появляются. Новые слова и фразы могут также формироваться из частей ранее встреченных слов.

Декодирование сжатого текста осуществляется напрямую - происходит простая замена указателя готовой фразой из словаря, на которую тот указывает. На практике LZ-метод добивается хорошего сжатия, его важным свойством является очень быстрая работа декодировщика.

К основным функциям архиваторов относятся:

  1.  архивация указанных файлов или всего текущего каталога;
  2.  извлечение отдельных или всех файлов из архива;
  3.  просмотр содержимого архивного файла;
  4.  проверка целостности архивов;
  5.  восстановление поврежденных архивов;
  6.  ведение многотомных архивов;
  7.  вывод файлов из архива на экран или на печать;
  8.  парольная защита архива.

Ход выполнения работы.

Цель работы

Знакомство с архиватором WinRAR для ОС Windows и приобретение навыков архивирования, извлечения файлов из архивов, добавления файлов в архив

1.  Постановка задачи

1.1.  На диске С: создайте структуру каталогов и файлов, представленную на Рис. 1.
1.2 В папке AUDIT выполните архивирование файла audit_1, используя различные способы сжатия. 
1.3 В папке AUDIT выполните архивирование файла audit_1, создавая самораспаковывающиеся файлы (SFX-файл) с различными способами сжатия.
1.4 В папке ECONOMY выполните архивирование папки MANAGEMENT, размещая архив с именем management.rar в папке DATA.
1.5 Удалите из созданного архива файл ment_1.
1.6 Выполните извлечение файлов из архива management.rar в папку DATA. 
1.7 Добавьте файлы group_1 и rate_29 в архив management.rar. 
1.8 Удалите архив management.rar. 
1.9 Добавьте в архив bas.rar две папки ECONOMY, BAS и файлы group_1, rate_29, поместив архив bas.rar в каталог BAS на диске A:. 
1.10 Создайте непрерывный архив. 
1.11 Протестируйте архив. 
1.12 Просмотрите информацию об архиве. 
1.13 Переименуйте архив. 
1.14 Преобразуйте обычный архив в самораспаковывающийся архив. 
1.15 Удалите архив. 


Рис. 8.1.

Пошаговое выполнение работы

1.1 Включите ПК

Нажмите кнопку Power на системном блоке ПК.

1.2 Создание структуры каталогов и файлов

На диске С: cоздайте любым способом структуру папок и файлов в соответствии с Рис.8.1. В качестве исходных файлов используйте любые файлы с расширение .doc, которые размещены на ПК. 

1.3 Ознакомьтесь с архиватором WinRAR

Запустите архиватор WinRAR из Главного меню и в открывшемся окне ознакомьтесь со строкой меню, панелью инструментами и другими элементами окна архиватора. 

1.4 Создание архивных файлов

В WinRAR выберите каталог AUDIT и выполните архивирование файла audit_1, используя различные способы сжатия. 
Для архивирования выполните следующее: 

  выделите указанный файл;

  в строке инструментов щелкните на пиктограмме Добавить файлы в архив или выполните команду Команды/Добавить файл в архив; 

  в открывшемся окне "Имя и параметры архива" выберите один из методов сжатия в раскрывающемся списке "Методы сжатия"; 

  переключатель "Формат архива" установите в положение RAR;

  в текстовое поле "Имя архива" введите новое имя архивного файла, соответствующее методу сжатия (например, обычный) и щелкните на кнопке ОК;

  повторите вышеуказанные действия, создав шесть архивных файлов с различными методами сжатия и разными именами соответственно;

  сравните размеры исходного файла и созданных архивных файлов с различными методами сжатия. 

1.5 Просмотр содержимого архивных файлов

Для просмотра архивных файлов выполните следующее:

  в окне архиватора WinRAR выделите архивный файл;

  в строке инструментов щелкните на пиктограмме Просмотр или выполните команду "Команды"/"Просмотреть файл". 

1.6 Создание самораспаковывающихся файлов

В каталоге AUDIT создайте группу самораспаковывающихся файлов, повторив пункт 8.4.4.

1.7 Создание архивной папки management.rar

Выполните архивирование папки MANAGEMENT, создав архив с именем management.rar в папке DATA: 

  в архиваторе откройте папку EGONOMY и выделите папку MANAGEMENT;

  в строке инструментов щелкните на пиктограмме Добавить файлы в архив;

  для указания полного имени архивного файла в текстовой строке "Имя архива" воспользуйтесь кнопкой "Обзор". Выберите папку DATA, а имя архивного файла management.rar;

  в окне архиватора перейдите в папку DATA и просмотрите содержимое созданного архивного файла.

1.8 Удаление файла из архива management.rar

Удалите исходный файл ment_1 из созданного архива management.rar. Для удаления указанного файла в окне архиватора откройте архивный файл (дважды щелкните на архивном файле, затем дважды щелкните на открывшейся папке MANAGEMENT), выделите файл ment_1 и щелкните на пиктограмме Удалить на панели инструментов. В результате файл будет удален. 

1.9 Извлечение файла из архива management.rar

Для извлечения файла из архива management.rar, откройте архивный файл, выделите файл ment_2 и щелкните на пиктограмме Извлечь на панели инструментов. В результате файл будет извлечена папка и требуемый файл. Убедитесь в том, что указанный файл извлечен, но не удален из архива. 

1.10 Добавление файлов в архив management.rar

Для добавления файлов group_1, rate_29 в существующий архив management.rar выполните следующее: 

  в окне архиватора откройте корневую папку диска A:;

  выделите указанные файлы, щелкните на пиктограмме Добавить файлы в архив;

  укажите имя файла A:\DATA\management.rar и щелкните на кнопке ОК;

  удалите архив management.rar. 

1.11 Создание архивного файла bas.rar

Для добавления в архив bas.rar двух папок ECONOMY, BAS и файлов group_1, rate_29, и размещения архива bas.rar в каталоге BAS на диске A: выполните следующее: 

  в окне архиватора откройте корневую папку диска A:;

  выделите указанные папки и файлы, щелкните на пиктограмме Добавить файлы в архив;

  укажите имя файла A:\BAS\bas.rar и щелкните на кнопке ОК.

1.12 Создание непрерывного архива

Для создания непрерывного архива повторите пункт 8.4.11 с дополнением пункта "Создать непрерывный архив" в разделе "Параметры архивации".

1.13 Выполнение некоторых операций над выделенным архивным файлом

1.3.1 Протестируйте архив, выполнив команду "Команды\Протестировать файлы в архиве". 
1.3.2 Просмотрите информацию об архиве, выполнив команду "Операции\Показать информацию". 
1.3.3 Преобразуйте обычный архив в самораспаковывающийся. Для выполнения преобразования выберите команду 
"Операции\Преоразовать архив(ы) в SFX".
1.3.4 Переименуйте архив с помощью команды "Команды\Переименовать файл".
1.3.5 Удалите архив, применив команду "Команды\Удалить файл".

1.4 Завершение работы

Сообщите преподавателю о выполненной работе. После разрешения на завершение работы удалите архив и можете приступить к сдаче тестов по выполненной работе. 

Контрольные вопросы.

  1.  Зачем нужно архивировать информацию?
  2.  На чем основана работа архиваторов. По какому принципу они сжимают информацию.
  3.  Каковы функции архиваторов.
  4.  Чем отличаются SFX – архивы.


 

А также другие работы, которые могут Вас заинтересовать

1046. Картирование рудных полей и месторождений 446.5 KB
  Формационная принадлежность околорудных и предрудных метасоматитов. Взаимосвязь между магнитной восприимчивостью вмещающих пород и характером их метасоматического изменения. Критерии обнаружения богатых рудных столбов в пределах сульфидно-кварцевых жил изучаемой площади.
1048. Определение расхода воздуха и изобарно-изотермического потенциала для системы каменный уголь – карбонат магния 422.5 KB
  Определение расхода воздуха и объема продуктов сгорания. Построение графика зависимости T=f(∆G). Определение изобарно-изотермического потенциала (энергии Гиббса).
1049. Земледелие Западной Сибири 500 KB
  Гумус и плодородие почвы. Приемы защиты почвы от эрозии в системе земледелия Западной Сибири. Приемы накопление, сохранения и рационального использования влаги в земледелия региона. Особенности и характеристика основных звеньев системы земледелия для степной зоны Западной Сибири. Технология возделывания овса в подтаежной зоне Западной Сибири с учётом биоло-гических особенностей культуры и природно-климатических условий зоны. Технологическая схема производства подсолнечного масла.
1050. Организация литейного производства на ОАО МК ОРМЕТО ЮУМЗ 347 KB
  Расстановка рабочей силы по рабочим местам, распределение работ, обеспечение рабочих мест. Факторы, влияющие на выбор способа изготовления отливки. Расчет количества подъёмно-транспортного оборудования. Охлаждение отливок. Выбивка отливок из формы. Используемое оборудование.
1051. Методические указания по определению экономической эффективности научно-исследовательских работ и новой техники 458 KB
  Метод оценки эффективности инвестиций исходя из сроков их окупаемости. Метод сравнительной эффективности приведенных затрат. Расчет ожидаемого годового экономического эффекта на основании анализа использования рабочего времени укладчиц и контролеров готовой продукции на хлебозаводе.
1052. Разработка проекта производства электромонтажных работ 228.5 KB
  Прием строительной части объекта под монтаж электрооборудования. Технологическая карта монтажа кабельной линии в траншее. Технологическая карта монтажа светильников. Технологическая карта монтажа распределительных шкафов. Кабельный журнал. Ведомость на механизмы, инструменты и приспособления.
1053. Финансовое состояние деятельности Харьковского государственного авиационного предприятия 361 KB
  Общая характеристика предприятия и продукции, которая производится. Взаимодействие предприятия с внешними контрагентами. Анализ производства и реализации продукции. Анализ использования основных производственных фондов. Оценка финансовой устойчивости предприятия.
1054. Специфика работы по развитию графических умений в процессе обучения старших дошкольников изобразительной деятельности 389 KB
  Организация деятельности по формированию графических умений у детей старшего дошкольного возраста. Анализ собственной практической деятельности по формированию у старших дошкольников графических умений и навыков. Методы диагностики по формированию технических навыков и умений у детей старшего дошкольного возраста на контрольном этапе. Графические материалы и техника их использования.