19421

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста

Реферат

Информатика, кибернетика и программирование

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста. Вся информация которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято н...

Русский

2013-07-12

59.63 KB

14 чел.

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста.

Вся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

0 – отсутствие электрического сигнала;

1 – наличие электрического сигнала.

Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.

Вам приходится постоянно сталкиваться с устройством, которое может находится только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

Представление(кодирование) чисел

Для записи информации о количестве объектов используются числа. Числа записываются с помощью набора специальных символов.

Система счисления — способ записи чисел с помощью набора специальных знаков, называемых цифрами.

Системы счисления подразделяются на позиционные и непозиционные.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции).

В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе.

Непозиционные системы счисления.

Каноническим примером фактически непозиционной системы счисления является римская, в которой в качестве цифр используются латинские буквы: I обозначает 1, V - 5, X - 10, L - 50, C - 100, D - 500, M -1000. Натуральные числа записываются при помощи повторения этих цифр. При этом, если большая цифра стоит перед меньшей, то они складываются (принцип сложения), если же меньшая — перед большей, то меньшая вычитается из большей (принцип вычитания). Последнее правило применяется только во избежание четырёхкратного повторения одной и той же цифры.

Например, II = 1 + 1 = 2, здесь символ I обозначает 1 независимо от места в числе.

Для правильной записи больших чисел римскими цифрами необходимо сначала записать число тысяч, затем сотен, затем десятков и, наконец, единиц.

Пример: число 1988. Одна тысяча M, девять сотен CM, восемьдесят LXXX, восемь VIII. Запишем их вместе: MCMLXXXVIII.

MCMXCVIII = 1000+(1000-100)+(100-10)+5+1+1+1 = 1998

Позиционные системы счисления.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции). Количество используемых цифр называется основанием системы счисления.

Самой первой такой системой, когда счетным "прибором" служили пальцы рук, была пятеричная.

Следующей после пятеричной возникла двенадцатеричная система счисления. Возникла она в древнем Шумере. Некоторые учёные полагают, что такая система возникала у них из подсчёта фаланг на руке большим пальцем. Широкое распространение получила двенадцатеричная система счисления в XIX веке.

Следующая позиционная система счисления была придумана еще в Древнем Вавилоне, причем вавилонская нумерация была шестидесятеричная, т.е. в ней использовалось шестьдесят цифр! В более позднее время использовалась арабами, а также древними и средневековыми астрономами. Шестидесятеричная система счисления, как считают исследователи, являет собой синтез уже вышеупомянутых пятеричной и двенадцатеричной систем.

В настоящее время наиболее распространены десятичная, двоичная, восьмеричная и шестнадцатеричная системы счисления. Двоичная, восьмеричная (в настоящее время вытесняется шестнадцатеричной) и шестнадцатеричная система часто используется в областях, связанных с цифровыми устройствами, программировании и вообще компьютерной документации. Современные компьютерные системы оперируют информацией представленной в цифровой форме. Числовые данные преобразуются в двоичную систему счисления.

Система счисления

Основание

Алфавит цифр

Десятичная

10

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Двоичная

2

0, 1

Восьмеричная

8

0, 1, 2, 3, 4, 5, 6, 7

Шестнадцатеричная

16

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Десятичная система счисления — позиционная система счисления по основанию 10. Предполагается, что основание 10 связано с количеством пальцев рук у человека. Наиболее распространённая система счисления в мире. Для записи чисел используются символы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, называемые арабскими цифрами.

Двоичная система счисления — позиционная система счисления с основанием 2. Используются цифры 0 и 1. Двоичная система используется в цифровых устройствах, поскольку является наиболее простой и удовлетворяет требованиям:

  1.  Чем меньше значений существует в системе, тем проще изготовить отдельные элементы.
  2.  Чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать.
  3.  Простота создания таблиц сложения и умножения — основных действий над числами

Укажем соответствие десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления в таблице.

p=10

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

p=2

0

1

10

11

100

101

110

111

1000

1001

1010

1011

1100

1101

1110

1111

10000

p=8

0

1

2

3

4

5

6

7

10

11

12

13

14

15

16

17

20

p=16

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

10

При одновременной работе с несколькими системами счисления для их различения основание системы обычно указывается в виде нижнего индекса, который записывается в десятичной системе:

12310 — это число 123 в десятичной системе счисления;

11110112 — то же число, но в двоичной системе.

Двоичное число 1111011 можно расписать в виде: 11110112 = 1*26 + 1*25 + 1*24 + 1*23 + 0*22 + 1*21 + 1*20.

Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используются не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.

Перевод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке.

Переведем десятичное число 2010 в двоичную систем счисления (основание системы счисления p=2). В итоге получили 2010 = 101002.


Двоичное кодирование текстовой информации 

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28 = 256)

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена.

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).

В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

Таблица стандартной части ASCII

Таблица расширенного кода ASCII (один из вариантов)

Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.

В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит страница содержит 40x60=2400 байт информации. Объем всей информации в книге: 2400 х 150 = 360 000 байт.

Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Возьмем число 57.

При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 00110101 00110111.

При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.


 

А также другие работы, которые могут Вас заинтересовать

34440. Новая экономическая политика: мероприятия и итоги 35 KB
  Оценки сущности и значения нэпа. началось восстание моряков в Кронштадте Основным содержанием нэпа стало широкое использование рыночных отношений. Итоги нэпа: Быстро восстанавливался довоенный уровень промышленности и сельского хозяйства был ликвидирован транспортный кризис Развивалась частная инициатива появился слой предпринимателей нэпманов Стабилизировалась финансовая система Полки магазинов заполнились товарами Выросла безработица уровень жизни большинства народа оставался низким Противоречивость нэпа: в экономике:...
34441. Образование СССР: причины и принципы создания союза 34 KB
  После гражданской войны на месте бывшей Российской империи появились новые государства: Финляндия Польша Латвия Стали независимыми государствами с буржуазными правительствами Литва Эстония Россия Украина Стали Советскими республиками Белоруссия Закавказская Федерация Бухарская республика Хорезмская республика Дальневосточная республика Предпосылки образования СССР: Экономическая взаимозависимость республик которые раньше существовали в рамках одного государства Необходимость противостоять общим врагам Все...
34442. Строительство социализма в СССР в 1920 – 1930-е гг.: становление тоталитарного режима, проведение индустриализации и коллективизации, культурная революция 42.5 KB
  В середине 20х годов перед советским государством встала задача модернизации экономики и превращения СССР из аграрноиндустриальной страны в индустриальную. СССР мог производить любой вид промышленной продукции Индустриализация тяжело отразилась на положении крестьян. С одной стороны был сделан гигантский скачок в развитии страны СССР вышел на 2 место в мире по производству промышленной продукции.
34443. Великая Отечественная война 1941 – 1945 гг.: основные этапы, события и итоги. Источники и значение победы 43 KB
  Этапы войны: 22 июня 1941 г. Причины неудач Красной Армии в первые месяцы войны: Неожиданность нападения Германии войска не были приведены в полную боевую готовность; Не было завершено перевооружение Красной Армии новую технику не успели освоить. В начале войны многие части не имели связи со своими штабами что затрудняло получение сведений о враге и приводило к окружению и плену. Центральным событием начального этапа войны стала битва за Москву 30 сентября 56 декабря 1941 г.
34444. Развитие СССР в 1953 – 1964 гг. Десятилетие реформаторского порыва 33.5 KB
  На ХХ съезде партии Хрущев осудил культ личности Сталина. Не допускалась критика партии и социализма. была принята новая программа партии которая ставила задачу построения коммунизма за 20 лет. Первым секретарем партии стал Л.
34445. СССР в середине 1960-середине 1980-х гг.: основные тенденции и противоречия социально-экономического развития 34.5 KB
  СССР в середине 1960середине 1980х гг. В новой Конституции СССР принятой в 1977 г. Под руководством председателя Совета министров СССР А. Результатом стало все большее отставание СССР от стран Запада.
34446. Перестройка в СССР: попытки реформирования экономики и обновления политической системы 39.5 KB
  Политические и социальноэкономические преобразования в СССР в период правления Горбачева получили название перестройка. Сократились доходы СССР от внешней торговли в связи с падением мировых цен на нефть и газ. была отменена 6ая статья конституции СССР о руководящей роли КПСС Был введен пост Президента СССР им стал М.
34447. История как наука. Исторические источники и вспомогательные исторические дисциплины 33.5 KB
  Сама наука сложилась намного позднее. Историческая наука оперирует точно установленными фактами которые извлекаются из источников. Геральдика наука о гербах.
34448. ВОСТОЧНЫЕ СЛАВЯНЕ В ДРЕВНОСТИ 32 KB
  ВОСТОЧНЫЕ СЛАВЯНЕ В ДРЕВНОСТИ. Предки славян стали выделяться из племен индоевропейцев во II тыс. Прародиной славян считается Центральная Европа в верховьях рек Вислы Одера и Дуная. Натиск кочевников оттеснил славянские племена на северовосток и в VI веке они заселили территорию восточной Европы смешиваясь с балтами и финноугами.